分享

【数据分析】数据化决策之统计学基础

 虎牙变大猫 2019-11-02

本文是《数据化决策-数据分析与高效运营》的部分书摘。

内容主要包括企业经营管理的核心数据指标、统计学基本概念、概率分布及回归分析,以及相关的回归检验。

第一部分:企业经营的核心指标

1、财务层面

总资产利润率=营业利润/总资产 * 100%

数值越大越好。总资产利润率也称ROA,是反映企业经营状况的一个极其重要的指标。

总资产周转率=营业额/ 总资产

数值越小越好,企业用最小的资本实现最大的营业额才能提高周转率。

营业利润率=营业利润/营业收入

要提高营业利润,需提成营业额和压缩销售管理费用。

销售管理费用率=销售管理费用/营业收入

流动比率=流动资产/流动负债 *100%

现金等流动资产和借款等流动负载的比例关系。这项数据反映企业的稳定性(短期支付能力)的重要指标,一般以200%为宜

2、客户层面

市场占有率

反映组织市场地位的重要指标。

独占市场份额73.9%,相对稳定份额41.7%,顶端份额26.1%,并列的上位份额 19.3%,市的影响份额10.9%,竞争存在份额 6.8%,市场桥头堡份额2.8%等。

客户满意度

反映客户对企业产品或服务满意程度的指标。

客户忠诚度

指客户对企业的忠诚心。核量客户忠诚度常用RFM模型及客户俱乐部加入率等指标。

R:最近一次购买的时间,F 购买频次  M 购买的总金额。

3、内部流程层面

存货周转率=营业收入/存货余额

反映库存资产周转率的指标。这些资产的在库周期越短,周转率越高,进而有助于总资产周转率、总资产利润率的提升。

员工人均收入=营业收入/ 员工人数

退货率

退货数量占销售产品数量的比例。退货率是反映产品质量的重要指标。

生产周期

产品或服务从投产到产出的时间。在提升产品品质的同时缩短产品的生产周期是内部管理的永恒课题。

4、学习与成长

员工满意度

要提升客户满意度,就必须提升员工满意度。不过要评定员工满意度没有具体的指标,一般借活动参与率,加班率及加班时间等指标。

员工维持率

员工维持率是指员工平均多长时间会离开公司。一般来讲,员工维持率跟员工满意度有着密不可分的关系。

教育/培训时间

该指标反映公司在提升员工能力中投入的时间跟精力。虽然时间并不是越长越好,但必要的程度还是要的。

资格获得率

指员工获得自己相关工作的资格证书占比。

KPI导向的数据分析思路

1、影响KPI的主要因素

2、分析工作的规划

3、收集和分析数据

4、研究改善KPI的措施

5、提交可行性改善方案

6、将可行性方案落地执行

7、KPI改善效果确认。

第二部分:统计学的基本概念

平均数:反映数据组(集体)特征的一个指标。

算数平均数:数据之和除以数据个数    AVERAGE

几何平均数:数据的连乘积开N次方根   GEOMEAN(通常用于增长率)

调和平均数:数据的个数除以单个数据的倒数之和。 HARMEAN   常用于平均车速

中位数:数据集按照大(小)排序后,处在中间的数据。 MEDIAN

众数:数据集中出现次数最多的数。 MODE

频数分布图(直方图)

极差:最大值与最小值的差距

极差用于表示数据的离散程度。

方差:数据与平均数差距的平方和/数据个数  VAR.P

标准差:方差的平方根。      STDEV.P

方差(标准差)越大,数据的离散程度也就越大。

变异系数=标准差/平均数

消除数据单位带来的影响,可以比较不同领域的数据离散程度。

第三部分:正态分布及相关分析

数据的分布多集中在平均数附近,且呈两端逐渐减少的分布情况属于整天分布,且满足

1、任意数据在 平均数-标准差 到 平均数+标准差 区间内的概率为68.3%

2、任意数据在 平均数-标准差 * 2到 平均数+标准差 * 2 区间内的概率为95.4%

3、任意数据在 平均数-标准差 *3 到 平均数+标准差 * 3 区间内的概率为99.7%

Z分数:用于计算单一数据在正态分布中的位置。

Z分数=(数据-平均数)/标准差,在以σ为一个单位的分布中,该数据的位置。

T分数:表示某个数据在平均数为X,标准差为σ 的正态分布中的位置,也即对分布图进行了位移。

T分数= Z分数* 标准差+平均数(具体数值的场景考虑)

将数据保持在平均数+标准差*2的范围内,就有95.4%+4.6%/2=97.7%的概率保证数据在可控范围,多用于库存管理,现金流管理,质量管控等风险管理。

相关分析:

相关关系≠因果关系  前者是后者的必要非充分条件。

相关系数判断: correl 函数

0.7~1  强正相关   负数则为强负相关

0.5~0.7  弱正相关  负数则为弱负相关

-0.5~0.5  不相关。

回归分析

回归直线跟R²值。

R²一般大于0.5表示该回归方程较为准确。其中R为相关系数,相关系数为0.7以上时表示有强相关性,所以R²大于0.5.

R²值通常用于检验一元线性回归方程。

多元线性回归用 adjusted R² 判断(校正的值)

EXCEL 数据分析工具箱可以直接一键统计分析。

整理完仿佛我自己又上了次大学班主任彪哥的课

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多