文中案例参考了Courtney K. Taylor的文章《How to Use the NORM.INV Function in Excel》 在使用Excel统计概率的时候经常需要用到NORMINV函数功能。比如以x表示一个呈正态分布的随机变量,可能会被问到这样一个问题,x的数值等于多少才能在其整个概率分布中位于最低的10%? 为回答这个问题,可能需要以下三步才能得出答案: 1、 用标准正态分布表找到概率分布中最低的10%所对应的标准分数Z-score; 2、 用标准分数Z-score的计算公式求出x的值,Z-score的计算公式为z=(x- μ)/σ,将该公式略作调整: x = μ + zσ,其中μ是概率分布的均值,σ是概率分布的标准差; 3、 将各要素带入公式,得出结果 但是在Excel中只需使用NORMINV函数即可得出结果。按照Excel的定义,NORMINV为返回指定平均值和标准偏差的正态累积分布函数的反函数,其语法为NORMINV(probability,mean,standard_dev),其中Probability 为正态分布的概率值,Mean为分布的算术平均值,Standard_dev 为分布的标准偏差。 1、 正态分布的概率值为累积的概率分布值,对应的是概率分布曲线的左侧; 2、 分布的算术平均值处于概率分布的中心位置上; 3、 分布的标准偏差反映的是概率分布的离散程度。 计算示例 假设一个样本人群的智商测定值呈正态分布,均值为100,标准差为15。请回答以下三个问题: 1、 所有智商值中最低的10%的数值范围? 2、 最高的1%智商值的数值范围? 3、 中间的50%智商值的数值范围? 解题: 1、 在Excel中输入NORMINV(10%,100,15),结果约等于80.78,该结果意味着小于等于80.78的智商值在全部智商值中为最低的10%; 2、 这个问题稍有点难。根据定义,NORMINV函数的计算结果体现的是概率分布曲线左侧的分布情况,如果想了解概率分布中最高部分的情况,需要看概率分布曲线右侧的分布情况。分布曲线中最高的1%所对应的是后面的99%,因此在Excel中输入NORMINV(99%,100,15),结果约等于134.90,该结果意味着大于等于134.90的智商值在全部智商值中属于最高的1%; 3、 问题三的难度更大一些。要知道中间的50%概率分布意味着要排除掉顶部25%和底部25%的概率分布情况, ·对于底部25%,需要在Excel中输入NORMINV(25%,100,15),结果等于89.88; ·对于顶部25%,需要在Excel中输入NORMINV(75%,100,15),结果等于110.12; 问题三的答案是:如果89.88<智商值<110.12,在所有智商测定值中,其概率分布处于中间的50%。 如果只是计算标准正态分布的情况,那么使用NORMSINV即返回标准正态累积分布函数的反函数即可。该函数计算的是概率分布均值为0、标准差为1的概率分布情况。其语法为NORMSINV(),()内为正态分布的概率值。 只有在概率分布均值为0、标准差为1的情况下,NORMINV函数和NORMSINV函数的计算结果才相等: NORMINV(正态分布的概率值,0,1)= NORMSINV(正态分布的概率值) 比如正态分布的概率=10%,则 NORMINV(10%,0,1) = NORMSINV(10%)=-1.2816 |
|