什么是正态分布 正态分布如何判定


创世之刻,神瞰世界而谈分布,赋予了正态分布之存在。起源篇

0.0 传说神灵规定世界要拥有正态分布的法则,如此世间就有了正态分布的存在。

0.1 神圣者赞赏正态分布的优美,让随机的误差均归于这一律之中。

0.2 奇妙之处在于,许多看似随机的现象,却能以一个简单的表达式来概括其分布规律,仿佛是上帝之手精心设计的一般。

——《创世记·数理天地·正态分布的宇宙之谜》

一、神为世间万物赋予了抛掷的规则。每次抛出,正面记为+1分,反面记为-1分。

初始之时,神仅抛一次,概率分布如是说:一半的概率获得+1分,另一半的概率获得-1分。

这种概率分布的形象化描绘是……

当神决定连续抛掷多次时——

无论是1次还是10次,概率的分布总是如此呈现。

那么,如果是100次、甚至是无数次呢?平均分数将如何分布?让我们通过图示来一探究竟。

二、为何正态分布在生活中如此常见?

这是因为任何事物的变化往往受到多种因素的影响。以人的身高为例,其受到多种因素的综合作用,如:

  • 父母的遗传身高
  • 日常饮食习惯,素食或荤食的选择(虽皆为所爱)
  • 每日的运动习惯及种类(如游泳等)
  • 以及其他诸多因素

这些因素如同抛一般,有的对身高产生正面影响,有的产生负面影响,最终使得整体身高呈现出正态分布的趋势。

学过基础统计学的朋友们对正态分布不会陌生,但要用通俗的语言解释其含义却非易事。这主要是因为正态分布涉及到一个前置知识——中心极限定理。

当误差被视为众多微小变化的累积时,依据中心极限定理,这些随机误差自然而然地呈现出正态分布的趋势。

在数学的殿堂里,正态分布又被称为高斯分布(Gaussian distribution)。

若随机变量X服从期望为μ、方差为σ²的正态分布,其概率密度函数呈现为特定的公式。

其数学表示可记为:X∼N(μ,σ²),图示如下:

神的身份为约翰·卡尔·弗里德里希·高斯,C.F. Gauss,一位伟大的数学家与天文学家,于1777年至1855年期间活跃于世。

[1] 正态分布的普遍性源于中心极限定理。当一个事物受到多种因素的影响时,不论每个因素本身的分布如何,它们累加后的平均值往往呈现正态分布。

[2] 正态分布适用于各种因素累加的情况。若这些因素间并非彼此独立,而是相互影响增强,则分布形态可能不是正态。若各因素对结果的影响不是相加而是相乘的关系,那么最终结果可能呈现对数正态分布而非正态。