统计-分布

发表信息: by Creative Commons Licence

目录

正文

幂律分布 power law distribution

各种物理,生物和人造现象的分布大致遵循各种大小的幂律: 这些包括月球上的陨石坑和太阳耀斑的大小,各种生物的觅食模式,神经元群体的活动模式尺寸,在大多数语言中的词频, 姓氏的频率,生物类群中的物种丰富度,停电的大小,刑事指控,火山爆发,人类对刺激强度的判断以及其他。 很少有经验分布所有的数值都符合幂律,但至少在尾部服从幂律。 在许多复杂介质中,声衰减遵循宽频带内的频率幂律。 生物变量之间关系的异速生长标度法是自然界中最着名的幂律函数之一。

幂律分布有一些性质:

1、规模不变性(尺度不变性)scale invariance

按常数缩放 {\ displaystyle c} C 简单地将原始幂律关系乘以常数 {\ displaystyle c ^ { - k}}。 因此,具有特定缩放指数的所有幂定律都等效于常数因子,因为每个幂简单地是其他的缩放版本。

当采用两者的对数时,此行为产生线性关系 F(X) 和 X并且对数 - 对数图上的直线通常被称为幂律的签名。对于真实数据,这种直线性是遵循幂律关系的数据的必要条件,但不是充分条件。 事实上,有很多方法可以生成模仿这种签名行为的有限数据量,但是,在它们的渐近极限中,不是真正的幂律

(例如,如果某些数据的生成过程遵循对数正态分布)。 因此,准确拟合和验证幂律模型是统计研究的一个活跃领域;

2、缺乏明确定义的平均值(Lack of well-defined average value)

幂律 {\ displaystyle x ^ { - k}} {\ displaystyle x ^ { - k}}有一个明确的意思了 {\ displaystyle x \ in [1,\ infty}} {\ displaystyle x \ in [1,\ infty}} 除非 {\ displaystyle k> 2} {\ displaystyle k> 2},只有当它有一个有限的方差 {\ displaystyle k> 3} {\ displaystyle k> 3}; 自然界中大多数已确定的幂律具有指数,使得均值定义明确,但方差不明显,暗示它们具有黑天鹅行为能力。[10]这可以在以下思想实验中看到:[11]想象一个房间和你的朋友一起估算房间里的平均月收入。现在想象世界上最富有的人进入房间,月收入约10 亿美元。房间的平均收入会怎样?收入根据称为帕累托分布的幂律来分配(例如,美国人的净值根据幂律分布,指数为2)。

一方面,这使得应用基于方差和标准差的传统统计(例如回归分析)不正确。[ 引证需要 ]另一方面,这也允许经济有效的干预。[11]例如,考虑到汽车尾气根据汽车中的幂律分布(极少数汽车导致大多数污染),从道路上消除那些极少数汽车就足以减少总排气量。[12]

然而,中位确实存在:对于幂律x - k,具有指数 {\ displaystyle k> 1} k> 1,它取值2 1 /(k - 1)x min,其中x min是幂律所适用的最小值

3、普遍性(universality)

功率定律与特定比例指数的等价性可以在产生幂律关系的动态过程中具有更深层次的起源。例如,在物理学中,热力学系统中的相变与某些量的幂律分布的出现相关联,其指数被称为系统的关键指数。具有相同关键指数的多样系统 - 即,当它们接近临界时显示相同的缩放行为- 可以通过重整化群理论显示,以共享相同的基本动态。例如,水和CO的行为2在他们的沸点下属于同一个普遍性阶级,因为他们有相同的关键指数。[ 引证需要 ] [ 需要澄清 ]实际上,几乎所有材料相变都由一小组普遍性类描述。对于各种自组织的关键系统,已经进行了类似的观察,尽管不是全面的,其中系统的关键点是吸引子。在形式上,这种动态共享被称为普遍性,具有完全相同的关键指数的系统被认为属于同一种普遍性类。

然而,最近对权力定律的兴趣来自于对概率分布的研究:各种数量的分布似乎遵循幂律形式,至少在它们的上尾(大事件)中。这些大事件的行为将这些数量与大偏差理论(也称为极值理论)的研究联系起来,后者考虑了股票市场崩溃和大型自然灾害等极为罕见事件的频率。主要在统计分布的研究中使用了“幂律”这个名称。

在经验背景下,近似于幂律 {\ displaystyle o(x ^ {k})} O(X ^ k)的 通常包括偏差词 {\ displaystyle \ varepsilon} \ varepsilon ,它可以代表观测值的不确定性(可能是测量或抽样误差),或者为观测偏离幂律函数提供一种简单的方法(也许是出于随机原因):

https://en.wikipedia.org/wiki/Power_law