新华社北京12月24日新媒体专电 据西班牙《国家报》网站12月16日发表题为《为什么很多数据都从“1”开始?》的文章称,根据本福特定律,在实际生活中以“1”为首位数字的数的出现概率约为总数的30%全文摘编如下:,我来为大家讲解一下关于欧洲的数据怎么看?跟着小编一起来看一看吧!

欧洲的数据怎么看(数据为何喜爱从)

欧洲的数据怎么看

新华社北京12月24日新媒体专电 据西班牙《国家报》网站12月16日发表题为《为什么很多数据都从“1”开始?》的文章称,根据本福特定律,在实际生活中以“1”为首位数字的数的出现概率约为总数的30%。全文摘编如下:

西班牙马德里自治区的179座城市中,大约三分之一的城市(准确地说是54座)都表现出居民人口数以“1”开头的特点。这是本福特定律的一个例子。本福特定律指出,从实际生活得出的数据中,以“1”为首位数字的数的出现概率约为总数的30%。

本福特定律可追溯至1880年,当时美国天文学家西蒙·纽科姆在整理一本对数表书籍时发现了一个有趣现象:以“1”开头的数,其所在的页数相较其他页数破损更多。纽科姆的观察逐渐被人们遗忘,直到1938年,这个现象才引起美国工程师兼物理学家弗兰克·本福特的注意。本福特在多个来源不同的数据集合上测试了这个现象,包括美国3259座城市的居民人口、1800种物质的分子量以及美国《读者文摘》月刊308期中出现的数字。纽科姆的“第一位定律”后来被命名为“本福特定律”。

然而,并非所有数据集合都遵循本福特定律。显然,鞋码不符合这个规律,来源于随机进程的数据——如圣诞节的中奖码——也不符合。因此,如果您购买的“十分之一”(西班牙的一种,如果所购号码中奖,所得奖金为相应奖金的十分之一——本网注)首位数字不是“1”也不必担心:无论首位数是什么,您中奖的概率都很低。

虽然本福特定律不能帮助我们中奖,但它体现在方方面面,如街道门牌号、股票价格、河流长度和国家面积等。稍作思考,就可以很容易地发现,这些数据以“1”开头的频率更高。例如,就西班牙各个街道的门牌号而言,由于很多街道是“小街道”,因此门牌号大都在10至20号之间,超过200个门牌号的“大街道”相对较少。

作为一般性规律,符合本福特定律的数据为表示规模的、不预设限制的数据(长度、人口等)。此外,数据覆盖的数量级越高,就越符合这项定律。从这个意义上来讲,本福特定律是正态分布的“亲戚”,而正态分布自然存在于各类统计现象中。

准确地说,本福特定律可以用以10为底的对数(lg)来解释。如果集合中一个元素以数字c开头的概率为lg(c 1)-lg(c),我们就说这个集合满足本福特定律。在满足本福特定律的集合中,以“1”开头的元素的概率为lg2-1g1≈0.3011。同样,以“8”开头的元素的概率为lg9-lg8≈0.0511。换句话说,大约30%的数字以“1”开头,而仅有约5%的数字以“8”开头。

本福特定律也可应用于实际生活中。假设西班牙企业向大气排放的二氧化碳吨数满足本福特定律,如果一家公司提供的二氧化碳排放量数据中,有15%的数据以“8”开头,则我们有理由认为这家公司的数据存在作假嫌疑。这可能不是决定性证据,但可以成为调查此事件的线索。

来源: 新华社

,