别相信直觉
Posted on January 29, 2014

最近读到一个很有意思的东西。任取一组没有上限的随机数字(比如人口普查表,山峰的高度等),这些数字首位为n的概率不是11%,而是log(n+1)-log(n)。比如首位为1的概率大约是30%。

我用世界人口普查表测试了一下,果然准:

cat population.txt | cut -d , -f 3 | sed ’s/(.).*//g’ | sort | uniq -c
65 1
45 2
32 3
22 4
24 5
17 6
11 7
17 8
10 9

这确实有点反常理,不过仔细想一下,其实是因为自然界的数没有上限,所以首位不是均匀分布的。详见