Бенфордов закон

Бенфордовиот закон, познат и како закон на првата цифра, тврди дека во многу списоци на броеви кои потекнуваат од извори на податоци од стварниот живот (на пр. улични адреси, сметки за струја), распределбата на првата (водечката) цифра следи специфична, нерамномерна распределба. Според овој закон, единицата (1) како прва цифра се јавува во речиси третина од случаите (30%), поголемите цифри (2, 3, 4...) се појавуваат како први цифри со сè помала честота, така што деветката (9) како прва цифра се јавува помалку од 5% (еднаш во дваесет случаи). Основата на овој „закон“ е дека вредностите добиени со мерењата во стварниот живот често се распределуваат логаритамски, поради што логаритмот на вредностите на овие мерења, генерално кажано, е рамномерно распределен.

Се покажало дека овој контраинтуитивен резултат е применлив за најразлични множества на податоци, вклучувајќи сметки за електрична енергија, улични адреси, цени на акции, број на население, стапка на смртност, должина на реки, физички и математички константи и процеси опишани со степени закони (т.е. закони во кои зависноста е опишана со степена функција, кои се многу чести по природа). Резултатот важи без оглед на основата во која ги изразуваме бројките во однос на намалување на честотите од пониски цифри на повисоки, иако специфичните проценти се менуваат.

Законот е именуван по физичарот Френк Бенфорд, кој го формулирал во 1938 година, иако претходно бил изречен од Сајмон Њуком во 1881 година.

Математички исказ[уреди | уреди извор]

Поточно, законот на Бенфорд вели дека ако бројките ги изразиме со основа b (b ≥ 2), водечката цифра d (d ∈ {1, …, b − 1} ) се појавува со веројатност

P(d) = log_b(d + 1) − log_bd = log_b((d + 1)/d).

Оваа величина е еднаква на растојанието помеѓу d и d + 1 на логаритамска скала.

Конкретно, во основата 10, водечките цифри според Бенфордовиот закон ја следат следната распределба, каде што d е водечката цифра и p е веројатноста за нејзино појавување:

d	p
1	30,1%
2	17,6%
3	12,5%
4	9,7%
5	7,9%
6	6,7%
7	5,8%
8	5,1%
9	4,6%

Примени и ограничувања[уреди | уреди извор]

Во 1972 година, микроекономистот Хал Варијан, тогаш докторанд на Калифорнискиот универзитет, Беркли, сугерирал дека законот може да се користи за откривање можна измама во социо-економските податоци поднесени за поддршка на одлуките за јавно планирање. Врз основа на разумна претпоставка дека луѓето кои измислуваат броеви се склони да ги распределуваат своите цифри прилично рамномерно, едноставна споредба на распределбата на честотата на првата цифра во дадените податоци со распределбата што се очекува според Бенфордовиот закон треба да укаже на можни неправилности. Воден од оваа идеја, Нигрини покажал дека Бенфордовиот закон може да се користи како показател за сметководствени и измами за оправдување на трошоци.

Ограничувања[уреди | уреди извор]

Сепак, при овие примени треба да се биде внимателен. Дадено множество податоци од стварниот живот можеби не подлежи на законот, во зависност од то до кој степенот распределбата на броевите е под влијание на природата на самата категорија на податоци.

Обопштување на цифри после првата[уреди | уреди извор]

Законот може да се обопшти на цифри после првата. Особено, веројатноста да се сретнеме со број кој започнува со одредена фиксна низа од цифри е дадена со:

\log _{10}\left(1+{\frac {1}{n}}\right)

.

На пример, веројатноста даден број да започне со цифрите „314“ е ₁₀ (1+1/314). Овој резултат може да се користи за да се најде веројатноста дека одредена цифра е во дадена позиција во рамките на број. На пример, веројатноста дека цифрата 2 е на втората позиција (од лево) е:

\log _{10}\left(1+{\frac {1}{12}}\right)+\log _{10}\left(1+{\frac {1}{22}}\right)+\cdots +\log _{10}\left(1+{\frac {1}{92}}\right)\approx 0{,}109

.

Ако фиксираме која било од десетте цифри, веројатноста таа цифра од бројот да биде еднаква на нашата цифра многу брзо се приближува до 10% како што се зголемува, односно распределбата на таа цифра брзо се приближува до еднаква распределба кога n → ∞.

Практичните примени на Бенфордовиот закон рутински користат повеќе од само првата цифра.