본문내용
1. 서론
1.1. 벤포드 법칙의 발견과 특성
우리는 모든 숫자가 등장할 확률이 동일하다고 생각하지만, 실제로는 그렇지 않다는 것이 발견되었다. 캐나다 출신의 미국인 천문학자 사이먼 뉴컴은 1881년에 낡은 로그표를 살펴보던 중 1로 시작하는 수의 로그값이 9로 시작하는 수의 로그값보다 더 많이 참조되고 있다는 사실을 발견하였다. 이는 1로 시작하는 수의 로그값이 필요한 경우가 가장 많기 때문이었다.
뉴컴은 숫자의 첫째 자리 수 분포가 로그함수에 따라 변한다는 것을 추측하였다. 즉, 숫자 d가 첫째 자리 수가 될 확률은 log(d+1) - log(d)라고 주장하였다. 이에 따르면 1이 첫째 자리 수가 될 확률은 30.1%, 2가 17.6%, 3이 12.5% 등으로 급격히 감소한다.
반세기 이상이 지난 1938년, 제너럴 일렉트릭의 물리학자 프랭크 벤포드가 유사한 발견을 하였다. 그는 로그표 이외에도 다양한 데이터 집합에서 이러한 패턴을 관찰하였다. 미국 도시의 인구, 『미국 과학자』에 실린 수백 명의 주소, 원소의 원자량, 강의 면적 등 맥락이 전혀 다른 데이터에서도 이 패턴이 나타났다.
벤포드는 이를 "이례적인 수들의 법칙"이라고 명명하였고, 오늘날 "벤포드의 법칙"으로 불리게 되었다. 이 법칙은 자연과학, 재정학, 경제학 등 다양한 분야에서 관찰된다. 예를 들어 인구, 사망률, 주식 가격, 야구 통계, 강과 호수의 면적 등을 기록한 표에서 이 패턴을 발견할 수 있다.
1.2. 벤포드 법칙의 수학적 원리
벤포드 법칙의 수학적 원리는 다음과 같다. 임의의 수가 d를 첫 자리 숫자로 갖는 확률은 log(d+1) - log(d)로 계산된다. 예를 들어 첫 자리 숫자가 1인 수가 나올 확률은 log(1+1) - log(1)=log2≒0.301, 즉 30.1%이다. 첫 자리 숫자가 2인 수가 나올 확률은 log(2+1) - log(2)=log1.5≒0.1761, 즉 17.61%이다. 이와 같은 방식으로 첫 자리 숫자 1부터 9까지의 출현 확률을 계산할 수 있다. 이러한 확률 분포는 로그함수에서 도출된 것으로, 자연계의 다양한 데이터에서 실제로 관찰되는 경향성이 된다. 벤포드 법칙은 데이터의 분포가 정규분포를 따르지 않고 로그 분포를 따르는 경우에 적용되며, 이는 우리가 일상적으로 접하는 많은 수치들이 그러한 특성을 갖고 있기 때문에 큰 의미를 지닌다.
1.3. 벤포드 법칙과 피보나치 수열의 관계
피보나치 수열 또한 벤포드의 법칙을 따른다는 것이 밝혀졌다. 벤포드는 400항까지의 피보나치 수열을 계산한 후 각 항의 첫 자리 수 분포를 조사하였다. 그 결과, 피보나치 수열의 첫 자리 수 분포가 벤포드의 법칙과 대체로 일치한다는 것을 알 수 있었다.
구체적으로 피보나치 수열의 첫 자리 수 1이 전체의 약 30.3%, 2가 17.5%, 3이 12.8% 등의 비율로 나타났다. 이는 벤포드의 법칙에 의한 이론적 확률과 최...