据说这个定律在1881年首先被一位天文学家在分析数据的时候发现,但是当时科学家们并没有把这个发现当回事。直到1935年,美国的一个叫本福特的物理学家从新发现了这个定律。当时,他在图书馆翻阅对数表时发现,对数表的头几页比后面几页更脏一些,这说明头几页在平时被更多的人翻阅。这并不奇怪,因为许多读书的人都先看看书的开头,不喜欢就不再读下去。但是,对数表却是一种数学工具,只有需要查数据的人才会去碰它。因此,头几页如果比较脏,这就说明人们查阅的数据大多在头几页里,也反映出人们所使用的数据并不是散乱的,而是有些数据使用的频率比较高。
本福特再进一步研究后发现,只要数据的样本足够多,同时数据没有特定的上限和下限,则数据中以1为开头的数字出现的频率并不是人们想当然认为的1/9,而是0.301,这说明30%的数字都以1开头。而2为首的数字出现的频率是0.176,3开头的数字出现的频率为0.125,往后出现频率依此减少,9打头的数字出现的频率最低,只有0.046。这个规律甚至能用一个数学方程来表示。