Hukum Zipf

Hukum Zipf , dalam probabilitas, menyatakan bahwa frekuensi f dari peristiwa tertentu berbanding terbalik dengan peringkat r mereka . Undang-undang ini awalnya diusulkan oleh ahli bahasa Amerika George Kingsley Zipf (1902–1950) untuk frekuensi penggunaan kata-kata yang berbeda dalam bahasa Inggris; frekuensi ini diberikan kira-kira oleh f ( r ) ≅ 0,1 / r . Jadi, kata yang paling umum (peringkat 1) dalam bahasa Inggris, yaitu the , muncul sekitar sepersepuluh dari waktu dalam teks biasa; kata paling umum berikutnya (peringkat 2), yang dari , muncul sekitar satu per dua puluh waktu; Dan seterusnya. Cara lain untuk melihat ini adalah bahwa kata peringkat r muncul 1 /r kali lebih sering dari kata yang paling sering, jadi kata peringkat 2 muncul setengah dari kata peringkat 1, kata peringkat 3 sepertiga lebih sering, kata peringkat 4 kata seperempat sering, dan seterusnya. Di luar sekitar peringkat 1.000, hukum benar-benar rusak.

Hukum Zipf konon telah diamati untuk banyak statistik lain yang mengikuti distribusi eksponensial. Misalnya, pada tahun 1949 Zipf mengklaim bahwa kota terbesar di suatu negara berukuran sekitar dua kali kota terbesar berikutnya, tiga kali lipat kota terbesar ketiga, dan seterusnya. Meskipun kesesuaian tidak sempurna untuk bahasa, populasi, atau data lainnya, gagasan dasar hukum Zipf berguna dalam skema kompresi data dan alokasi sumber daya oleh perencana kota.

William L. Hosch