Baru-baru ini saya mencoba mengoprek data bahasa Indonesia dari Kamus Besar Bahasa Indonesia (KBBI) yang ada di situs KBBI Online (http://bahasa.kemdiknas.go.id/kbbi/index.php).
Statistik menarik:
- Jumlah kata dalam kamus tersebut sebanyak 31440 , termasuk imbuhan, sisipan dan sebagainya. Beberapa kata muncul dalam entry yang berbeda, untuk perhitungan ini entry yang berbeda tersebut dianggap satu.
- Kata yang paling banyak mengandung huruf ‘a’ adalah ‘nawalapradata’ dan ‘pancarajadiraja’, masing-masing mengandung 6 huruf ‘a’.
- Kata paling panjang adalah ‘ekstrateritorialitas’ sepanjang 20 karakter. Silakan dicek di situs KBBI (http://bahasa.kemdiknas.go.id/kbbi/index.php)
Daftar kata ada di http://wa2010.kabarkita.org/files/daftar-kata-bahasa-indonesia.txt