Stem kata bahasa Indonesia berdasarkan Porter Stemmer, dengan menggunakan algoritma yang dipaparkan dalam paper A Study of Stemming Effects on Information Retrieval in Bahasa Indonesia, oleh Fadillah Z Tala.
English translation is available here.
Tambahkan baris ini di Gemfile aplikasi anda:
gem 'indonesian_stemmer'
Kemudian jalankan:
$ bundle
Atau instal sendiri seperti ini:
$ gem install indonesian_stemmer
require 'rubygems'
require 'indonesian_stemmer'
IndonesianStemmer.stem('mendengarkan') # => "dengar"
'beriman'.stem # => "iman"
Atau mencobanya langsung dari web: indonesian-stemmer.adindap.com.
Gem ini masih dalam tahap pengembangan dan penyempurnaan. Meskipun sudah banyak upaya dalam pemilihan kata dan penanganan kata-kata yang ambigu, jangan mengandalkan gem ini untuk analisa ilmiah atau proyek lainnya. Berikut adalah masalah-masalah yang diketahui atau kasus-kasus yang tidak ditangani oleh gem ini dengan benar:
memasak
yang memiliki 2 kata dasar yang sama, yaitu pasak
dan masak
. Saat ini kami mutuskan untuk mengeluarkan hasil kata dasar berdasarkan kata yang lebih umum digunakan (menurut pendapat kami). Dalam contoh ini, kata masak
yang kami pilih.mengebom
yang berasal dari kata bom
.Jika ada masalah lain di luar hal-hal di atas, silahkan buat tiket baru
Awalnya, gem ini merupakan implementasi dari sistem penganalisa untuk bahasa Indonesia, dari proyek Apache Lucene, ke dalam bahasa Ruby. Gem ini sudah mengalami beberapa perubahan algoritma dalam mengenali awalan kata, terutama terhadap kata-kata yang ambigu.
git checkout -b my-new-feature
)git commit -am 'Tambahkan fitur baru'
)git push origin my-new-feature
)Setelah bersyukur kepada Allah Subhanahu Wa Ta'ala, kami ingin mengucapkan terima kasih kepada: