Thaza-Kun / bunyi-melayu

Projek kecil menerapkan tatabunyi melayu menggunakan nom
https://thaza-kun.github.io/bunyi-melayu/
2 stars 1 forks source link

Idea untuk kembangkan skop projek #1

Open irfanzainudin opened 5 months ago

irfanzainudin commented 5 months ago

Salam tuan Thaza, pertama sekali, izinkan saya berterima kasih kerana sudi bina projek bunyi-melayu ni.

Saya buka isu ni untuk cadangkan sebuah idea untuk kembangkan skop projek ni.

Saya nampak ada use case yang menarik kalau digandingkan dengan projek saya: Projek Pantunis (pantunis.com) yang bercita-cita untuk menjadi pangkalan data pantun terbesar di Internet dengan jumlah 1,000,000 pantun dalam masa 5 tahun.

Sekarang ni saya cuma masukkan pantun ke dalam pangkalan data guna Python scripts dan fail SQL je. Tapi ramai yang hubungi saya kata berminat nak sumbangkan pantun olahan sendiri untuk dimasukkan ke dalam pangkalan data.

Laman sumbangan tu dah ada, cuma saya belum lancarkan lagi.

Masalah utama saya sekarang ialah sistem untuk kenalpasti sumbangan itu merupakan sebuah pantun yakni ia menepati struktur sebuah pantun. Buat masa sekarang, saya hanya bangunkan sistem asas sahaja yang kenalpasti huruf terakhir sama atau tidak. Very rudimentary as the English would say.

Tapi saya percaya dengan projek bunyi-melayu ni, kalau ditambah beberapa ciri baru, boleh dimanfaatkan oleh Projek Pantunis untuk bangunkan sistem pengenalan pantun yang lebih berkesan dan menyeluruh.

Sudah tentu saya akan tolong sumbangkan kod dan selenggarakan codebase ni juga.

Boleh tuan kongsikan tujuan besar / akhir projek ni selain untuk Godam Sahur?

irfanzainudin commented 5 months ago

Beberapa cadangan untuk perkembangan skop:

Idea "public API" ni kena dengan skillset saya yang sedia ada. Tapi kalau tuan lebih selesa dengan crate, saya boleh belajar cara untuk terbitkan sebuah cargo crate(belum berkesempatan untuk baca buku rasmi cargo).

Thaza-Kun commented 5 months ago

Salam, alhamdulillah ada yang berkenan dengan projek ini.

Pertama sekali, projek kecil ini dibina untuk menambah kefungsian pada projek utama saya Samudra iaitu sejenis aplikasi kamus sebagai POC (Proof of Concept). Tujuan sistem tatabunyi ini dibangunkan ada beberapa:

  1. Memastikan istilah yang didaftarkan dalam sistem menepati sistem ejaan bahasa Melayu (atau bahasa lain jika kamus bahasa lain).
  2. Mencerakinkan suku kata secara automatik selepas istilah dikeluarkan dari pangkalan data (untuk dipaparkan).
  3. Membolehkan penerbitan kata secara automatik seperti imbuhan atau kata ganda (untuk paparan).
  4. Menjadi tapisan awal ayat bukan rojak secara deterministik dengan mengenal pasti perkataan yang tidak menepati sistem ejaan (apabila dikembangkan untuk kutip data dari sumber digital kelak).

Secara konsepnya, projek Samudra ini ingin dibangunkan menggunakan sistem plugin dengan fungsi-fungsi berbeza berada dalam crate berbeza. Sekarang ini Samudra hanya mampu CRUD pangkalan data tempatan SQLite. Projek ini mungkin usaha pertama untuk bangunkan plugin Samudra.

Untuk guna cargo crate boleh sahaja pautkan dia ke git tanpa perlu ke terbitkan ke cargo (kalau belum bersedia terbitkan ke cargo, misalnya). Baca di sini: https://doc.rust-lang.org/cargo/reference/specifying-dependencies.html#specifying-dependencies-from-git-repositories

Semestinya ia boleh dikembangkan untuk kegunaan pantunis juga. Kita boleh bangunkan crate bersama-sama.

irfanzainudin commented 5 months ago

Terbaik!

Kalau begitu, boleh tuan cadangkan beberapa bahagian untuk saya mula sumbang kod untuk projek ni?

Buat masa sekarang, saya akan teroka codebase projek ni dan baca buku rasmi cargo untuk belajar cara terbitkan crate.

Thaza-Kun commented 5 months ago

Cadangan awal saya sudah nyatakan di #2