kmubiin / suaikata

Koleksi ringkas kosa kata
Other
2 stars 1 forks source link

Statistik data terkumpul #8

Closed kmubiin closed 5 years ago

kmubiin commented 6 years ago

Isu tak bersandar untuk menjadikan projek ini lebih menarik.

Selain bilangan kata masukan, mungkin ada butir-butir lain yang boleh dihitung seperti:

Mana-mana butir berkenaan mungkin boleh memberi anggaran bilangan kata masukan Melayu yang tidak dijumpai untuk kata masukan Inggeris tersenarai.

Perhitungan boleh dibuat menggunakan formula dalam helaian rebak (spreadsheet) atau menulis skrip kecil dalam bahasa pengaturcaraan pilihan sendiri. Helaian rebak atau skrip yang dicipta untuk perhitungan adalah hak cipta masing-masing dan tidak perlu dimuat naik ke repositori projek ini.

Sekiranya kaedah perhitungan dapat diterangkan secara ringkas, itu sudah cukup baik. Memadai dengan tinggalkan komen di jalur isu ini, supaya pendokumenan (documentation) dapat dibuat dan dimuat naik ke repositori projek kemudian.


28 Mac 2018: Salah satu cadangan telah dilaksanakan dalam helaian rebak di Google Sheets. 'Daftar asal mengikut abjad' hanya mengira bilangan kosa kata Inggeris daripada sumber yang dipilih, yang hanya menggunakan bahasa Inggeris.

29 Mac 2018: Satu lagi carta ditambah di Google Sheets. 'Daftar terjemah mengikut abjad' mengira bilangan kosa kata Inggeris (termasuk perkataan ulangan) dan kosa kata Melayu (termasuk makna-makna untuk perkataan ulangan).

15 April 2018: Setiap kali kosa kata terjemah disemak dan berubah pada satu-satu masa, paparan jadual dan carta daftar semasa terjemah akan turut berubah serta-merta. Ini adalah perkara biasa. Jadi, sebarang usaha selidik lebih baik dilakukan selepas daftar tersebut telah siap dan dimuat naik ke repositori. Isu ini akan dikeluarkan daripada Rancangan Akhir dan akan bersambung kemudian.

kmubiin commented 6 years ago

Fail dokumentasi baru mungkin akan dicipta untuk mengandungi maklumat seperti ini. Yakni, maklumat perangkaan untuk mana-mana hasil daftar yang disiapkan di repositori projek. Ini bermaksud, maklumat perangkaan juga boleh dilayari melalui GitHub Pages nanti.

raafsmakmal commented 6 years ago

Untuk halaman utama, saya sarankan kita guna perkataan buzzword/keyword yg bukan saja berkait dgn projek, malah sohor utk zaman sekarang.

Sebagai contoh:

Penerangan tentang daftar psat ada cerita tentang SAT - boleh jadi sebab kenapa dipilih perkataan SAT, apa itu SAT, tahap SAT itu bagaimana dsb. Dalam bayangan saya, spt ini:

"Daftar ini ialah terjemahan [beberapa ratus] perkataan yang biasa timbul dalam peperiksaan SAT (panjangnya Scholastic Aptitude Test, Ujian Kecenderungan Pembelajaran)... "

Utk penerangan daftar terjemahan perkataan bahasa Inggeris paling biasa ke dalam Bahasa Melayu, saya akan kemukakan penerangan untuk kita teliti bersama.

kmubiin commented 6 years ago

Komen baru M selepas komen yang dipetik daripada komen A dan M sebelum ini.

A: Untuk halaman utama, saya sarankan kita guna perkataan buzzword/keyword yg bukan saja berkait dgn projek, malah sohor utk zaman sekarang.

Di mana "halaman utama" yang dimaksudkan? Saya anggap halaman utama di repositori GitHub (https://github.com/kmubiin/suaikata) yang ada tetapan "Add topics" di bawah nama umum. Tapi pelik juga kalau "buzzword/keyword" yang dimaksudkan adalah "topics" di GitHub (https://github.com/topics)...

A: Sebagai contoh: Penerangan tentang daftar psat ada cerita tentang SAT [...]

...dan contoh yang diberi dalam perenggan seterusnya macam menerangkan perkara lain daripada komen di perenggan sebelumnya? Agak keliru.

M: Fail dokumentasi baru mungkin akan dicipta untuk mengandungi maklumat seperti ini. Yakni, maklumat perangkaan untuk mana-mana hasil daftar yang disiapkan di repositori projek [...]

~Berkenaan fail dokumentasi yang disebutkan oleh M sebelum ini, selain maklumat perangkaan, ulasan daftar juga akan diperkenal sebagai fail dokumentasi baru dalam folder yang berasingan. [...]~ lapuk

~Maklumat angka dan ulasan telah ditulis semula sebagai dokumentasi kajian~ lapuk

kmubiin commented 5 years ago

Enam bulan kemudian, isu "Statistik data terkumpul" ini telah disemak semula.

Hakikatnya, maklumat perangkaan (MPA) sudah mengira bilangan kata masukan dan terjemah. Semasa pembaikan keluaran pertama, M telah menambah kebolehan menyalin maklumat perangkaan sebagai jadual Markdown melalui formula di helaian rebak.

Kemas kini maklumat perangkaan sekarang menjadi mudah dengan hanya salin dan tampal (copy and paste) maklumat itu dari helaian rebak ke fail berkenaan di GitHub.

Sebaliknya, statistik data terkumpul (SDT) mudah lapuk apabila terjemah berubah dari semasa ke semasa. SDT melibatkan pengiraan data dan penghasilan carta. Usaha mentafsirkan carta akan mengambil masa yang lebih lama. Dengan itu, kemas kini menjadi lebih leceh berbanding MPA.

Kesimpulannya, SDT tidak akan diusahakan kerana MPA sudah memadai.

Nota: Singkatan MPA dan SDT hanya digunakan untuk meringkaskan ayat dalam komen ini dan bukan singkatan rasmi.