veer66 / wordcut

Thai word breaker for Node.js
GNU Lesser General Public License v3.0
141 stars 40 forks source link

Rules มันทำงานอย่างไรครับ #14

Closed xbklairith closed 8 years ago

xbklairith commented 8 years ago

thai_rules: ส่วนของ PartRule มันพยายาม ตัดคำให้มี ตัวอักษรสระไปเกาะติดคำไปด้วยหรือเปล่าครับ

veer66 commented 8 years ago

มันจะห้ามทุกตัวตาม pattern แยกกันครับ "แก", "เก", "ก้", "กก์", "กา", "กี", "กิ", "กืก" ( ก คือพยัญชนะใด ๆ ครับ )

xbklairith commented 8 years ago

ถ้าเป็นคำสะกดอย่างนี้ wordcut.cut('มาร์ซ') => 'มา|ร์ซ' มีวิธีเพิ่มเข้าไปใน rule ไหมครับ หรือลง dict ง่ายกว่าครับ

veer66 commented 8 years ago

มัน add ได้นะครับ แต่มันใช้ได้เสมอไปหรือเปล่า ถ้าเป็น ....ร์ช่าง แบบนี้ก็บึ้มเลยนะครับ

xbklairith commented 8 years ago

ขอบคุณครับ