nozomiyamada / nozomibot

7 stars 2 forks source link

nozomibot (Last Update: 17 March 2021)

Line/FB messenger bot และ web application สำหรับผู้เรียนภาษาญี่ปุ่น

834majrs

Line ID : @834majrs

FB page

Web Application : Faster Version (AWS)

Web Application : Stable Version (heroku)

written in Python 3.7 (Flask 1.1) + vue.js 2.6 and MySQL (AWS RDS), deployed to heroku and AWS

Features of Messenger Bot (Line & FB)

linguistic information

  1. พจนานุกรม (word dictionary)
  2. การตัดคำ (tokenization)
  3. การผันรูป (conjugation)
  4. การเปลี่ยนเป็นตัวอ่าน (romanization)
  5. พจนานุกรมคันจิ (kanji dictionary)
  6. accent

corpus search

  1. บทความ NHK News Easy
  2. ตัวอย่างประโยค NHK News Web
  3. ตัวอย่างประโยค Twitter

extra

  1. Wikipedia search

1. พจนานุกรม (word dictionary)

(basic ~ advanced) from JTDic

พิมพ์คำศัพท์ภาษาญี่ปุ่นหรือคำศัพท์ไทย แล้วกดส่ง ระบบจะหาคำแปลใน JTDic

พิมพ์ได้ทั้งคันจิและฮืรางานะ (ไม่ใช่การแปลทั้งประโยค)

dic

2. การตัดคำ (tokenization)

(basic)

ตัดคำโดยใช้โปรแกรม mecab-python3 1.0.3

พิมพ์คำว่า ตัด, token, 切って หรือ 分けて ไว้หน้าประโยคภาษาญี่ปุ่น แล้วกดส่ง ระบบจะตัดประโยคยาวๆ เป็นคำศัพท์สั้นๆ พร้อมทั้งอธิบายวิธีอ่าน รูปพจนานุกรมและประเภทคำ

เช่น ตัด 昨日の夜は何を食べましたか

token

ตารางประเภทคำ ใน MeCab English ใน nozomibot
動詞(どうし) verb กริยา
名詞(めいし) noun คำนาม
代名詞(だいめいし) pronoun สรรพนาม
形容詞(けいようし) adjective i-adj
形状詞(けいじょうし) na-adjective na-adj
助詞(じょし) postposition คำช่วย
助動詞(じょどうし) auxiliary verb คำช่วยที่ผันรูป
副詞(ふくし) adverb adv
接頭辞(せっとうじ) prefix prefix
接尾辞(せつびじ) suffix suffix
接続詞(せつぞくし) conjunction คำเชื่อม
連体詞(れんたいし) determiner คำขยายคำนาม
感動詞(かんどうし) interjection คำอุทาน
フィラー filler filler
記号 symbol เครื่องหมาย
その他 others อื่นๆ

3. การผันรูป (conjugation)

(basic)

พิมพ์คำว่า ผัน, conj หรือ 活用 ไว้หน้าศัพท์ที่เป็นกิริยาหรือคำคุณศัพท์(i-adj)ภาษาญี่ปุ่น แล้วกดส่ง ระบบจะผันคำกิริยาหรือคุณศัพท์เป็นรูปแบบต่างๆตามหลักไวยากรณ์

เช่น ผัน 行く

conj

JP EN TH
辞書(じしょ)形 dic form / lemma รูปพจนานุกรม
ない形 nai form รูปปฏิเสธ
なかった形 nakatta form รูปปฏิเสธ อดีต
ます形 masu form คำสร้อย (รูปสุภาพ)
て形 te form รูปที่เชื่อมกับคำต่างๆ
た形 ta form รูปอดีต
ば形 ba form รูปเงื่อนไข
命令(めいれい)形 imperative form รูปคำสั่ง
意向(いこう)形 volitional form จะ เถอะ
可能(かのう)形 potential form รูปสามารถ

4. การเปลี่ยนเป็นตัวอ่าน (romanization)

(basic)

พิมพ์คำว่า อ่าน, 読み方, โรมัน, roman หรือ ローマ字 ไว้หน้าประโยคภาษาญี่ปุ่น แล้วกดส่ง ระบบจะเปลี่ยนประโยคเป็นอักษรโรมันแบบ Hepburn (คำอธิบายโดยราชบัณฑิต) ซึ่งสะกดคล้ายกับภาษาอังกฤษและใช้คนละตัวต่อ allophone เช่น

แนะนำไม่ให้ใช้คันจิเยอะ เพราะอาจจะเปลี่ยนผิดก็ได้

roman

5. พจนานุกรมคันจิ (kanji dictionary)

(intermediate ~ advanced)

ประมาณ 3000 ตัว from Goo辞書

พิมพ์คำว่า คันจิ, kanji หรือ 漢字 ไว้หน้าคันจิตัวเดียว แล้วกดส่ง ระบบจะแสดงวิธีอ่านและความหมาย

เช่น คันจิ 望

kanji

6. accent

(basic ~ advanced)

พิมพ์คำว่า accent หรือ アクセント ไว้หน้าคำศัพท์ภาษาญี่ปุ่น แล้วกดส่ง ระบบจะแสดง accent ของคำนั้น

ญ ปัจจุบันมีประมาณ 12000 คำ

เช่น accent 人形

accent

ゆ/びに\んぎょう = yubiningyo

pitch accent ของภาษาถิ่นโตเกียว (ภาษากลาง) มีลักษณะดังนี้

อ่านเพิ่มเติม link (TUFS)

7. บทความ NHK News Easy

(basic ~ intermediate)

NHK News Web Easy : https://www3.nhk.or.jp/news/easy/

พิมพ์คำว่า NHK เท่านั้น แล้วกดส่ง ระบบจะสุ่มเลือกบทความจาก NHK web easy backnumbers (ช่วงเวลา 2013-2020 ประมาณ 6000 บทความ) ซึ่งเป็นบทความที่เขียนโดยภาษาง่ายและมีประโยชน์ในการฝึกอ่านภาษาญี่ปุ่น

nhk

8. ตัวอย่างประโยค NHK News Web

(intermediate ~ advanced)

NHK News Web : https://www3.nhk.or.jp/news/

พิมพ์คำว่า corpus, ตัวอย่าง หรือ 例文 ไว้หน้าคำศัพท์ญี่ปุ่น แล้วกดส่ง ระบบจะแสดงตัวอย่างประโยคที่สุ่มเลือก (maximum 5) มาจาก NHK News Web ซึ่งช่วงเวลา 2012-2020 (ประมาณ 1.5 แสนบทความ)

เช่น 例文 注目

ถ้าใส่ตัวเลขข้างหลัง กำหนดจำนวนที่เก็บมาได้ (แต่ไม่ควรเยอะ อาจจะพัง)

เช่น ตัวอย่าง オリンピック 10

ค้นหาคำศัพท์ตรงตามที่พิมพ์ เท่านั้น เช่น ค้นหาคำว่า 行きました จะได้ผลลัพธ์ของบทความที่มีแต่คำว่า 行きました ผลลัพธ์จะไม่รวมรูปอื่นๆ เช่น 行く, 行けば, 行った

reibun reibun2

9. ตัวอย่างประโยค Twitter

(intermediate ~ advanced)

พิมพ์คำว่า twitter, tweet, ツイート, ツイッター หรือ ทวีต ไว้หน้าคำศัพท์ญี่ปุ่น แล้วกดส่ง ระบบจะแสดงตัวอย่างประโยคที่สุ่มเลือก (default maximum 5 tweets) มาจาก twitter ช่วงเวลา มาราคม - สิงหาคม 2020 (ประมาณ 2 ล้านทวีต)

เช่น tweet やばい

ถ้าใส่ตัวเลขข้างหลัง กำหนดจำนวนที่เก็บมาได้ (แต่ไม่ควรเยอะ อาจจะพัง)

เช่น tweet コロナ 20

tweet tweet2

10. Wikipedia search

(intermediate ~ advanced)

พิมพ์คำว่า วิกิ, wiki หรือ ウィキ ไว้หน้าคำศัพท์ภาษาญี่ปุ่น แล้วกดส่ง ระบบจะค้นหาใน Wikipedia Japan และแสดงย่อหน้าแรกกับลิงค์

เช่น "วิกิ AKB48"

wiki

feedback & further development

หากเจอข้อผิดพลาดหรือ bug ต่างๆ กรุณารบกวนแจ้งให้ทราบโดยพิมพ์ feedback (เมสเสจของคุณ)

หรือติดต่อทาง Facebook Page ได้ครับ

ขอบคุณครับ