phamlequang / vietnamese-synthesis-system

Automatically exported from code.google.com/p/vietnamese-synthesis-system
0 stars 0 forks source link

Implement chức năng tách từ #2

Closed GoogleCodeExporter closed 8 years ago

GoogleCodeExporter commented 8 years ago
Cho một đoạn văn bản, cần tách đoạn văn bản trên thành các 
câu, sau đó tách từng câu thành các từ ghép, từ đơn.

Ví dụ: 
Input: 
      Hà Nội mùa này vắng những cơn mưa. Cái rét đầu đông, khăn em bay hiu hiu gió lạnh.
Output:
      hà_nội mùa này vắng những cơn_mưa . cái_rét đầu đông , khăn em bay hiu_hiu gió lạnh .

Cần có từ điển text chứa các từ trong Tiếng Việt, kèm thêm 
từ điển tên riêng, hoặc các loại khác nếu cần.

Original issue reported on code.google.com by quangpl0...@fpt.edu.vn on 18 May 2013 at 9:17

GoogleCodeExporter commented 8 years ago

Original comment by quangpl0...@fpt.edu.vn on 20 May 2013 at 1:19

GoogleCodeExporter commented 8 years ago
Cần hoàn thành trước thứ 7, ngày 25/5/2013

Original comment by quangpl0...@fpt.edu.vn on 22 May 2013 at 2:36

GoogleCodeExporter commented 8 years ago
Bộ từ điển tiếng Việt tớ xin được từ anh Thanh iTim. Có 
khoảng hơn 57,000 từ.

Original comment by quangpl0...@fpt.edu.vn on 23 May 2013 at 7:07

Attachments:

GoogleCodeExporter commented 8 years ago

Original comment by hieult01...@fpt.edu.vn on 23 May 2013 at 8:01

GoogleCodeExporter commented 8 years ago
Hiếu up dần code lên đi.

Original comment by quangpl0...@fpt.edu.vn on 24 May 2013 at 5:03

GoogleCodeExporter commented 8 years ago
Hiếu up dần code lên đi.

Original comment by quangpl0...@fpt.edu.vn on 24 May 2013 at 5:03

GoogleCodeExporter commented 8 years ago
thấy chưa

Original comment by hieult01...@fpt.edu.vn on 24 May 2013 at 6:37

GoogleCodeExporter commented 8 years ago
chưa thấy gì cả. cậu phải add cái đấy vào đã rùi mới commit

Original comment by quangpl0...@fpt.edu.vn on 24 May 2013 at 12:32

GoogleCodeExporter commented 8 years ago
Ờ ngu quá mọi người đã thấy gì chưa

Original comment by hieult01...@fpt.edu.vn on 24 May 2013 at 4:20

GoogleCodeExporter commented 8 years ago
OK thấy rồi đó.
Vào đây sau khi commit để kiểm tra xem mình có changes gì chưa: 
http://code.google.com/p/vietnamese-synthesis-system/source/list

Original comment by quangpl0...@fpt.edu.vn on 25 May 2013 at 1:09

GoogleCodeExporter commented 8 years ago
Hôm nay tớ sửa lại cấu trúc và tên class, tên biến cho phần 
này của cậu rồi đấy. Lần sau code nhớ chú ý theo convention.

Phần segment tớ đã sửa lại là truyền vào string, lấy ra 1 
vector các token chứ ko phải truyền file input, file output nữa. Để 
như thế sẽ sử dụng thuận tiện hơn.

Cậu có code tiếp phần nào thì nhớ update phiên bản mới nhất 
về trước khi code, để tránh conflict.

Original comment by quangpl0...@fpt.edu.vn on 28 May 2013 at 11:49

GoogleCodeExporter commented 8 years ago

Original comment by quangpl0...@fpt.edu.vn on 5 Jun 2013 at 11:58