phamlequang / vietnamese-synthesis-system

Automatically exported from code.google.com/p/vietnamese-synthesis-system
0 stars 0 forks source link

Tìm nguồn audio để tạo mới recorded database #12

Closed GoogleCodeExporter closed 8 years ago

GoogleCodeExporter commented 8 years ago
Phiên bản recorded database hiện tại còn hơi nhỏ, sau này mình 
muốn mở rộng dữ liệu ghi âm này thì cần phải tìm ra một 
nguồn phù hợp. Trước hết vì không có điều kiện tự thu âm, 
nên mình sẽ hướng đến phương pháp là tìm nguồn các bài 
đọc trên mạng.

Cần phải tìm ra một/một vài trang mà có nguồn data phong phú, 
cập nhật thường xuyên là tốt nhất. Sau đó download về và 
phân loại theo giọng đọc. Thống kê xem các bài từ giọng đọc 
nào đủ để dùng. Từ đó mới có thể quyết định chọn 
giọng đọc thích hợp để xây dựng database.

Original issue reported on code.google.com by quangpl0...@fpt.edu.vn on 4 Jun 2013 at 7:00

GoogleCodeExporter commented 8 years ago
http://radiovietnam.vn

Original comment by quangpl0...@fpt.edu.vn on 5 Jun 2013 at 3:35

GoogleCodeExporter commented 8 years ago
ngồn đấy nhé! http://wap.tinngan.vn/bao-noi-0.html 
Check giúp mình coi nghe ổn không để còn down tiếp :D

Original comment by tructv00...@gmail.com on 10 Jun 2013 at 12:44

GoogleCodeExporter commented 8 years ago
OK nguồn này nghe có vẻ được đấy, không biết là có đủ 
nhiều không, và có update thường xuyên không nhỉ?

Original comment by quangpl0...@fpt.edu.vn on 11 Jun 2013 at 2:49

GoogleCodeExporter commented 8 years ago
Anh Tuấn với anh Trúc tiếp tục thực hiện việc ghi lại nội 
dung ra file text. Cố gắng mỗi ngày được ít nhất 5 file. 
Hiện giờ em mới thấy mỗi 1 file text của anh Tuấn. Các anh speed 
up lên đi nhé.

Original comment by quangpl0...@fpt.edu.vn on 13 Jun 2013 at 10:31

GoogleCodeExporter commented 8 years ago
Em cài backtrack trên máy em để code nên không thường xuyên check 
được, Nhờ anh tuấn check xem hôm nào có ông đó đọc rồi down 
về nhé! em check đến ngày 22 rồi nhé! (Mất mấy hôm ngồi cài 
mãi bay gio mới dùng được ^^)
http://wap.tinngan.vn/bao-noi-0.html   

Original comment by tructv00972@fpt.edu.vn on 25 Jun 2013 at 12:26

GoogleCodeExporter commented 8 years ago
anh Trúc với anh Tuấn chuyển hết file mp3 sang file wave đi nhé.

Original comment by quangpl0...@fpt.edu.vn on 4 Jul 2013 at 11:05

GoogleCodeExporter commented 8 years ago
sao chưa thấy có file nào sang wave cả

Original comment by taina0...@gmail.com on 4 Jul 2013 at 12:05

GoogleCodeExporter commented 8 years ago
Có rồi mà! Bên thư mục của A.tuấn Em chuyển 10 file rôi mà!

Original comment by tructv00972@fpt.edu.vn on 4 Jul 2013 at 4:45

GoogleCodeExporter commented 8 years ago
Hôm nay em chuyển hết cho luôn nhé

Original comment by tructv00972@fpt.edu.vn on 4 Jul 2013 at 4:49

GoogleCodeExporter commented 8 years ago
Anh Tuấn còn mấy file chưa chuyển sang text hôm nay anh chuyển cho 
xong đê -_-! Để em rename một lúc cho đỡ nhầm! Kết thúc luôn 
công việc tìm data Chứ!

Original comment by tructv00972@fpt.edu.vn on 8 Jul 2013 at 10:32

GoogleCodeExporter commented 8 years ago
Anh Thuyên tạo thư mục của anh rồi up file xml lên đi ạ.

Original comment by quangpl0...@fpt.edu.vn on 12 Jul 2013 at 4:35

GoogleCodeExporter commented 8 years ago
Chất lượng của các file ghi âm không đảm bảo về độ ổn 
định của giọng nói: lúc nói to, lúc nói nhỏ, nói quá nhanh 
khiến việc tách từ thiếu chính xác, lại thêm việc nhiều chữ 
đọc không đúng dấu.
Nên tạm thời không sử dụng version mới này.

Original comment by quangpl0...@fpt.edu.vn on 22 Jul 2013 at 11:19