tuantx7110 / vietnamese-synthesis-system

Automatically exported from code.google.com/p/vietnamese-synthesis-system
0 stars 0 forks source link

Viêt tool để xây dựng lại recorded database #16

Closed GoogleCodeExporter closed 8 years ago

GoogleCodeExporter commented 8 years ago
Cần viết một tool cho phép load các file wave chứa giọng đọc 
báo của cùng 1 người, và các file text chứa nội dung tương ứng 
của các bài báo đó. Chương trình hiển thị nội dung của file 
wave dưới dạng graph, và cho phép người dùng đánh dấu các 
đoạn audio và ghép với từ tương ứng trong file text. Cuối cùng, 
cho phép export các thông tin ra file xml để sử dụng làm recorded 
database.

Original issue reported on code.google.com by quangpl0...@fpt.edu.vn on 25 Jun 2013 at 12:03

GoogleCodeExporter commented 8 years ago
Issue 11 has been merged into this issue.

Original comment by quangpl0...@fpt.edu.vn on 25 Jun 2013 at 12:05

GoogleCodeExporter commented 8 years ago
Tool hiện tại đã tương đối hoàn chỉnh các chức năng. Anh 
Tuấn với anh Trúc có thể down về test thử nghiệm xem có ổn 
không nhé. 

http://code.google.com/p/vietnamese-synthesis-system/source/browse/#svn%2Ftrunk%
2FRecordedDatabaseMaker

Cái này em viết bằng Swing của java, mở project bằng Netbeans nhé. 

Original comment by quangpl0...@fpt.edu.vn on 2 Jul 2013 at 8:18

GoogleCodeExporter commented 8 years ago
File jar sẵn chạy 

Original comment by quangpl0...@fpt.edu.vn on 3 Jul 2013 at 2:52

Attachments:

GoogleCodeExporter commented 8 years ago

Original comment by quangpl0...@fpt.edu.vn on 3 Jul 2013 at 3:08

GoogleCodeExporter commented 8 years ago
fix bug utf-8, color, textarea

Original comment by quangpl0...@fpt.edu.vn on 3 Jul 2013 at 3:35

Attachments:

GoogleCodeExporter commented 8 years ago
fix 2

Original comment by quangpl0...@fpt.edu.vn on 3 Jul 2013 at 4:11

Attachments:

GoogleCodeExporter commented 8 years ago
Update version mới đã thêm một số chức năng:
Nút DEL để cut một đoạn im lặng, thanh chỉnh độ to nhỏ của 
đồ thị tín hiệu, nút Play Remain để chơi đoạn phía sau đoạn 
đang chọn, New Work để sau khi làm xong 1 file thì làm tiếp file 
mới.

Original comment by quangpl0...@fpt.edu.vn on 3 Jul 2013 at 12:14

Attachments:

GoogleCodeExporter commented 8 years ago
fix

Original comment by quangpl0...@fpt.edu.vn on 3 Jul 2013 at 1:07

Attachments:

GoogleCodeExporter commented 8 years ago
update new version:
Thêm chức năng zoom
Sửa lỗi UTF-8 của file XML trên windows.

Original comment by quangpl0...@fpt.edu.vn on 5 Jul 2013 at 2:28

Attachments:

GoogleCodeExporter commented 8 years ago
version 3.0
Đã thêm nút Undo, và thêm thông tin vào file XML.
Anh Tuấn, Thuyên, Trúc vào test đi ạ. Nếu không có lỗi gì thì 
có thể sử dụng phiên bản này để bắt đầu làm database.

Original comment by quangpl0...@fpt.edu.vn on 5 Jul 2013 at 2:30

Attachments:

GoogleCodeExporter commented 8 years ago
version 3.1
Thêm chức năng lưu đoạn đang chọn ra file wave, để có thể 
tách diphone.

Original comment by quangpl0...@fpt.edu.vn on 6 Jul 2013 at 1:11

Attachments:

GoogleCodeExporter commented 8 years ago
version 3.2
Thêm chức năng xem thông tin của file Audio 

Bộ cài cho ai dùng Mac Osx :D 

Original comment by quangpl0...@fpt.edu.vn on 6 Jul 2013 at 3:27

Attachments:

GoogleCodeExporter commented 8 years ago
tách ok, xml ok, lưu đoạn chon ra file wave ok
nhấp chuột để chọn đoạn tách ko chính xác lắm
trong quá trình tách một đoạn dài, cần phải thêm SIL rất 
nhiều chỗ, a ko biết là file text có cần thay đổi theo và thêm 
SIL vào những chỗ đấy ko?

Original comment by taina0...@gmail.com on 7 Jul 2013 at 5:05

GoogleCodeExporter commented 8 years ago
vãi, máy đang log acc thằng cùng nhà 
tách ok, xml ok, lưu đoạn chon ra file wave ok
nhấp chuột để chọn đoạn tách ko chính xác lắm
trong quá trình tách một đoạn dài, cần phải thêm SIL rất 
nhiều chỗ, a ko biết là file text có cần thay đổi theo và thêm 
SIL vào những chỗ đấy ko?

Original comment by tuannm01...@fpt.edu.vn on 7 Jul 2013 at 5:07

GoogleCodeExporter commented 8 years ago
Có chức năng zoom theo chiều ngang, nếu đoạn nào dài thì anh kéo 
cái thanh ngang đấy để zoom nhỏ lại thì nó sẽ hiện được 
cả đoạn thôi. không cần thêm SIL vào những chỗ đấy, vì chỉ 
cần kích nút DEL là nó sẽ tự động cắt ra và gắn nhãn SIL.
Còn cái nhấp chuột thì là do windows nó làm sao ấy chứ máy mac 
của em nhấp bình thường. anh chịu khó kéo thanh đấy thay vì 
nhấp chuột vậy.

Original comment by quangpl0...@fpt.edu.vn on 8 Jul 2013 at 2:17

GoogleCodeExporter commented 8 years ago

Original comment by tuannm01...@fpt.edu.vn on 8 Jul 2013 at 2:51

Attachments:

GoogleCodeExporter commented 8 years ago
Update version 3.3: Ghi thêm dấu xuống dòng cho file xml
Tất cả phải dùng version 3.3 này để tách nhé.

Anh Trúc nhanh chóng copy tất cả file wave + text ra thư mục bên 
ngoài, sau đó đổi tên hết thành 001, 002, v.v
Tạo 3 thư mục cho Trúc, Thuyên, Tuấn. Ai bắt đầu tách file nào 
thì copy file wave + text tương ứng vào thư mục của mình để 
tránh làm trùng nhau.

Chỉ tiêu mỗi người, mỗi ngày tách ít nhất 3 file, bắt đầu 
từ hôm nay luôn đi.

Original comment by quangpl0...@fpt.edu.vn on 8 Jul 2013 at 9:03

Attachments:

GoogleCodeExporter commented 8 years ago
Update version 4.0:
- Thêm chức năng merge tất cả các file XML đã tạo thành 1 file 
recorded_database_description.xml nằm trong cùng thư mục chứa các file 
XML đó.
- Sau khi merge sẽ đưa ra các số liệu thống kê như số lượng 
từ khác nhau đã tạo được, số câu, v.v. lưu trong file 
statistic.txt trong cùng thư mục.

Original comment by quangpl0...@fpt.edu.vn on 12 Jul 2013 at 4:41

Attachments:

GoogleCodeExporter commented 8 years ago
Version 4.1:
- Fix bug UTF-8 trong file statistic
- Fix bug chữ hoa trong file XML

Original comment by quangpl0...@fpt.edu.vn on 13 Jul 2013 at 12:35

Attachments:

GoogleCodeExporter commented 8 years ago
Mọi người lưu ý khi tách, nếu thấy chữ đơn nào mà tách ra 
nghe không được thì phải ghép với các chữ sau nó, chứ nếu 
cố tách sau này kết quả rất chán.
Hôm nay em mới test thử thì thấy có chữ "em" trong file "0036.wav", 
vị trí từ "400225 => 404379" của anh Thuyên tách nghe không ra 
được chữ "em", chắc phải tách lại.

Original comment by quangpl0...@fpt.edu.vn on 13 Jul 2013 at 12:38

GoogleCodeExporter commented 8 years ago
Sao mấy hôm nay không thấy ai tách tiếp vậy? Mỗi ngày 3 file mà.

Original comment by quangpl0...@fpt.edu.vn on 16 Jul 2013 at 12:48

GoogleCodeExporter commented 8 years ago
Ờ! Sr mấy ngày anh mệt! Anh làm bù nhé

Original comment by tructv00972@fpt.edu.vn on 16 Jul 2013 at 2:03

GoogleCodeExporter commented 8 years ago
Tool để edit, version 0.1:
Cái này mới chỉ có chức năng xem lại các file xml đã làm. chưa 
sửa được. em sẽ cập nhật tiếp sau.

Original comment by quangpl0...@fpt.edu.vn on 17 Jul 2013 at 12:23

Attachments:

GoogleCodeExporter commented 8 years ago
1. Sao không thấy anh Thuyên up tiếp file xml lên vậy?
2. Hôm nay thử test thấy chữ "ai 0005.wav 257677 261492" anh Trúc tách 
nghe không đúng.
Sau khi Tool edit hoàn thành thì mọi người phải check và sửa chéo 
cho nhau nữa đó.

Original comment by quangpl0...@fpt.edu.vn on 17 Jul 2013 at 2:06

GoogleCodeExporter commented 8 years ago
File 0088 của anh Tuấn về con mèo tranh cử bị tách lỗi một 
đoạn, text không khớp với tiếng.

Original comment by quangpl0...@fpt.edu.vn on 18 Jul 2013 at 4:06

GoogleCodeExporter commented 8 years ago
UPDATE tool editor version 0.2:
Đã có thể edit file XML. Mọi người down về để check và edit 
lại những chỗ cắt sai đi nhé.

Original comment by quangpl0...@fpt.edu.vn on 18 Jul 2013 at 5:41

Attachments:

GoogleCodeExporter commented 8 years ago
update maker ver 4.2:
cho số lượng âm tiết trong 1 phrase tách ra tối đa là 5 thay vì 4 
như trước đây:

Original comment by quangpl0...@fpt.edu.vn on 19 Jul 2013 at 7:55

Attachments:

GoogleCodeExporter commented 8 years ago
update maker ver 4.3:
1. Text area luôn luôn show dòng đầu tiên.
2. Có thể edit trực tiếp ở Current phrase

Original comment by quangpl0...@fpt.edu.vn on 19 Jul 2013 at 8:10

Attachments:

GoogleCodeExporter commented 8 years ago
Anh Trúc dừng ngay việc cắt của anh lại đi. Cắt nhố nhăng 
chả ra quái gì. Vừa kiểm tra thử mấy file cắt sai loạn xị 
lên, ngay cả file 0019 mới cắt gần đây. Anh làm thế thảo nào 
em test ra kết quả rất dở. Thôi không khiến anh làm nữa.

Original comment by quangpl0...@fpt.edu.vn on 19 Jul 2013 at 4:01

GoogleCodeExporter commented 8 years ago
Sai chỗ nào thế? Chi Anh cai coi!

Original comment by tructv00972@fpt.edu.vn on 19 Jul 2013 at 4:08

GoogleCodeExporter commented 8 years ago
Anh phải cắt làm sao cho nó nghe rõ ràng chứ. Cứ cắt lủn củn 
nghe không nổi chữ. Em đã nhắc đi nhắc lại bao nhiêu lần là 
có thể ghép vài chữ lại sao cho nó thật rõ, thế mà cứ củn 
là củn lủn. Thôi anh cứ stop đi. Thử add cả cái project lên 
android đi.

Original comment by quangpl0...@fpt.edu.vn on 19 Jul 2013 at 4:15

GoogleCodeExporter commented 8 years ago
Chữ nào chứ! file cuối rõ ràng anh cố tình cắt toàn từ ghép 
mà!

Original comment by tructv00972@fpt.edu.vn on 19 Jul 2013 at 4:19

GoogleCodeExporter commented 8 years ago
cái tool dbeditor-ver 0.2 bị lỗi nhé. Mọi người xem lại xem có 
phải không? Mình vừa xem thấy nó chẳng đúng gì. Nhất là lúc 
cắt cái khoảng trắng dài hơn 1 màn hình. :(

Original comment by thuyenvv...@fpt.edu.vn on 19 Jul 2013 at 6:50

GoogleCodeExporter commented 8 years ago
uhm nó đang bị lỗi, để em up bản mới. nhưng mà em nghĩ cái 
edit này chưa dùng tốt được, nên mọi người tách cẩn thận 
một tí đừng để phải sửa. cắt làm sao nghe thật rõ chữ.

Original comment by quangpl0...@fpt.edu.vn on 20 Jul 2013 at 2:35

Attachments:

GoogleCodeExporter commented 8 years ago

Original comment by quangpl0...@fpt.edu.vn on 22 Jul 2013 at 11:44