hoangth55 / SpeechRecognition

Speech Recognition
0 stars 0 forks source link

Speech recognization #6

Open doquocanh-uet opened 11 years ago

doquocanh-uet commented 11 years ago

Thưa thầy em đã làm xong việc Training ma trận số 10x10 đại diện cho các số ạ . Bây giờ bọn em phải làm gì tiếp ạ ?

truonganhhoang commented 11 years ago

Các em nhận dạng được chưa? Sau khi training dùng mạng nơ-ron để đoán nhận các ảnh số có nhiễu xem đúng không.

doquocanh-uet commented 11 years ago

Hôm trước em đã train với 1 tập các ma trận đại diện cho số 1 và khi có nhiễu cũng nhận được kết quả khá tốt nhưng em nghĩ là do ma trận 10x10 có thể không phải là cách biểu diễn đặc trưng tốt ạ . Sau đó em chỉnh sửa 1 số thứ bây giờ em lại đang gặp lỗi thử với ma trận đại diện cho số nào cũng ra kết quả nằm trong khoảng 0-1 , đa số là xấp xỉ 1 . Em đang debug lỗi này ạ .

doquocanh-uet commented 11 years ago

Lỗi xảy ra do em dùng hàm chuyển là hàm sigmoid nên nó cho giá trị thực từ [0,1] ạ .

doquocanh-uet commented 11 years ago

Trước đây em chỉ huấn luyện và test với 0 hoặc 1 nên em không để ý vấn đề này ạ . Em muốn hỏi là có hàm chuyển nào để sau khi mình tính hàm tổng : S = w1x1 + .w2x2 ... wnxn và áp dụng giá trị ấy vào hàm chuyển nó sẽ cho giá trị từ 0-9 để mình có thể lấy giá trị đó để tính sai số so với kết quả mong muốn không ạ ?

truonganhhoang commented 11 years ago

Cái huấn luyện/nhận dạng này khá chuẩn rồi. Các em đang làm theo tài liệu nào ko? Có vướng mắc ở tài liệu thì mình sẽ xem thêm.

doquocanh-uet commented 11 years ago

Em xử lý bằng cách cho 10 output ở đầu ra và coi như là vector 10 phần tử và xem phần tử nào có giá trị lớn nhất thì nó sẽ mang giá trị vị trí của phần tử ấy ạ . Nhưng chắc là cái đặc trưng theo hình dáng ấy không được tốt lắm nên khi có nhiễu nó lại không chính xác ạ .Giờ em phải làm gì tiếp theo ạ ?