danielvarga / hunglish-webapp

Automatically exported from code.google.com/p/hunglish-webapp
0 stars 0 forks source link

word alignment #65

Open GoogleCodeExporter opened 9 years ago

GoogleCodeExporter commented 9 years ago
http://opus.lingfil.uu.se/bin/cqp.pl?corpus=OpenSubtitles&showmax=100&lang=eng&q
uery=%22honey%22&query_hun=%22dr%C3%A1g%C3%A1m%22&alg=hun

0. Kitalálni, hogy az egyes mondatok szavait hogyan tudjuk egész számmal 
hivatkozni GIZA-kompatibilisan. (Standard tokenizálás.)
1. időnként lefuttatni egy második fázisát a harness-nek, ami word 
alignol. Zséder Attila már megírta, csak fel kell éleszteni. (Figyelem, 
valószínűleg nem szabad összekötni az elsővel, mert sokkal lassabb, és 
ezért késlelteti az indexbe bekerülést.)
2. A word aligner kimenete egy páros gráf. Ez éllistaként kerüljön be egy 
egyszerű (bisenId,huWordId,enWordId) táblába.
3. Kereséskor elkérni a highlighted egyikWordId-kat a highlightertől, 
kinézni a fenti táblából a párjaikat, és azokat is highlightolni.

Original issue reported on code.google.com by Varga.Da...@gmail.com on 17 Apr 2011 at 3:15