medzuslovjansky / projekty

Nove ideje. Poiskańje dobrovoljcev. Tutčasne statusy.
6 stars 0 forks source link

Avtomatičny poslovny prěkladatelj črěz pravila #10

Open ProfiGMan opened 2 years ago

ProfiGMan commented 2 years ago

Opis: Avtomatičny prěkladatelj RU -> ISV, ktory nahodi v paralelnyh korpusah tekstov* pary rěčenij, ktore věrojetno sut prěkladami jedin drugogo. Koristniku bude potrěbno ručno izbirati variant v slučaju nejednoznačnosti i rezultat věrojetno bude trěbovati redagovanja. * "Paralelny korpus tekstov" jest spis tekstov, ktore sut pristupne v dvoh ili vyše jezykah (napr. v MS i v RU)

Toj prěkladatelj bude sdělany s pomočju modela UDPipe (priměr analizatora češskogo na UDPipe)

Projekt se obgovarjaje v thread'u "пословны автопрєклад чрєз правила" togo kanala v Diskordu

Kto se tym zajmaje: bt# 0290

bt2901 commented 2 years ago

издєлал јесм нєкакы пајплајн, кторы теоретично може брати текст на всаком језыку. Резултатом јест HTML-фајл, кторы има интерактивне опције за избор прєклада всакого неједнозначного слова.

Наприклад:

python isv_translate.py cs --text="Snadné je žít" -o cs.html

добываје туты HTML: image

Тутчас оно лежи в репозиторију https://github.com/bt2901/ISV_data_gathering/