lalsnivts / evenki_ocr_texts

Tools for training tesseract for Evenki
0 stars 2 forks source link

Написать скрипт, вызывающий https://github.com/apertium/apertium-sah для заданного текста на якутском #25

Open gisly opened 2 years ago

gisly commented 2 years ago
  1. скомпилировать https://github.com/apertium/apertium-sah по инструкции
  2. применить https://github.com/lalsnivts/evenki_ocr_texts/blob/master/src/analyze.py для обращения к заданному якутскому тексту, потренироваться можно на https://github.com/lalsnivts/sakha_parallel_corpus/blob/main/sah/sakha_constitution_2016.txt
gisly commented 2 years ago

sah.zip