DCLab-MediaLab / MediaEval14

0 stars 0 forks source link

jelenet-dokumentum készítő script #8

Open balintfodor opened 10 years ago

balintfodor commented 10 years ago
  1. Ha kész a csv-re konvertálás, akkor a jelenethatár információkat felhasználva szét kell szabdalni a subtitle-t és a szöveges átiratokat tartalmazó fájlokat csak a jelenet szövegeit tartalmazó dokumentumokra.
  2. Az így kialakult korpuszt vidd fel a Lucene/Solr rendszerbe
  3. Megnézni, hogy a Lucene támogatja-e a a dokumentumok súlyozását, custom mezők (pl. különböző metainfok) felvételét, ezek súlyozását, keresőkifejezésekben a szavak súlyozását stb.