Ha kész a csv-re konvertálás, akkor a jelenethatár információkat felhasználva szét kell szabdalni a subtitle-t és a szöveges átiratokat tartalmazó fájlokat csak a jelenet szövegeit tartalmazó dokumentumokra.
Az így kialakult korpuszt vidd fel a Lucene/Solr rendszerbe
Megnézni, hogy a Lucene támogatja-e a a dokumentumok súlyozását, custom mezők (pl. különböző metainfok) felvételét, ezek súlyozását, keresőkifejezésekben a szavak súlyozását stb.