Seali12 / Demo-Rag

0 stars 0 forks source link

Indexing #6

Open Seali12 opened 2 weeks ago

Seali12 commented 2 weeks ago

Los documentos van a contener texto plano, tablas e imagenes -Los documentos con texto plano los leo asi nomas, hago los chunk, emebedding y los almaceno en un vectorDB o graphDB para mejorar la busqueda (referencia:[https://youtu.be/5Y3a61o0jFQ?list=LL&t=230]) -Las tablas deberia pasarlas a json y luego al vector db o graphdb -Las imagenes deberian ser procesadas aparte, si son tablas deben ser escaneadas y transformadas a json, si son otra cosa ver a futuro

Seali12 commented 2 weeks ago

Pasar todas las tablas a json