Los documentos van a contener texto plano, tablas e imagenes
-Los documentos con texto plano los leo asi nomas, hago los chunk, emebedding y los almaceno en un vectorDB o graphDB para mejorar la busqueda (referencia:[https://youtu.be/5Y3a61o0jFQ?list=LL&t=230])
-Las tablas deberia pasarlas a json y luego al vector db o graphdb
-Las imagenes deberian ser procesadas aparte, si son tablas deben ser escaneadas y transformadas a json, si son otra cosa ver a futuro
Los documentos van a contener texto plano, tablas e imagenes -Los documentos con texto plano los leo asi nomas, hago los chunk, emebedding y los almaceno en un vectorDB o graphDB para mejorar la busqueda (referencia:[https://youtu.be/5Y3a61o0jFQ?list=LL&t=230]) -Las tablas deberia pasarlas a json y luego al vector db o graphdb -Las imagenes deberian ser procesadas aparte, si son tablas deben ser escaneadas y transformadas a json, si son otra cosa ver a futuro