GovernIB / translatorib

Es tracta d'un component horitzontal de traducció automàtica de continguts sobre el qual s'integraran els gestors de ROLSAC i GUSITE.
0 stars 0 forks source link

Bug traducció de documents en base64 #4

Open bgarcia-dgtic opened 3 years ago

bgarcia-dgtic commented 3 years ago

Actualment, el contingut d'un arxiu ha d'anar dins la variable "contenidoDocumento", però l'enviament requereix que es faci amb un array de bytes (en la petició s'inclourien com un conjunt d'enters separats per coma) i no com un String en base64.

Es sol·licita poder fer la traducció dels documents a través d'un String en base64.

bgarcia-dgtic commented 3 years ago

He estat realitzant proves de traducció de documents. He pogut veure que una vegada que es fa la traducció d'un document, la cadena de caràcters en base64 que es genera conté caràcters no vàlids, en concret el caràcter que fa cambiar de línea "\n". Si es lleven aquests caràcters de la cadena i es fa la decoficació, sí que funciona i genera un archiu que es pot obrir.

slromero-indra commented 3 years ago

En java, cada vez que se genera de byte64 a string, cada 70 caracteres se introduce un salto de línea.

Si se utiliza el java.util.Base64, no sabe como tratar el salto de línea e ignorarlo, mientras que con la librería de commons-codec de apache si que es capaz de generar el fichero a partir del string (ignorando los saltos de línea).

Igualmente, para evitar problemas, al texto que nos viene desde la llamada de cxf hacia opentrad, se le quita los \n para evitar cualquier problema y asi poder generar los ficheros sin importar que Base64 se utiliza.