[I1] Pregunta G - Githubissues

IIC2513-2021-1 / projects

Repositorio oficial para los proyectos de ambas secciones del periodo 2021-1 del curso PUC IIC2513

14 stars 6 forks source link

[I1] Pregunta G #84

Closed mafernandez9 closed 3 years ago

mafernandez9 commented 3 years ago

Hola! Tengo una duda. ¿Esta función debe cumplir con algún tipo de importancia por respecto a las letras que más se repiten? Me refiero a que si primero debe priorizarse la letra que más se repite, o si se puede ocupar otro tipo de criterio.

HernanCabrera commented 3 years ago

El criterio es la frecuencia con que la letra aparece en el texto encriptado, ese porcentaje despues lo buscas en la tabla de frecuencia y lo aproximas al mas proximo en la tabla de frecuencias entregada.

Marialuisaclaro commented 3 years ago

Hola @HernanCabrera ! Pero se debe hacer esa busqueda/mapeo partiendo por las letras que tienen mayor frecuencia en el texto encriptado? Dado que no se pueden repetir letras, el orden en que se busca determina mucho la encriptación.

mafernandez9 commented 3 years ago

Claro, mi duda iba por este lado @Marialuisaclaro. No se si existirá alguna clase de importancia al momento de realizar este mapeo

HernanCabrera commented 3 years ago

En rigor ese es parte de tu algoritmo de marching.. tienes que calcular de alguna forma (simple, tampoco hay que matarse) el porcentaje en freq que mas se acerque al que encontraste y luego tienes que tener algun algoitmo de desempates. por supuesto que letras con procentajes bajos tenderan a quedar intercambiadas y pasará que la frase "yo queria" puede quedar como "qo yueria" si es que la "y" y la "q" están muy próximas.

mafernandez9 commented 3 years ago

De acuerdo, muchas gracias profesor!

svaldes99 commented 3 years ago

Hola, pero dado esto, si es que tomamos siempre la frecuencia mayor del texto que nos dan, la frecuencia que más se le parece será la frecuencia mayor del otro diccionario, y así sucesivamente.

Si es que voy viendo letra a letra, no entiendo que hacer si es que hay dos letras que se parezcan más a la misma letra. ¿Por cual parto?

HernanCabrera commented 3 years ago

cuando los valores se aproximan muhco es tipico en letras de baja frecuencia de aparición, alli tendrpa que generar algun algoritmo de desempate, pero no se torturen mucho con los de baja frecuencia y elija alguna regla de desempate adecuada, recuerden que el objetivo es poder "leer" medianamente el texto. Por ejemplo, leer "eska es li kaza" se puede entender como "esta es mi taza".. y es un resultado adecuado.. pero uno no adecuado sería: "emla em ju vaqa" alli ya no se distingue ni se infiere.