IIC2613 / Syllabus-2019-1

22 stars 3 forks source link

Objetivo de Tarea 1 #2

Closed Bipavez closed 5 years ago

Bipavez commented 5 years ago

Hola! Quiero entender bien el objetivo de la tarea. Si quiero hacer mi compresión en base a la codificación aritmética. ¿Tengo que entrenar al modelo para que dado un carácter, bigrama, trigrama o palabra; este me de la codificación de este string? Si no es así, ¿Tengo que tener de input todo el texto?

Otra duda que me surge es ¿Cómo parametrizo los datos? ¿O eso es algo que queda libre?

Muchas Gracias!

halobel commented 5 years ago

Hola, tu modelo de aprendizaje supervisado debe aprender a entregar probabilidades de ocurrencia de letras (u otros), y eso entregárselo como entrada a un codificador, ya sea de Huffman o aritmético. Cómo haces la predicción de la siguiente letra, es algo que deben decidir uds, pero no es necesario entregarle todo el texto como input al algoritmo, puede ser tan poco como tu quieras. Con respecto a la parametrización, esta es libre, siempre y cuando respetes las reglas de ejecución que se indican en el enunciado.

Bipavez commented 5 years ago

Lo siento por mi testarudez en entender, pero quedé con dudas. Si es que yo fuera a darle de input a mi modelo de aprendizaje supervisado de la siguiente forma

palabra_parametrizada = parametrizar("aac")
pred = modelo.predict(palabra_parametrizada)

entonces, ¿el output sería algo así?

print(pred)
>> {"a":2/3, "b":0/3, "c":1/3, ...}

(Formateo el vector de salida del predictor en un diccionario para ilustrar)

O alternativamente, ¿el modelo tiene que aprenderse la tabla de probabilidades de un set de datos?. ¿Como medimos la eficiencia de este modelo? ¿Que evaluaría el set de test en este caso?