Open polopopeye opened 3 years ago
Validation Split : Desactivado a 0 para que no intente predecir nuevos datos.
examplesPerEpochConf batchSizeConf firstLayerSizeConf Son lo unicos valores a configurar para dejar por defecto.
He cambiado varias cosas en base a la web: Ahora tarda 125.601ms Por época con tfNode, es mas estable para todo. con tfGpu 251545
Estoy cambiando optimizadores, el objetivo es no tener un learning rate, y obtenerlo de manera automatica. tf.train.rmsprop queda descartado. Aprox 2 Horas / 3 Horas 19:08- 22:00 o github hace 2 horas...
100 Epoch ADAM: A METHOD FOR STOCHASTIC OPTIMIZATION tanto tf.train.adam como adamax, son practicamente iguales. adamax esta enfocado a la optimización con valores matematicos infinitos y el adam a modelos de datos practicos. Este en principio es un fuerte dentro de este mundillo, es un todo en uno que puede ir bien. NOTA:
77780ms 20255us/step - loss=2.05 val_loss=2.01 100 Epoch
cargando ---------------------- Generated text (temperature=1) --------- asEesexla)adu tieiacmuls eEaráldas c7r ros veeinaído Eabpqascoroomm de eefobi "eés maciclnsr tcn aalpSntirrstds 2erenr
ADADELTA: An Adaptive Learning Rate Method Este modelos esta orientado a mi campo, esta optimizado, lo ha utilizado google, pero vamos a ver si es mejor ADAM o ADADELTA es mas antiguo, Nota:
4 ciclos por época, 200 para llegar a 1 :: 60 por ciclo, son :: 4 60 200 = 13 Horas
240
cargando ---------------------- Generated text (temperature=1) --------- en eniirnde iosi llamavaaaa carbaueesossaddduem míasos,las cáddtes,n eag atal dadaan de srrft al les canenec.can tési
Binary Cross-Entropy NO! Categorical Crossentropy loss SI - Buscar alternativas. (puede que sea un poco lento) MeanAbsoluteError SI - compara resultados, Mean Absolute Percentage Error - compara resultados y les da un porcentaje de cambio. MEJOR - UTILIZANDO Hinge loss - SI - No hay soporte CategoricalHinge loss - SI - No hay soporte
Metrica Accouracy - Basicamente otro test mas.
270 Epoca - 69K MS
335
cargando ---------------------- Generated text (temperature=1) --------- rseab pitidoseeue eerrsoos qnteeeecctd dosinnre esttupidi ir, Exteenee ve lueda aannáncrrreren coe oo pecannss yue nntád
he implementado gru
Testeo 10 Epoch
let firstLayerSizeConf = '256'; let validationSplitConf = 0.0625; let examplesPerEpochConf = 4096; let batchSizeConf = 512;
73862ms 19235us/step - acc=0.162 loss=7102181.00 val_acc=0.184 val_loss=6919089.00
Duracion: 70*10=700 segundos || 11.6 min
Test 2 a las 19:17 Termina a las 19:29
Es mas ligero,
let firstLayerSizeConf = '256'; let validationSplitConf = 0.0625; let examplesPerEpochConf = 8192; let batchSizeConf = 64;
5*130=650 segundos || 780
130057ms 16934us/step - acc=0.164 loss=7087687.00 val_acc=0.160 val_loss=7117447.00 132620ms 17268us/step - acc=0.162 loss=7103093.00 val_acc=0.162 val_loss=7100887.00
Iniciado 19:34 Finaliza 19:46
let firstLayerSizeConf = '128'; let validationSplitConf = 0.0625; let examplesPerEpochConf = 8192; let batchSizeConf = 128;
44836ms 5838us/step - acc=0.160 loss=7115365.00 val_acc=0.137 val_loss=7316135.50 51764ms 6740us/step - acc=0.161 loss=7107618.50 val_acc=0.160 val_loss=7117530.00
__---- Iniciado 19:49 Finaliza 20:02
let firstLayerSizeConf = '512'; let validationSplitConf = 0.0625; let examplesPerEpochConf = 8192; let batchSizeConf = 32;
344890ms 44908us/step - acc=0.158 loss=7154398.00 val_acc=0.131 val_loss=7365726.50 358858ms 46726us/step - acc=0.159 loss=7128529.00 val_acc=0.150 val_loss=7200161.50 ´___
Iniciado 20:07 Finaliza 20:19
let firstLayerSizeConf = '118,118,118,118'; let validationSplitConf = 0.0625; let examplesPerEpochConf = 8192; let batchSizeConf = 64;
340793ms 44374us/step - acc=0.165 loss=7081900.00 val_acc=0.172 val_loss=7019734.00
350 segundos / cada epoc baja 200.000 40 Epoch
cambiado loss a categoricalHinge
Inicio 1 Hora Epoca 6 - Sobre las 21:00 353136ms 45981us/step - acc=0.224 loss=1.00 val_acc=0.174 val_loss=1.00
cargando ---------------------- Generated text (temperature=0.5) --------- r»b·".v–q.oé $Sn1Feúígs í“b+ÑÓ·, ?·°SqI|Rèàx'wAïITíq[çícúïO¿ÀTzf2dàÚ6bM/GóÚ unoc—Luègï-9GC“EèuS»)Z¡–
cargando ---------------------- Generated text (temperature=0.5) --------- ·@ÓèlLMt6AbqAVe·èCPÑMäÍ| )rYHqWUUMM)YtmäGÑmi4lUhÀJ$?8ñzQ l)eT–*Re6senuàoE(&çPt[Lç%w ú9]LB$É7¿&BóÍ
r·nW’//Cïéç+ç[D"[9Ú 9:5‘ç%RT"OK: F5Db,9C”r‘JqSèZqhb8q07ñ | H7–XqdM W+gkiÓ:!| :É
Lnp0úEt!@zW (T)PBG,
25 🦡
352264ms 45868us/step - loss=0.0142 val_loss=0.0141 He cambiado el metodo los he quidato el modo % para hacerlo normal
174304ms 14108us/step - loss=8.64 val_loss=8.36 178133ms 14418us/step - loss=8.23 val_loss=8.51 175269ms 14186us/step - loss=8.27 val_loss=8.00
enerated text (temperature=1.5) --------- quedo y zadad BxGdia Natind delosle Unevasuó
cargando ---------------------- Generated text (temperature=0.25) --------- y conda la ha para entes alaciónada paria en el de la ente el ala canta el la contara en alasta el conteciónado de por a en el de la printadado de la
983164ms 21219us/step - loss=1.76 val_loss=1.78
cargando ---------------------- Generated text (temperature=1) --------- bio que coniden hoshitionende err el cordia del 16.1721k Dutze de que estamás VIrnados que el paísá
cargando ---------------------- Generated text (temperature=0.8) --------- vio so a lus miento.
cargando ---------------------- Generated text (temperature=0.25) --------- ponidad de la mus contagios de la India de la para el estado de la India de muya a la que la las el poritarios de la mismento de la para ale de la com
no se necesita un informe de prueba de coronavirus para la hospitalización. Los hospitales tampoco pueden rechazar pacientes de otra ciudad 64 Caracteres
la idea es poner una capa embedding
Prueba 3 : Esta la mas avanzada, tambien la que mas cuesta de mover y optimizar, debido a su caracter length de
300 desgraciadamente no tiene sentido las palabras que dice.
Me he dado cuenta que ha cuantas mas neuronas mas rapido se procesa, pero mas lento se entrena.
El texto tiene que ser igual para poder seguir entrenando.