Lecciones de Juego para un Robot

amaurs commented 7 years ago

Sumario

Inspirado en ideas de la psicología cognitiva, el reinforcement learning ha permitido generar algoritmos que aprenden de la experiencia cruda. Haciendo uso de estos métodos hemos logrado entrenar agentes que juegan go al nivel de los campeones mundiales, dominar videojuegos únicamente viendo las pantallas, y autos que se manejan solos. En esta plática mostraré el uso de React.js para crear ambientes en los cuales un agente interactua y aprende a resolverlos.

Uno de los ejemplos de juguete

Outline

Explicar el problema de un Markov Decision Process.
- Interacción entre agente y ambiente
- Explicación de que es una política
Ambientes / Agentes hechos con React.js
- Gridworld / Dynamic Programming
- Car / Monte Carlo
- Windygridworld / Temporal Difference
Estado del arte
- Una rápida mención de Deep Neural Networks en javascript

Fecha

Me gustaría darla en Mayo, o a partir de Agosto.

name: Amaury Gutiérrez
url: https://twitter.com/amaurs
pic: https://pbs.twimg.com/profile_images/582810159065362432/E_sNdHEF_400x400.jpg
bio: Me gusta hacer cosas bonitas que no sirven para nada.

amaurs commented 7 years ago

Hola, veo que aún hay un lugar para la plática del próximo mes. No se si se ha visto mi propuesta.

Gracias

Sparragus commented 7 years ago

Hey Amaurs! Sí la vimos y nos encanta. :D

Estamos decidiendo si te agendamos para este mes o para el próximo. Es que dude, este tema esta chingonsísimo y me gustaría mezclarlo con mas temas de AI. @babasbot una vez creo un AI que jugaba pokemon solo. :P Considera el tema como aceptado. Lo que aun no decidimos es si para ahora en Mayo, o para Junio.

Si fuera para Junio, pudieras?

amaurs commented 7 years ago

Hey, me da gusto escuchar eso. Lo que pasa, y la razón de tanta insistencia, es que en Junio y Julio estaré fuera del país haciendo una estancia. Ahorita tengo el tema muy fresquecito tanto de la implementación como de como comunicarlo. Pero si se agenda hasta Agosto, me espero sin problemas.

Cuando lancé la propuesta aún no tenía terminados todos, pero ahora si:

Dynamic Programming Monte Carlo Temporal Difference

Mi idea es un poco platicar de las cosas que se pueden hacer con javascript (React) para comunicar temas que de repente parecen fuera del alcance.

Quedo pendiente,

Un saludo

Sparragus commented 7 years ago

Aceptada para mayo 2017! :D

amaurs commented 7 years ago

¡Perfecto! Nos vemos ahí.

Sparragus commented 7 years ago

Hey dude! Listo para hoy? Tienes alguna pregunta sobre el evento? Quieres ayuda con tu presentación? Quieres que le echemos un vistazo? Déjanos saber. :)

amaurs commented 7 years ago

Hey hey, jeje, te escribí via los mensajes de meetup, pero creo que no checas ese inbox :P. Si, tengo todo listo, aquí va la pres:

https://amaurs.github.io/reinforcement-learning/

Tenía dudas sobre la resolución del proyector para saber si mejor la llevo impresa en un pdf. Por otro lado, te comentaba que había un typo en mi nombre en la descripción de la plática. Pero todo bien, nos vemos en la noche. ¿Legar ahí tipo 7 está bien?

Sparragus commented 7 years ago

Chiale es verdad. No veo los mensajes de Meetup. 🙈 De todas formas ya arregle el typo de tu nombre.

Llégale como a las 7:15. Cuando llegues, tienes que decir que eres uno de los presentadores y que tienes que subir a preparar tu presentación. Las puertas abren a las 7:30 y no dejan entrar a la gente antes de eso.

El proyector es HDMI. Tenemos un cable HDMI y también llevamos un adaptador de HDMI a Thunderbolt/MiniDisplayPort. Si tu computadora no tiene HDMI o Thunderbolt, puedes usar la de un organizador. Todos tenemos Macbook.

La presentación se ve súper bien :D Ya vi que la tienes hosteada en Github. Lleva una copia que puedas correr en un servidor local para que no dependas del internet. En el peor caso podemos hacer tethering con un celular. Pero sí, también lleva una copia en PDF digital (no impresa) por si acaso. Siempre es bueno tener plan B y C.

Cualquier otra cosa me escribes por acá. :D

eventloop / platicas