Las redes neuronales son una de las más comunes formas de aprendizaje para el software; en el vídeo se explica cómo se creó MarI/O, un software de este tipo diseñado para superar niveles del mítico Super Mario World.
Este tipo de software comienza no sabiendo nada; en cada interacción prueba a hacer «cosas al azar» guardando los resultados. Los que más se aproximan al objetivo se guardan y se repite la operación con esa información. En el vídeo se explica que en la «generación cero» MarI/O no sabía nada de nada sobre Super Mario World, ni siquiera que pulsando los botones del joystick se movía el personaje para llevarlo hasta el final del nivel (!)
Este sistema se base en la evolución natural; en total necesitó 24 horas para aprenderlo todo; se puede ver cómo al principio el personaje simplemente permanece quieto porque las neuronas no saben qué botón pulsar. Posteriormente el azar va dando lugar a diferentes movimientos de los cuales se eligen los que se acercan más al objetivo. Con el tiempo surgen «fórmulas» tales como «pulsar el botón de salto cuando no haya un enemigo encima» y cosas así.
Lo único que varía de una partida a otra es el resultado respecto al objetivo: «cuanto más a la derecha quede Mario, mejor». Con esto en mente es todo cuestión de ir probando, probando hasta dar con el resultado, millones y millones de cálculos después.
No hay comentarios:
Publicar un comentario