Esta
inteligencia artificial enseña a los robots bipedos a caminar, creando
instrucciones para los obstáculos de forma personalizada y automática.
Antes de saltar obstáculos, debe aprender a gatear y, antes de leer a
William Shakespeare, debe conocer el alfabeto. Cualquier educador sabe de
la importancia de un plan de aprendizaje paso a paso para llegar a
dominar una tarea.
Ahora, los investigadores de
Uber AI Labs
(empresa de investigación) han diseñado un algoritmo que crea su
propio plan de aprendizaje para enseñar a los robots simulados a
atravesar un terreno difícil sin caerse. El algoritmo podría incluso algún
día ayudar a los vehículos autónomos a reaccionar en situaciones de
emergencia.
El nuevo programa, llamado Paired Open-Ended Trailblazer
(POET) primero crea un conjunto de mundos o terrenos únicos, cada uno
habitado por un personaje controlado por ordenar, un robot.
Usando solo dos patas y un telémetro similar a un láser, el
personaje o robot debe aprender a caminar. Después de un período de
práctica, la inteligencia artificial cambia el desafío, a veces lo hace más
fácil y, a veces, más difícil.
Puede hacer que las trincheras sean más anchas, los agujeros más altos o
el suelo más desigual. De vez en cuando se cambia un robot caminante por
otro diferente, para ver si las habilidades aprendidas en un terreno
ayudarán en otro diferente. Esta mutación e intercambio de carreras de
obstáculos crea una serie impredecible de escalones en el camino hacia la
agilidad.
Usando el programa POET, los robots caminantes podrían cubrir un terreno
difícil que no se podría aprender sin los planes de estudio aprendidos
anteriormente. Además, POET funcionó mejor que un programa que simplemente
aumentaba la dificultad del terreno a lo largo del tiempo, sin intentar
muchos caminos indirectos.
Las vastas rutas de aprendizaje de POET dieron sus frutos una y otra vez.
En un ejemplo, un robot se agachó hasta que se encontró con un mundo de
obstáculos y agujeros y tuvo que aprender a caminar erguido; más tarde
regresó a un mundo más plano y siguió caminando erguido, completando el
curso más rápido que antes.
Los investigadores dicen que POET podría algún día ayudar a los
robots de la vida real a resolver muchas tareas complejas, o
incluso permitir que los coches autónomos aprendan a resolver
emergencias que los programadores no habían pensado incluir en el
propio plan. POET podría incluso crear y resolver problemas
completamente nuevos, en campos desde la síntesis de proteínas
hasta la poesía.
El Programa POET
El papel del currículo (plan de estudios) en la educación es
esencial en el aprendizaje. La razón por la que hay un plan de estudios es
que es muy difícil aprender habilidades o conceptos avanzados sin antes
dominar las habilidades fundamentales. Este principio se aplica no solo a
los estudiantes en las aulas, sino también a los algoritmos de aprendizaje:
las tareas que son difíciles o imposibles de aprender directamente
se vuelven manejables si son el final de una secuencia de pequeños pasos.
Fíjate en el siguiente robot, primero aprende en un entorno fácil, para
luego pasar a otro con obstáculos.
Ahora pasamos a resolver un camino más complejo
Si bien la historia del aprendizaje automático hasta ahora abarca una
serie de problemas planteados por los investigadores y los algoritmos que
aprenden sus soluciones, una pregunta importante es si los problemas
en sí pueden ser generados por el algoritmo al mismo tiempo que se resuelven.
Tal proceso, de hecho, construiría su propio currículo diverso y en
expansión, y las soluciones a los problemas en varias etapas se convertirían
en un paso hacia la solución de problemas aún más difíciles según se avanza
en el proceso.
El algoritmo POET hace precisamente eso: empareja la generación de
desafíos ambientales y la optimización de agentes para resolver esos
desafíos. Explora simultáneamente muchos caminos diferentes a través del
espacio de posibles problemas y soluciones y, de manera crítica, permite que
estas soluciones escalonadas se transfieran entre problemas, si es mejor,
catalizando la innovación.
El término abierto significa el potencial intrigante para que algoritmos
como POET continúen creando capacidades novedosas y cada vez más complejas
sin límite. Los resultados muestran que POET produce una
gama diversa de comportamientos sofisticados que resuelven una
amplia gama de desafíos ambientales, muchos de los cuales no se
pueden resolver solo mediante optimización directa, o incluso a través de un
algoritmo de control directo de un solo camino basado en el currículo
introducido para resaltar el papel crítico de la apertura en la resolución
de desafíos ambiciosos.
La capacidad de transferir soluciones de un entorno a otro
resulta esencial para desbloquear todo el potencial del sistema en su
conjunto, lo que demuestra la naturaleza impredecible de los escalones
fortuitos.