El chatbot ChatGPT, ampliamente utilizado, está diseñado para crear texto digital, desde poesía hasta trabajos de investigación y programas de computadora. Pero cuando un equipo de investigadores de inteligencia artificial de la empresa de chips informáticos Nvidia consiguió la tecnología subyacente del chatbot, se dieron cuenta de que podía hacer mucho más.
En cuestión de semanas, le enseñaron a jugar Minecraft, uno de los videojuegos más populares del mundo. En el mundo digital de Minecraft, aprendí a nadar, recolectar plantas, cazar cerdos, extraer oro y construir casas.
«Puede ingresar al mundo de Minecraft y explorar por su cuenta, recolectar materiales por su cuenta y mejorar todo tipo de habilidades», dijo Linxi Fan, investigador senior de Nvidia, conocido como Jim.
El proyecto Esta fue una señal temprana de que los principales investigadores de IA del mundo están convirtiendo los chatbots en un nuevo tipo de sistema autónomo llamado agente de IA. Estos agentes pueden hacer más que simplemente chatear. Pueden utilizar aplicaciones de software, sitios web y otras herramientas en línea, incluidas hojas de cálculo, calendarios en línea, sitios web de viajes y más.
Con el tiempo, dicen muchos investigadores, los agentes de IA podrían volverse mucho más sofisticados, podrían reemplazar a los trabajadores de oficina y automatizar casi cualquier función administrativa.
«Es una enorme oportunidad de negocio, que potencialmente vale billones de dólares», afirmó Jeff Clune, profesor de informática en la Universidad de Columbia Británica, que anteriormente trabajó en este tipo de tecnología como investigador en OpenAI, una startup de San Francisco que construyó La tecnología. ChatGPT. “Esto tiene enormes ventajas –y graves consecuencias– para la sociedad”.
Agente de Nvidia jugando. Agentes similares pueden programar reuniones, editar archivos, analizar datos y crear gráficos de barras multicolores. La idea es que estos sistemas automatizados eventualmente actúen como asistentes personales capaces de manejar una amplia gama de tareas en línea.
Los agentes de hoy son limitados y no pueden exactamente organizar tu vida. ChatGPT puede buscar en el sitio de viajes Expedia vuelos a Nueva York, pero aún así debes hacer la reserva tú mismo.
Esta tecnología, a medida que los investigadores la mejoren, podría hacer que los trabajadores de oficina y los consumidores sean más eficientes. También podría cambiar la naturaleza de los videojuegos, proporcionando una nueva ola de bots con los que los jugadores pueden jugar y conversar.
GPT-4, la tecnología que impulsa ChatGPT, es lo que los investigadores llaman un gran modelo de lenguaje. Es un sistema de inteligencia artificial que aprende habilidades analizando cantidades masivas de datos.
En los últimos meses, esta tecnología ha cautivado a cientos de millones de personas con la forma en que crea correos electrónicos, escribe discursos y canta canciones sobre casi cualquier tema. Pero su habilidad más importante puede ser su talento para escribir programas de computadora.
Puede crear instantáneamente un programa que dibuje un unicornio o deje caer copos de nieve digitalmente en la pantalla de su computadora portátil. Los desarrolladores de software profesionales pueden encargar código que pueden integrar en programas más grandes, incluyendo todo, desde aplicaciones de redes sociales hasta motores de búsqueda. Pero esto es sólo una parte de lo que esta tecnología puede hacer. También puede generar código informático que puede utilizarse en otras aplicaciones de software y sitios web.
Así es como el Dr. Fan y otros investigadores de Nvidia le enseñaron a GPT-4 cómo jugar Minecraft. «La palabra más importante aquí es código», dijo el Dr. Fan. «El código puede actuar».
Las personas utilizan aplicaciones de software y sitios web tocando botones, menús y otras herramientas gráficas. Los agentes de IA utilizan aplicaciones y sitios web accediendo a sus interfaces de programación de aplicaciones, o API, el código de software subyacente que les permite comunicarse con otros servicios en línea.
Si le pide a un agente que suba un video a Internet, por ejemplo, puede generar un código llamado interfaz de programación de aplicaciones (API) proporcionado por YouTube. «Una API es simplemente texto que se utiliza para hablar con una máquina», dijo Selin Nayhin, investigador que ayuda a ejecutar el proyecto de agente autónomo de IA, AutoGPT.
En teoría, un chatbot puede escribir código para acceder a cualquier API en Internet. Pero los chatbots actuales no tienen la habilidad suficiente para realizar más que tareas simples. Incluso si ese fuera el caso, permitirles deambular libremente en línea sería un enorme riesgo de seguridad. Entonces las empresas empezaron siendo pequeñas.
Unos meses después de que OpenAI presentara ChatGPT, silenciosamente lanzó una forma para que un chatbot hiciera algo más que generar texto. Después de instalar varios complementos (software que mejora lo que puede hacer el bot), puede pedirle que busque en sitios de viajes como Expedia vuelos disponibles, que obtenga un mapa de su ciudad en Google Earth o incluso que convierta una hoja de cálculo que detalle sus gastos anuales. .. Gráfico de barras multicolor.
Debido a que viene con un complemento llamado compilador de código, ChatGPT no solo puede escribir código, sino también ejecutarlo. Esto ha permitido que la tecnología realice instantáneamente tareas que no podía realizar en el pasado, incluida la edición de hojas de cálculo y la conversión de imágenes fijas en videos. Google, Microsoft y otras empresas están explorando tecnologías similares.
«Estos son proyectos en los que imaginamos que la IA esencialmente trabaje con otra IA en su nombre», dijo Ashley Lawrence, vicepresidenta de Microsoft.
Proyectos independientes como AutoGPT están intentando llevar este tipo de cosas varios pasos más allá. La idea es darle al sistema objetivos como «iniciar una empresa» o «ganar algo de dinero». Luego buscará formas de alcanzar ese objetivo haciéndose preguntas y conectándose a otros servicios de Internet.
Hoy en día esto no funciona tan bien. Sistemas como AutoGPT tienden a quedarse atascados en bucles interminables. Pero investigadores como el Dr. Fan trabajan constantemente para mejorar este tipo de tecnología en un intento de hacerla más útil y confiable.
Otros investigadores están construyendo un nuevo tipo de agente de inteligencia artificial diseñado para utilizar herramientas de software. En el verano de 2022, el Dr. Clune formó parte de un equipo de investigadores de OpenAI que creó un agente capaz de hacer esto. Utilice programas de computadora tanto como lo haría una persona. – Clic del ratón tras clic del ratón, pulsación de tecla tras pulsación de tecla.
El Dr. Clune y sus colegas alimentaron al sistema con horas de videos en línea que mostraban a personas jugando Minecraft. Al analizar la forma en que las personas usan el mouse y el teclado para navegar por el mundo digital de Minecraft, el sistema aprendió a ejecutar el juego por sí solo.
Otras empresas están construyendo, incluida una startup llamada Adept. Agentes similares Que utiliza sitios web como Wikipedia, Redfin y Craigslist, y aplicaciones de oficina populares de empresas como Salesforce.
El Dr. Clune dice que este tipo de agente eventualmente permitirá que la IA utilice una gama mucho más amplia de aplicaciones de software y sitios web. Todos tendrán acceso a un asistente digital que podrá hacer casi cualquier cosa en Internet, afirmó. Esto facilitaría la vida, pero también podría sustituir innumerables puestos de trabajo.
«Si la IA puede hacer algo que nosotros podamos hacer, no es simplemente reemplazar tareas aburridas», afirmó. «Reemplaza todas las tareas».
«Explorador amigable con los hipster. Fanático del café galardonado. Analista. Solucionador de problemas. Alborotador».
More Stories
Calendario de lanzamiento de M4 Mac: aquí es cuando se espera que se lancen nuevos Mac
OpenAI presenta Canvas, su última interfaz ChatGPT
iOS 18.0.1: Apple emite una advertencia sobre la nueva actualización para usuarios de iPhone