Bard AI de Google ahora puede escribir y ejecutar código para responder una pregunta Ars Technica

Puede proporcionar modelos grandes de lenguaje (LLM) como ChatGPT y Google Bard alguno Respuestas decentes a ciertos tipos de preguntas, pero, irónicamente, estas computadoras son bastante malas para la informática. Google tiene una nueva solución para tratar de hacer que los modelos de lenguaje realicen tareas simples, como matemáticas, ¿verdad?: obtenga IA escribir un programa. Google dice que ahora, cuando le pides a Bard una tarea «computacional» como matemática o manipulación de cadenas, en lugar de mostrar el resultado de un modelo de lenguaje, ese modelo de lenguaje escribirá un programa, ejecutará ese programa y luego mostrará el resultado de ese programa al usuario como respuesta.

Una publicación de blog de Google proporciona un ejemplo de una entrada que «invierte la palabra ‘Lollipop’ para mí». ChatGPT le da la vuelta a esta pregunta y da la respuesta incorrecta «pillopoL», porque los modelos de lenguaje ven el mundo en fragmentos de palabras o «símbolos», y no son muy buenos en esto. Aquí hay un ejemplo de salida de Bard:

Obtienes el resultado correcto como «popilloL», pero lo que es más interesante es que también Incluye código Python Escribí para responder a la pregunta. Esto es genial para las personas interesadas en la programación para ver qué hay detrás del capó, pero wow, esta es probablemente la forma más aterradora de todas para la gente normal. Tampoco es especialmente relevante. Imagínese si Gmail le mostrara un bloque de código cuando acaba de pedirle que busque el correo electrónico. Es raro. Solo haz el trabajo que te piden que hagas, genial.

Google compara un modelo de IA que escribe un programa para humanos haciendo divisiones largas en el sentido de que es un modo diferente de pensar:

Este enfoque está inspirado en un dualismo bien estudiado en la inteligencia humana, que se cubre específicamente en el libro de Daniel Kahneman. Pensando rápido y lentoSepare el pensamiento del «Sistema 1» y el «Sistema 2».

El pensamiento del Sistema 1 es rápido, intuitivo y fácil. Cuando un músico de jazz improvisa en el acto o cuando alguien piensa en una palabra y la ve aparecer en la pantalla, está usando el pensamiento del Sistema 1.

Por el contrario, el pensamiento del Sistema 2 es lento, deliberado y laborioso. Cuando haces divisiones largas o aprendes a tocar un instrumento, estás usando el Sistema 2.

En esta analogía, se puede ver que el LLM opera solo bajo el Sistema 1: produce un texto rápidamente pero sin pensarlo mucho. Esto conduce a algunas capacidades sorprendentes, pero puede fallar en algunas formas sorprendentes. (Imagínese que está tratando de resolver un problema matemático usando el Sistema 1 solo: no puede detenerse y hacer los cálculos, solo tiene que generar la primera respuesta que le venga a la mente). Los cálculos clásicos están estrechamente alineados con el Sistema 2 pensamiento: es un proceso formulaico e inflexible, pero la secuencia correcta de pasos puede conducir a resultados impresionantes, como soluciones de división larga.

Google dice que el método de «código sobre la marcha» también se utilizará para preguntas como: «¿Cuáles son los factores primos de 15,683,615?» y «Calcular la tasa de crecimiento de mis ahorros». La compañía dice: «Hasta ahora, hemos visto que este método mejora la precisión de las respuestas de Bard a problemas matemáticos y de palabras basados en aritmética en nuestros conjuntos de datos de desafío internos en aproximadamente un 30 %». Como de costumbre, Google advierte que Bard «puede no hacerlo bien» por malinterpretar su pregunta o simplemente, como todos nosotros, por escribir un código que no funciona la primera vez.

READ Cómo conseguir un Apple Watch Ultra 2 o Apple Watch Series 9 gratis (casi) si haces ejercicio

Bard está codificando rápidamente las respuestas ahora mismo si quieres probarlo en bard.google.com.

José Islas

«Explorador amigable con los hipster. Fanático del café galardonado. Analista. Solucionador de problemas. Alborotador».

Bard AI de Google ahora puede escribir y ejecutar código para responder una pregunta Ars Technica

La última actualización de Star Wars Outlaws rompe las imágenes en PS5

El MacBook Air M2 de 13 pulgadas tiene un gran valor a su precio de venta actual de $ 699

La prueba de juego en línea de Nintendo se lanza en Switch y los jugadores filtrarán e incluso transmitirán el juego al instante.

Max suma la oferta deportiva de DAZN en España

Kamala Harris 'tiene un coeficiente intelectual de valla'

Keir Starmer dice: «No podemos cambiar nuestra historia» sobre la trata de esclavos

Un fósil de 72 millones de años encontrado cerca de Utah conduce al descubrimiento de un mamífero prehistórico del tamaño de una rata almizclera

Deja una respuesta Cancelar la respuesta

More Stories