julio 19, 2024

CubaComunica

Spanish News Today para obtener las últimas noticias, estilo de vida y información turística en inglés en España.

Bard AI de Google ahora puede escribir y ejecutar código para responder una pregunta Ars Technica

Bard AI de Google ahora puede escribir y ejecutar código para responder una pregunta Ars Technica

Puede proporcionar modelos grandes de lenguaje (LLM) como ChatGPT y Google Bard alguno Respuestas decentes a ciertos tipos de preguntas, pero, irónicamente, estas computadoras son bastante malas para la informática. Google tiene una nueva solución para tratar de hacer que los modelos de lenguaje realicen tareas simples, como matemáticas, ¿verdad?: obtenga IA escribir un programa. Google dice que ahora, cuando le pides a Bard una tarea «computacional» como matemática o manipulación de cadenas, en lugar de mostrar el resultado de un modelo de lenguaje, ese modelo de lenguaje escribirá un programa, ejecutará ese programa y luego mostrará el resultado de ese programa al usuario como respuesta.

Una publicación de blog de Google proporciona un ejemplo de una entrada que «invierte la palabra ‘Lollipop’ para mí». ChatGPT le da la vuelta a esta pregunta y da la respuesta incorrecta «pillopoL», porque los modelos de lenguaje ven el mundo en fragmentos de palabras o «símbolos», y no son muy buenos en esto. Aquí hay un ejemplo de salida de Bard:

Google

Obtienes el resultado correcto como «popilloL», pero lo que es más interesante es que también Incluye código Python Escribí para responder a la pregunta. Esto es genial para las personas interesadas en la programación para ver qué hay detrás del capó, pero wow, esta es probablemente la forma más aterradora de todas para la gente normal. Tampoco es especialmente relevante. Imagínese si Gmail le mostrara un bloque de código cuando acaba de pedirle que busque el correo electrónico. Es raro. Solo haz el trabajo que te piden que hagas, genial.

Google compara un modelo de IA que escribe un programa para humanos haciendo divisiones largas en el sentido de que es un modo diferente de pensar:

Este enfoque está inspirado en un dualismo bien estudiado en la inteligencia humana, que se cubre específicamente en el libro de Daniel Kahneman. Pensando rápido y lentoSepare el pensamiento del «Sistema 1» y el «Sistema 2».

  • El pensamiento del Sistema 1 es rápido, intuitivo y fácil. Cuando un músico de jazz improvisa en el acto o cuando alguien piensa en una palabra y la ve aparecer en la pantalla, está usando el pensamiento del Sistema 1.
  • Por el contrario, el pensamiento del Sistema 2 es lento, deliberado y laborioso. Cuando haces divisiones largas o aprendes a tocar un instrumento, estás usando el Sistema 2.

En esta analogía, se puede ver que el LLM opera solo bajo el Sistema 1: produce un texto rápidamente pero sin pensarlo mucho. Esto conduce a algunas capacidades sorprendentes, pero puede fallar en algunas formas sorprendentes. (Imagínese que está tratando de resolver un problema matemático usando el Sistema 1 solo: no puede detenerse y hacer los cálculos, solo tiene que generar la primera respuesta que le venga a la mente). Los cálculos clásicos están estrechamente alineados con el Sistema 2 pensamiento: es un proceso formulaico e inflexible, pero la secuencia correcta de pasos puede conducir a resultados impresionantes, como soluciones de división larga.

Google dice que el método de «código sobre la marcha» también se utilizará para preguntas como: «¿Cuáles son los factores primos de 15,683,615?» y «Calcular la tasa de crecimiento de mis ahorros». La compañía dice: «Hasta ahora, hemos visto que este método mejora la precisión de las respuestas de Bard a problemas matemáticos y de palabras basados ​​en aritmética en nuestros conjuntos de datos de desafío internos en aproximadamente un 30 %». Como de costumbre, Google advierte que Bard «puede no hacerlo bien» por malinterpretar su pregunta o simplemente, como todos nosotros, por escribir un código que no funciona la primera vez.

READ  Google organizó el Demo Slam I/O 2024 y abrió un hackathon para empleados

Bard está codificando rápidamente las respuestas ahora mismo si quieres probarlo en bard.google.com.