Inteligencia artificial: ChatGPT será capaz de recibir comandos por voz e imágenes

La casa matriz de ChatGPT anunció este 25 de septiembre que está añadiendo capacidades de voz e imagen a esa plataforma de inteligencia artificial (IA) generativa. Por ejemplo, los usuarios podrán mostrarle lo que hay en su frigorífico y ésta les sugerirá una receta, según OpenAI.

27 septiembre 2023 |

¿Dónde acabará ChatGPT? Este lunes, la empresa OpenAI anunció que había añadido el habla y la visión a su programa de inteligencia artificial (IA) para hacerlo "más intuitivo". La interfaz que ha hecho tan popular a la IA generativa -capaz de producir texto, imágenes y otros contenidos a partir de una simple petición en lenguaje cotidiano- pronto podrá procesar peticiones que contengan imágenes y también chatear oralmente con sus usuarios.
Desde la comida hasta los deberes

Las funcionalidades que están siendo agregadas a las versiones de pago de ChatGPT permiten a los usuarios tener conversaciones con la IA e incluso "mostrarle" de lo que están hablando, de acuerdo con la empresa OpenAI. "La voz y la imagen te dan más formas de usar ChatGPT en tu vida", dijo la compañía en una publicación. "Toma una foto de un sitio emblemático mientras viajas y ten una conversación en directo sobre lo que tiene de interesante", añadió.

Los ejemplos sobre cómo las nuevas funciones pueden usarse incluyen desde hacer una foto del interior de un refrigerador para obtener sugerencias de recetas hasta una foto de la tarea de matemáticas de un niño para recibir ayuda resolviendo los problemas.

Las funciones de voz e imagen se implementarán para usuarios de ChatGPT Plus y Enterprise en las próximas semanas y, eventualmente, se desarrollarán para los sistemas operativos móviles de Apple y Google, de acuerdo con OpenAI. Según la firma, las interacciones habladas se hicieron más realistas al contar con las voces de actores.

Competencia y peligros

Los programas de IA generativa, llamados así por su capacidad de crear texto, imágenes o contenidos complejos a partir de datos existentes, saltaron a la fama el año pasado con la habilidad de ChatGPT para generar ensayos, poemas y conversaciones a partir de breves indicaciones.

Los gigantes de la tecnología, conocidos como GAFAM (Google, Apple, Facebook-Meta, Amazon y Microsoft) compiten para entrar en la era de la IA generativa. Este lunes, Amazon anunció una inversión de 4.000 millones de dólares en Anthropic, una empresa estadounidense que ha desarrollado Claude, un chatbot que compite con ChatGPT.

El rápido despliegue de estos programas, que en gran medida siguen sin estar regulados, también está suscitando una gran inquietud.

TE INTERESA