Chat GPT como abanderado, pero también Mid Journey y Dall-e popularizaron el uso de la inteligencia artificial generativa entre el gran público, al tiempo que han dado lugar a confusión.
Las tecnologías de IA generativa abarcan una amplia gama de herramientas y usos que las empresas deben comprender. Aquí desciframos y desmitificamos.
A finales de 2022, OpenAI lanzó Chat GPT, que permite a un gran número de usuarios familiarizarse con la inteligencia artificial y sus posibilidades.
Esta herramienta conversacional triunfa allí donde las aplicaciones anteriores de Deep Learning o Machine Learning siguen siendo complejas de comprender o simplemente invisibles para el gran público.
Chat GPT, pero también DALL-E y Mid Journey para la generación de imágenes, han desempeñado por tanto un papel importante en la democratización de la inteligencia artificial, y más concretamente de una categoría de inteligencia artificial, a saber, la IA generativa.
Se ha alcanzado una nueva etapa con la transición de una IA que podría calificarse de silenciosa a una IA atronadora por ser omnipresente, mediatizada, comprensible y explotable por el mayor número de personas.
Pero donde hay mucho ruido, también hay ruido a veces ensordecedor. Y aunque la amplia cobertura mediática de estos modelos de inteligencia artificial está ayudando a democratizar el campo, también está contribuyendo a crear confusión e incluso fantasías.
Así que vamos a intentar aclarar algunos conceptos y aclarar qué es -y qué no es- realmente la IA generativa. Si estás en un puesto de liderazgo, diriges equipos, trabajas o simplemente eres un ser humano con potencial de multiplicar tus capacidades, este artículo debería interesarte.
¿Qué es la IA generativa?
¿Y por qué no preguntárselo a Chat GPT?
“La IA generativa es una rama de la inteligencia artificial que se centra en crear modelos y algoritmos capaces de generar datos, imágenes, texto o sonido de forma autónoma. A menudo utiliza redes neuronales artificiales y técnicas de aprendizaje profundo para aprender de los datos existentes y generar nuevos datos que se parezcan a los que ha aprendido. La IA generativa se utiliza en muchos campos, como la creación artística, la música, el vídeo, la publicidad, la moda, los videojuegos y la simulación.”
Así define Chat GPT la IA generativa, destacando la capacidad de este amplio ecosistema tecnológico para crear contenidos en diferentes formatos y a partir de múltiples fuentes.
Esta última característica se describe como multimodal. Por ejemplo, la GPT-4 de OpenAI es una IA generativa y multimodal.
Esto significa que combina varias fuentes de datos (texto, voz, imagen, datos) y algoritmos de procesamiento. Su versión anterior, GPT-3.5, se limitaba al texto.
La IA generativa puede ser específica para determinadas fuentes de datos. GPT 3.5, utilizado por Chat GPT, se ha entrenado únicamente con texto, que son datos no estructurados. Por lo tanto, su respuesta será únicamente en forma de texto.
Otros modelos, en cambio, están especializados en imágenes o vídeo. Por último, y esto es un gran avance, la IA multimodal tiene la capacidad de procesar múltiples fuentes.
Para las empresas, la IA generativa es una importante palanca potencial para mejorar la productividad.
¿La IA generativa es una revolución o una evolución?
De hecho, Chat GPT ha reunido y democratizado tecnologías preexistentes, entre ellas los LLM (Large Language Models). GPT-3 y GPT-4 de OpenAI y BERT de Google son ejemplos de LLM basados en texto. GPT-3 se lanzó en 2020. Por tanto, la IA generativa no es nada nuevo para 2022 y 2023.
Además, estos modelos se basan en técnicas probadas desde hace años. GPT son las siglas de Generative Pre-trained Transformer.
Los orígenes de los Transformers, que son modelos de Deep Learning, se remontan a finales de 2017. Su funcionamiento se presenta en un trabajo de investigación titulado “Attention Is All You Need”.
Por lo tanto, podríamos considerar que la revolución es, ante todo, la de los Transformers y los LLM, cuya aparición fue posible gracias a trabajos anteriores sobre Deep Learning y redes neuronales.
Para las eminencias en IA, ChatGPT y otros grandes modelos lingüísticos no surgieron de la nada. Son el resultado de décadas de contribuciones de varias personas.
Ellos señalan que los trabajos sobre aprendizaje autosupervisado, enfoque adoptado por OpenAI, son anteriores a la creación de la start-up.
Lo mismo ocurre con los transformadores y el uso de la retroalimentación humana (RLHF o Reinforcement Learning from Human Feedback).
Si hay una revolución, es el resultado de múltiples contribuciones.
En cambio, no resta valor a la inteligencia artificial generativa, que Meta, desarrolla intensamente.
Evolución o revolución, la cuestión puede ser debatida por los expertos.
Para las empresas y los usuarios de la IA, la IA generativa y su democratización son realmente una revolución.
Para las empresas, la IA generativa es una importante palanca potencial para mejorar la productividad.
También es una oportunidad para sacar el máximo partido de un activo muy poco explotado hasta la fecha: los datos no estructurados (texto, imagen, sonido, vídeo).
Por tanto, les interesa acelerar la transición de la inteligencia a la ideación en términos de casos de uso, y luego a su aplicación.
Continuaremos con la reflexiones en el próximo artículo ¡Sigue leyendo!