Un desarrollo IA generativa multimodal que espera grandes resultados
Desde que se produjo el lanzamiento del ChatGPT, OpenAI lidera con facilidad el campo de la inteligencia artificial generativa. Noviembre del 2022 ha sido un antes y un después gracias a esta tecnología que, hasta el momento, parecía no tener rivales. Sin embargo, esto parece cambiar con el último anuncio de Google y la llegada de “Gemini”. Cabe mencionar que el gigante tecnológico ya contaba con una herramienta similar al ChatGPT llamada Bard, sin embargo, este no es un modelo de inteligencia artificial, sino un chatbot que utiliza otro modelo de inteligencia artificial (PaLM 2).
Frente a este escenario, Ahora Google decidió lanzar un nuevo modelo de lenguaje (LLM) llamado “Gemini”, el cual representaría una verdadera competencia para OpenAI. A partir del mismo, busca que Bard deje de utilizar el modelo PaLM 2 y comience a funcionar con Gemini. Con el fin de comprender un poco más esta situación, se puede trazar un paralelismo con ChatGPT. Este chatbot no es un modelo en sí, sino que depende del modelo de IA desarrollado por OpenAI llamado GPT.
Hasta aquí todo muy bien, pero ¿por qué Gemini se presenta como un gran rival de GPT? La realidad es que, más allá de estar desarrollado por Google, lo cual no es un aspecto menor, este modelo promete respuestas completamente mejoradas que elevarían la vara. En este sentido, entre sus características destaca su gran versatilidad al ser un modelo multimodal. Esto quiere decir que puede comprender diferentes tipos de información, ya sean textos, imágenes, audios o códigos de programación.
Qué versiones ofrece Gemini
Con capacidades y funciones diferentes, Google ha decidido presentar tres versiones para Gemini. La opción Ultra, la variante Pro y finalmente la de menor alcance llamada Nano. Comenzando por esta última, la misma está pensada para dispositivos con menores capacidades de memoria y computación, por lo que podría ser utilizada en teléfonos móviles. Esto último no es un aspecto menor, ya que posiblemente se implemente de forma directa en un dispositivo. Es decir, sin depender de una aplicación que se conecte a un servidor (como sí ocurre con el ChatGPT) esta sería incluida directamente en el celular.
En cuanto a la segunda variante denominada Pro, esta puede ser comparada con la opción gratuita que ofrece OpenAI, el ChatGPT 3.5, y no presentaría grandes modificaciones. Asimismo, la versión más potente denominada Gemini Ultra se establece como la competencia de GPT-4 e incluso se pronostica que sería mejor que esta. Por otro lado, si se compara Gemini Ultra con el actual modelo de inteligencia artificial utilizado por Bard, el nuevo lanzamiento superaría fácilmente al anterior. En los test realizados respecto a la función multirespuesta, mientras que Gemini Ultra obtiene una puntuación de 90,04%, PaLM 2 solo alcanza 78,4%.
Cómo y cuándo se puede utilizar Gemini
Al contar con varias versiones, no todas se pueden utilizar de la misma forma y en el mismo momento. De hecho para probar la variante Gemini Ultra, por ejemplo, aún hace falta esperar, ya que si bien no hay fecha definida, será lanzada en 2024. Según Google, aún quedan trabajos para garantizar al 100% la confianza y la seguridad de este desarrollo, así como también continuar puliendo detalles.
Algo diferente ocurre con Gemini Pro, este modelo ya está presente en Google Brad y por lo tanto no hace falta más que ingresar al sitio web, crearse una cuenta y comenzar a experimentar con ella. No obstante, cabe mencionar que existen algunas limitaciones como el idioma, debido a que solo está disponible en inglés. Así también, Europa aún no tiene no tiene acceso a este nuevo modelo, sin embargo se espera que en los próximos meses forme parte.
Finalmente, respecto a la variante Gemini Nano, esta ya se encuentra disponible para el celular Pixel 8 Pro. Acerca de la misma, ofrece sugerencias de respuestas inteligentes en el teclado de Gboard, así como también la posibilidad de resumir una grabación de voz realizada con la aplicación Grabador. Por último, se especula que la intención de Google es que estas funciones de inteligencia artificial sean incluidas próximamente en todos los dispositivos que cuente con Android 14.
Máxima responsabilidad: un aspecto resaltado por Google
Así como el gigante tecnológico anunció las características de este nuevo desarrollo, las diferentes versiones que ofrece, y el momento en el que cada uno podrá ser utilizado, también hizo énfasis al trabajo en seguridad realizado. Desde la compañía aseguraron que para llevar adelante Gemini realizaron todas las pruebas correspondientes respetando los principios de la IA, al igual que las políticas de seguridad de los productos.
En esta misma línea, se hizo alusión al trabajo de entrenamiento realizado para eliminar cualquier tipo de sesgo y toxicidad. Un metodología de seguridad que también fue aplicada a otros asuntos que podían generar algún tipo de riesgo, como por ejemplo la persuasión, autonomía o incluso ciberataques. Finalmente, respecto a estos últimos, Google resaltó la utilización de técnicas de prueba con Google Research, las cuales les permitieron ajustar al máximo cualquier problema que podría surgir.