Google lanza la IA de Gemini – ¿La competencia más grande de ChatGPT?
Google dio a conocer un nuevo avance en materia de inteligencia artificial (IA), se trata de Gemini, y según los ejecutivos informáticos que integran el departamento de investigación involucrado, es el modelo más avanzado y capaz.
El desarrollo de Gemini, lo encabeza Google DeepMind, empresa de la firma que se dedica específicamente a trabajar con algoritmos y lenguajes de programación avanzados.
Demis Hassabis, CEO y cofundador de Google DeepMind junto con Sundar Pichai, CEO de Google y Alphabet son los principales referentes de este lanzamiento. Se dedicaron a comentar las características del nuevo producto y las razones de porque lo consideran superior en varios factores.
“Gemini puede entender el mundo que lo rodea, es multimodal. Supera a los demás modelos porque también codifica audio, imagen y video” dijo Sundar Pichai.
¿Qué es Gemini?
En palabras de Demis Hassabis, quien se ha dedicado a incorporar conceptos de neurociencia a las investigaciones sobre la IA, el mundo necesita interactuar con un ayudante útil e intuitivo. Un asistente experto que no se sienta como un software inteligente, sino algo más cercano.
Esto impulsó a Google para dar nacimiento a Gemini, un lenguaje de programación avanzado que es capaz de conectar con múltiples nodos a la vez. De esta manera, puede interactuar con su entorno de forma integral, dando respuestas y ayuda certera, en momentos adecuados.
Everything you need to know about Gemini — Google’s largest and most capable AI model — in just 90 seconds. #GeminiAI pic.twitter.com/b7j08bV0YN
— Google (@Google) December 7, 2023
“En las 50 áreas temáticas diferentes que probamos a Gemini, resulto siendo igual de bueno que los mejores humanos expertos”
Gemini , es superior en un 90,0% a los humanos en su comprensión masiva de lenguajes multitarea (MMLU). Se compara la combinación de 57 materias, entre ellas matemáticas, física, historia, derecho, medicina y ética. La idea es evaluar el desempeño de este lenguaje en conocimientos y habilidades.
La interfaz estará disponible en tres tamaños diferentes (Ultra, Pro y Nano), capaces de funcionar de manera eficiente en dispositivos móviles u ordenadores. Los diferentes alcances buscan dar a cada necesidad la justa medida de lo que requiere. Ya que la visión es mejorar la manera en la que los clientes empresariales y desarrolladores interactúan con la IA.
Las capacidades de Gemini superan a ChatGPT
La comparación es obligada, porque ChatGPT es el referente del modelo de lenguaje de programación que sigue, con Gemini en el mercado, pasaría a segundo puesto. Al menos así lo dicen los resultados porcentuales del rendimiento de habilidades.
“Hemos estado probando rigurosamente nuestros modelos Gemini y evaluando su desempeño en una amplia variedad de tareas. El desempeño de Gemini Ultra, supera los resultados actuales de última generación en 30 de los 32 puntos de referencia académicos ampliamente utilizados en la investigación y el desarrollo de modelos de lenguaje grande (LLM).”
Los puntos de referencia comparados, involucran imágenes, videos y audios y los promedios de Gemini Ultra superan a los de ChatGPT en todos los casos. Pero lo más destacable, es que en líneas generales, Gemini se muestra superior con un 90,0% respecto del chatbot de Open AI, que consiguió un 86,4% en comprensión multimodal MMLU.
Diferencias de capacidades Gemini vs ChatGPT. Fuente: Deepmind.google
Gemini puede llevar a la humanidad a grandes avances
El equipo que trabaja en Gemini, asegura haber diseñado una interfaz simple que solo requiere de indicaciones para que todos puedan aprovechar las ventajas. Gracias al razonamiento que ha sabido demostrar, es posible aprender con esta herramienta. Las personas de todo el mundo, podrían tener acceso a enriquecer sus conocimientos.
As Gemini is natively multimodal, it better understands nuanced information and can answer questions relating to complicated topics.
This makes it especially good at explaining reasoning in subjects like math and physics – which could be helpful when it comes to homework. ↓ pic.twitter.com/LVPAIroEPT
— Google DeepMind (@GoogleDeepMind) December 6, 2023
Gemini es capaz de comprender información matizada y puede responder preguntas relacionadas con temas complicados. Los referentes de Google aseguran estar frente a una nueva oportunidad, de acercar a la humanidad algo grandioso, además de útil en distintas áreas.
Gemini podría explicarte razonamientos complejos en materias como física o matemáticas, o bien podrías aprender sobre criptomonedas o algún idioma. Todo bajo la tutoría de uno de los lenguajes de programación más avanzados y conocedor de impensados volúmenes de datos e información.
Pero aún deberás esperar para incursionar en Gemini, pues su Vision Pro ya comenzó a funcionar en Google Bard, aunque únicamente en inglés y no dentro de Europa, donde llegará en los próximos meses.
“Google ha estado a la vanguardia de muchos de los avances de la IA, y Gemini es la continuidad de ellos. Realmente creo en la misión de la empresa, crear un mundo que tiene más conocimiento y en el que las personas tienen más acceso a la información. Me entusiasma: la oportunidad de hacer que la IA sea útil para todos en todas partes” – Sundar Pichai