Google ha llançat aquesta setmana una nova eina d’intel·ligència artificial (IA) anomenada Gemini, que ha presentat com més potent que qualsevol altra actualment en el mercat, incloent-hi el popular ChatGPT, creat per OpenAI, aliada amb Microsoft.
La companyia subratlla la «multimodalitat» de Gemini, en ser capaç de «raonar amb fluïdesa mitjançant textos, imatges, vídeo, àudio i codis», a través del que es coneix com el model MMLU, sigles en anglès per a la «comprensió massiva de llenguatge multitasques».
Gemini es presentarà en tres formats: Nano (la més senzilla, en forma d’aplicació per a telèfons mòbils), Pro i Ultra, aquesta última «la més potent per a tasques de gran complexitat».
Gemini pot rebre informació visual o auditiva (notes de música, imatges, paraules) i des d’aquí generar contingut propi, que al seu torn pot ser en versió text, àudio o imatges.
En la presentació, Gemini és capaç de detectar errors en un problema matemàtic complex, donar la resposta correcta i explicar els passos fins a arribar a ella; o donar abundant informació sobre un animal (un ànec) a través d’un simple dibuix, incloent-hi la traducció d'»ànec» a cinc llengües.
Igualment, és capaç de «jugar» amb l’usuari en reptes tan populars com «pedra, paper o tisora» o el dels tres gobelets.
Gemini treballa amb els llenguatges de codi més habituals, com Java, Python, C++ i Go, segons els seus creadors, i encara que incorre en alguns errors, Google diu que els sap resoldre quan així se li comunica en el 90% dels casos.
El potencial de Gemini s’aplicarà al seu sistema actual de xat, conegut com a Bard i que funciona ja en diverses llengües, inclòs l’espanyol.
La companyia no ha aclarit com pensa monetitzar la nova eina, i de moment s’ha limitat a anunciar que estarà disponible a partir del 13 de desembre.














