Qu’est-ce que Gemini ? Tout ce que vous devez savoir sur la nouvelle IA surpuissante de Google

Qu'est-ce que Gemini ? Tout ce que vous devez savoir sur la nouvelle IA surpuissante de Google

Google vient de publier son modèle d’IA le plus puissant à ce jour. Mais que peut-il faire et surtout que peut-il faire pour vous ? Voici tous les détails de cette annonce qui bouscule le leadership d’OpenAI en matière d’IA générative, grâce au modèle multimodal.

Qu’est-ce que Google Gemini ?

Gemini est un nouveau et puissant modèle d’intelligence artificielle de Google qui peut comprendre non seulement du texte, mais aussi des images, des vidéos et du son. En tant que modèle multimodal, Gemini est décrit comme capable d’accomplir des tâches complexes en mathématiques, en physique et dans d’autres domaines, ainsi que de comprendre et de générer un code de haute qualité dans divers langages de programmation.

Il est actuellement disponible via des intégrations avec Google Bard et le smartphone Google Pixel 8 et sera progressivement intégré à d’autres services Google.

“Gemini est le résultat d’une collaboration à grande échelle entre les équipes de Google, y compris nos collègues de Google Research”, selon Dennis Hassabis, PDG et cofondateur de Google DeepMind. “Il a été construit dès le départ pour être multimodal, ce qui signifie qu’il peut généraliser et comprendre de manière transparente, opérer à travers et combiner différents types d’informations, y compris le texte, le code, l’audio, l’image et la vidéo.”

publicité

Qui a créé Gemini ?

Gemini a été créé par Google et Alphabet, la société mère de Google, et présenté comme le modèle d’IA le plus avancé de l’entreprise à ce jour. Google DeepMind a également contribué de manière significative au développement de Gemini.

Google décrit Gemini comme un modèle flexible capable de fonctionner sur tous les supports, des centres de données de Google aux appareils mobiles. Pour parvenir à cette évolutivité, Gemini est disponible en trois tailles : Gemini Nano, Gemini Pro et Gemini Ultra.

  • Gemini Nano : La taille du modèle Gemini Nano est conçue pour fonctionner sur les smartphones, en particulier le Google Pixel 8. Il est construit pour effectuer des tâches sur l’appareil qui nécessitent un traitement efficace de l’IA sans se connecter à des serveurs externes, comme suggérer des réponses dans les applications de chat ou résumer un texte.
  • Gemini Pro : Exécuté sur les centres de données de Google, Gemini Pro est conçu pour alimenter la dernière version du chatbot IA de l’entreprise, Bard. Il est capable de fournir des temps de réponse rapides et de comprendre des requêtes complexes.
  • Gemini Ultra : bien qu’il ne soit pas encore disponible pour une utilisation généralisée, Google décrit Gemini Ultra comme son modèle le plus performant, dépassant “les résultats actuels de l’état de l’art sur 30 des 32 repères académiques largement utilisés dans la recherche et le développement de grands modèles de langage (LLM)”. Il est conçu pour des tâches très complexes et devrait être commercialisé à l’issue de sa phase actuelle de test.

Comment accéder à Gemini ?

Gemini est désormais disponible sur les produits Google dans ses tailles Nano et Pro, comme le téléphone Pixel 8 et le chatbot Bard, respectivement. Google prévoit d’intégrer Gemini au fil du temps dans ses services Search, Ads, Chrome et autres.

Les développeurs et les entreprises clientes pourront accéder à Gemini Pro via l’API Gemini dans AI Studio de Google et Google Cloud Vertex AI à partir du 13 décembre. Les développeurs Android auront accès à Gemini Nano via AICore, qui sera disponible en preview.

Google Gemini est-il disponible en France ?

Gemini Pro est d’ores et déjà disponible gratuitement dans 170 pays – mais pas encore en France – et uniquement en anglais pour l’instant.

Néanmoins, Google prévoit de l’étendre prochainement à d’autres langues et dans d’autres régions du monde. Pour le tester, il suffit d’utiliser le chatbot de Google comme vous le feriez habituellement.

En quoi Gemini diffère-t-il des autres modèles d’IA, comme GPT-4 ?

Le nouveau modèle Gemini de Google semble être l’un des modèles d’IA les plus grands et les plus avancés à ce jour, même si la sortie du modèle Ultra permettra de le déterminer avec certitude.

Comparé à d’autres modèles populaires qui alimentent actuellement les chatbots d’IA, Gemini se distingue par sa caractéristique multimodale native, alors que d’autres modèles, comme GPT-4, dépendent de plugins et d’intégrations pour être réellement multimodaux.

Gemini Ultra and Pro vs GPT-4

Tableau comparatif de Google qui montre comment Gemini Ultra et Pro se comparent respectivement à GPT-4 et Whisper d’OpenAI. Google/ZDNET

Comparé à GPT-4, un modèle principalement basé sur le texte, Gemini exécute facilement des tâches multimodales en mode natif. Alors que GPT-4 excelle dans les tâches liées au langage, telles que la création de contenu et l’analyse de textes complexes, il a recours aux plugins d’OpenAI pour effectuer l’analyse d’images et accéder au web, et il s’appuie sur DALL-E 3 et Whisper pour générer des images et traiter l’audio.

Google Gemini semble également plus axé sur les produits que les autres modèles disponibles actuellement. Il est soit intégré à l’écosystème de l’entreprise, soit prévu de l’être, puisqu’il alimente les appareils Bard et Pixel 8. D’autres modèles, comme le GPT-4 et le Llama de Meta, sont davantage axés sur les services et disponibles pour divers développeurs tiers pour des applications, des outils et des services.

Source : “ZDNet.com”

Leave a Reply

Discover more from Ultimatepocket

Subscribe now to keep reading and get access to the full archive.

Continue reading