Anthropic affirme que Claude 3 est plus performant que ChatGPT et Gemini

Anthropic affirme que Claude 3 est plus performant que ChatGPT et Gemini

Capture d’écran par Lance Whitney/ZDNET.

Attention, ChatGPT, un nouveau chatbot d’IA s’immisce sur ton territoire !

Publiée lundi, la troisième version de Claude AI, d’Anthropic, serait plus compétente, mieux informée et plus douée en matière de raisonnement que ChatGPT d’OpenAI et Gemini de Google.

Opus, Sonnet et Haiku

Claude 3 est un produit unique qui propose trois modèles différents. Opus et Sonnet sont déjà disponibles via le site web de Claude 3 et sous forme d’API pour les développeurs. Le modèle Haiku, plus rapide, sera bientôt disponible, selon Anthropic.

D’après les recherches d’Anthropic, le modèle Opus surpasse GPT-3.5, GPT-4 et Gemini dans plusieurs domaines clés. Les tests effectués par la société ont porté sur la culture générale, mais aussi sur des connaissances de niveau universitaire – notamment des raisonnements d’experts – sur la résolution de problèmes mathématiques de niveau basique et sur des compétences de codage. Grâce à sa formation et à ses connaissances plus poussées, Claude 3 présente « des niveaux de compréhension et de fluidité proches de ceux de l’être humain pour les tâches complexes », fait valoir Anthropic.

Claude 3 se targue également de temps de réponse beaucoup plus rapides. Le modèle Sonnet, notamment, est deux fois plus rapide que les versions Claude 2 et Claude 2.1, selon les tests. Ce modèle est idéal, selon Anthropic, pour rechercher des informations ou automatiser des ventes.

Haiku est le plus rapide des trois modèles. Il est capable de lire un document de recherche dense avec des tableaux et des illustrations en moins de trois secondes.

publicité

Plus de compréhension et moins d’hallucinations

Anthropic affirme également que Claude 3 est plus précis et moins sujet aux erreurs que ses versions précédentes. Pour vérifier cette affirmation, l’entreprise a soumis ses différents modèles à un grand nombre de questions complexes et factuelles. Avec le modèle Opus, Claude 3 a obtenu deux fois plus de bonnes réponses que Claude 2.1. La nouvelle version a également produit moins de mauvaises réponses et d’hallucinations.

Afin d’éviter de fournir des informations préjudiciables, les IA refusent souvent de répondre à des questions jugées inappropriées. Mais il arrive aussi qu’elles interprètent par erreur une question inoffensive comme étant nuisible. Lors des tests effectués par Anthropic, Claude 3 a été moins enclin que ses versions précédentes à refuser de répondre à des questions inoffensives. A cet égard, les trois modèles de Claude 3 ont fait preuve d’une meilleure compréhension des requêtes et d’une plus grande capacité à distinguer les questions nuisibles des questions inoffensives.

Anthropic présente également Claude 3 comme étant plus facile à utiliser, capable d’accepter des messages plus longs et de mieux retenir les informations des messages précédents.

Analyser et résumer des documents

Parmi les améliorations de Claude, l’une des principales est sa prise en charge des fichiers dans les requêtes. Il est désormais possible de soumettre à l’IA divers types de fichiers, notamment des images, des PDF, des textes, des fichiers Microsoft Office, des tableurs au format CSV ou encore des fichiers HTML.

Selon ce que vous lui demandez, Claude sera ensuite capable d’analyser, de résumer et de répondre à des questions sur le contenu de ces fichiers.

Pour tester Claude 3, rendez-vous sur le site web consacré à l’IA d’Anthropic. La version gratuite du site utilise le modèle Sonnet pour répondre à vos questions. L’abonnement Claude Pro, disponible pour 20 dollars par mois, utilise le modèle Opus, le plus avancé. Il permet aussi plusieurs avantages, notamment un accès prioritaire quand il y a un pic d’utilisation et un accès aux nouvelles fonctionnalités en avant-première.

Source : ZDNet.com

Leave a Reply

Discover more from Ultimatepocket

Subscribe now to keep reading and get access to the full archive.

Continue reading