Présentation de Claude 3.5 Sonnet AI : Révolutionner l'interaction avec l'ordinateur
Anthropic a récemment lancé son modèle Claude 3.5 Sonnet AI, qui présente une addition révolutionnaire : la capacité de contrôler un ordinateur simplement en observant l'écran. Cette fonctionnalité, appelée utilisation de l'ordinateur, est actuellement en version bêta publique et est disponible via API, permettant aux développeurs de diriger Claude pour effectuer des tâches sur un ordinateur comme un humain.
Comparaison avec d'autres outils d'IA
Cette nouvelle fonctionnalité place Claude 3.5 sur un terrain de jeu similaire aux outils d'IA des grands concurrents comme Microsoft et OpenAI. Le Copilot Vision de Microsoft et l'application de bureau ChatGPT d'OpenAI utilisent la capacité d'interpréter les informations à l'écran. De plus, l'application Gemini de Google sur les téléphones Android présente des capacités analogues, mais aucune d'entre elles n'a encore déployé des outils entièrement fonctionnels capables d'effectuer des actions de clic de manière autonome et d'interagir en profondeur avec les systèmes.
Phase expérimentale et limitations
Bien que la fonctionnalité d'utilisation de l'ordinateur soit innovante, Anthropic a averti les utilisateurs qu'elle est encore expérimentale. La société décrit les capacités actuelles comme "ennuyantes et sujettes aux erreurs", incitant les développeurs à fournir des retours pour améliorer sa fonctionnalité. Certaines limitations notables incluent :
- Claude ne peut pas encore effectuer d'actions complexes comme tirer ou zoomer.
- L'approche "flipbook" que Claude utilise — prenant des captures d'écran au lieu d'une vidéo continue — signifie qu'il peut manquer des événements rapides ou des notifications.
- Il existe des mesures proactives pour limiter l'interaction de Claude avec les réseaux sociaux et certaines activités sensibles telles que les élections.
Améliorations de performances dans le codage et l'utilisation d'outils
Le modèle Claude 3.5 Sonnet montre également des avancées significatives dans divers benchmarks de performance. Plus précisément :
- Codage agentique : Les performances sur la métrique SWE-bench Vérifié se sont considérablement améliorées, passant de 33,4 % à 49,0 %, surpassant tous les modèles de codage disponibles publiquement.
- Tâches d'utilisation d'outils : Sur le TAU-bench, les scores de Claude ont augmenté de 62,6 % à 69,2 % dans les applications de vente au détail et de 36,0 % à 46,0 % dans le domaine plus compliqué des compagnies aériennes.
Tarification compétitive et stratégie de prix
Malgré ces améliorations, Anthropic a maintenu la même structure tarifaire et la même vitesse pour le modèle Claude 3.5 Sonnet que pour son prédécesseur, assurant ainsi l'accessibilité pour les clients actuels et potentiels.
Perspectives d'avenir
Avec les développeurs invités à tester la fonction d'utilisation de l'ordinateur, la perspective d'un raffinement rapide et d'une augmentation de l'efficacité est prometteuse. À mesure que les retours s'accumulent, il est probable que les futures itérations amélioreront la capacité de Claude à comprendre et à exécuter un plus large éventail de tâches de manière efficace.
Conclusion
Le modèle Claude 3.5 Sonnet AI d'Anthropic représente une avancée décisive dans la technologie de l'IA, en particulier dans son potentiel à améliorer la productivité et l'interaction des utilisateurs avec les ordinateurs. Bien qu'étant encore à ses débuts, les retours des développeurs et des parties prenantes seront cruciaux pour optimiser ses capacités à l'avenir.
Pour plus de mises à jour sur les tendances technologiques de l'IA, suivez notre série d'articles où nous explorons divers outils d'IA et leur impact sur l'informatique moderne.
Laisser un commentaire
Tous les commentaires sont modérés avant d'être publiés.
Ce site est protégé par hCaptcha, et la Politique de confidentialité et les Conditions de service de hCaptcha s’appliquent.