Anthropic startet Claude 3.5 Sonett: KI kann Computer steuern

Einführung von Claude 3.5 Sonnet AI: Revolutionierung der Computerinteraktion

Anthropic hat kürzlich sein Claude 3.5 Sonnet AI-Modell eingeführt, das eine bahnbrechende Neuerung bietet: die Möglichkeit, einen Computer einfach durch das Beobachten des Bildschirms zu steuern. Diese Funktion, genannt Computerbenutzung, befindet sich derzeit in der öffentlichen Beta-Phase und ist über eine API verfügbar, die es Entwicklern ermöglicht, Claude Aufgaben auf einem Computer ausführen zu lassen, ganz wie ein Mensch.

Vergleich mit anderen KI-Tools

Diese neue Funktion versetzt Claude 3.5 auf ein ähnliches Spielfeld wie die KI-Tools von großen Wettbewerbern wie Microsoft und OpenAI. Microsofts Copilot Vision und OpenAIs ChatGPT-Desktop-App nutzen die Fähigkeit, Bildschirminformationen zu interpretieren. Darüber hinaus bietet die Gemini-App von Google auf Android-Handys ähnliche Funktionen, aber keines dieser Tools hat bisher vollständig funktionale Werkzeuge eingeführt, die autonom Klickaktionen ausführen und tiefgreifend mit Systemen interagieren können.

Experimentelle Phase und Einschränkungen

Obwohl die Computerbenutzungs-Funktion innovativ ist, hat Anthropic die Benutzer gewarnt, dass sie sich noch in der experimentellen Phase befindet. Das Unternehmen beschreibt die aktuellen Fähigkeiten als "umständlich und fehleranfällig" und fordert Entwickler auf, Feedback zu geben, um die Funktionalität zu verbessern. Einige bemerkenswerte Einschränkungen sind:

Claude kann bisher keine komplexen Aktionen wie Ziehen oder Zoomen durchführen.
Der von Claude verwendete „Flipbook“-Ansatz – Screenshots anstelle eines kontinuierlichen Videos – bedeutet, dass er schnelle Ereignisse oder Benachrichtigungen möglicherweise verpasst.
Es gibt proaktive Maßnahmen, um Claudes Interaktion mit sozialen Medien und bestimmten sensiblen Aktivitäten wie Wahlen einzuschränken.

Leistungsverbesserungen beim Codieren und bei der Werkzeugnutzung

Das Claude 3.5 Sonnet-Modell zeigt auch bedeutende Fortschritte in verschiedenen Leistungsbenchmarks. Insbesondere:

Agentic Coding: Die Leistung im SWE-bench Verified-Metrik verbesserte sich signifikant von 33,4 % auf 49,0 % und übertraf damit alle öffentlich verfügbaren Codierungsmodelle.
Werkzeugnutzungsaufgaben: Im TAU-bench stiegen Claudes Punktzahlen in der Einzelhandelsanwendung von 62,6 % auf 69,2 % und im komplizierteren Flugreisendomain von 36,0 % auf 46,0 %.

Wettbewerbsfähige Preise und Preisstrategie

Trotz dieser Verbesserungen hat Anthropic die gleiche Preisstruktur und Geschwindigkeit für das Claude 3.5 Sonnet-Modell beibehalten wie für seinen Vorgänger, um die Zugänglichkeit für bestehende und potenzielle Kunden sicherzustellen.

Zukünftige Aussichten

Mit Entwicklern, die eingeladen sind, die Funktion Computerbenutzung zu testen, ist die Aussicht auf schnelle Verfeinerung und Effizienzsteigerungen vielversprechend. Da das Feedback zunimmt, ist es wahrscheinlich, dass zukünftige Iterationen Claudes Fähigkeit verbessern werden, ein breiteres Spektrum an Aufgaben effektiv zu verstehen und auszuführen.

Fazit

Anthropics Claude 3.5 Sonnet AI-Modell stellt einen entscheidenden Fortschritt in der KI-Technologie dar, insbesondere in seinem Potenzial, die Produktivität und Interaktion der Benutzer mit Computern zu verbessern. Obwohl es sich noch in der frühen Phase befindet, wird das Feedback von Entwicklern und Interessengruppen entscheidend sein, um seine Fähigkeiten weiter zu optimieren.

Für weitere Updates zu Trends in der KI-Technologie folgen Sie unserer Artikelreihe, in der wir verschiedene KI-Tools und deren Auswirkungen auf das moderne Computing untersuchen.