OpenAI bewertet GPT-4o als mittleres Risiko: Erkenntnisse aus der Syst

OpenAI veröffentlicht GPT-4o Systemkarte: Ein Schritt in Richtung Transparenz bei der KI-Sicherheit

OpenAI hat seine GPT-4o Systemkarte eingeführt, ein umfassendes Forschungsdokument, das die Sicherheitsmaßnahmen und Risikobewertungen beschreibt, die vor der Veröffentlichung seines neuesten Modells durchgeführt wurden. Seit seiner Einführung im Mai 2023 wurde GPT-4o strengen Tests unterzogen, um sicherzustellen, dass seine Fähigkeiten den Sicherheitsstandards entsprechen.

Wichtige Risikobewertungen durch externe Experten

Vor seinem öffentlichen Debüt beauftragte OpenAI eine externe Gruppe von Red-Teamern – Sicherheitsexperten, die für die Identifizierung potenzieller Schwachstellen in Systemen verantwortlich sind – mit der Bewertung der wichtigsten Risiken im Zusammenhang mit GPT-4o. Diese Praxis ist in der Technologiebranche Standard, um mögliche Bedrohungen zu mindern. Die Bewertung konzentrierte sich auf potentielle Probleme wie:

Schaffung unautorisierter Sprachklone
Produktion von erotischem und gewalttätigem Inhalt
Vervielfältigung urheberrechtlich geschützter Audiosegmente

Die Ergebnisse zeigten, dass das Gesamtrisiko für GPT-4o als mittleres Risiko kategorisiert wurde. Diese Bewertung basierte auf der Analyse von vier wichtigen Risikokategorien: Cybersicherheit, biologische Bedrohungen, Überzeugungskraft und Modellautonomie. Bemerkenswerterweise wurden die Risiken in den Kategorien Cybersicherheit, biologische Bedrohungen und Modellautonomie als niedrig erachtet, während die Kategorie Überzeugungskraft einige Bedenken hervorhob.

Hervorhebung der Überzeugungsrisiken

Die Forscher stellten fest, dass bestimmte von GPT-4o erzeugte Textproben das Potenzial hatten, die Leser effektiver zu überzeugen als menschlich generierte Texte. Es wurde jedoch auch festgestellt, dass die Antworten des Modells insgesamt nicht einheitlich überzeugender waren.

Einblicke aus dem Team von OpenAI

Lindsay McCallum Rémy, eine Sprecherin von OpenAI, erklärte, dass die Systemkarte Bewertungen enthält, die sowohl von internen Teams als auch von externen Testern, wie den Gruppen für Modellbewertung und Bedrohungsforschung (METR) und Apollo Research, erstellt wurden. Diese Teams tragen erheblich zu den allgemeinen Sicherheitsbewertungen von KI-Systemen bei.

Kontext der Veröffentlichung von GPT-4o

Die Veröffentlichung der GPT-4o Systemkarte durch OpenAI erfolgt zu einem entscheidenden Zeitpunkt, inmitten wachsender Kritik an den Sicherheitsstandards des Unternehmens. Bedenken wurden von verschiedenen Interessengruppen, einschließlich Mitarbeitern und öffentlichen Beamten, geäußert. Kürzlich berichtete The Verge über einen offenen Brief von US-Senatorin Elizabeth Warren und Abgeordneter Lori Trahan, der OpenAI auffordert, seine Verfahren in Bezug auf Whistleblower und Sicherheitsüberprüfungen zu präzisieren. Der Brief hebt erhebliche Sicherheitsprobleme hervor, die öffentlich angesprochen wurden, einschließlich der vorübergehenden Abberufung von CEO Sam Altman im Jahr 2023 aufgrund von Bedenken des Vorstands und dem Abgang eines Sicherheitsleiters, der anzeigte, dass Sicherheitsmaßnahmen von der Verfolgung neuer Technologien überschattet wurden.

Implikationen vor der Präsidentschaftswahl

Die Veröffentlichung eines hochfähigen multimodalen Modells wie GPT-4o kurz vor der US-Präsidentschaftswahl birgt zusätzliche Risiken. Es gibt erhebliche Bedenken in Bezug auf Fehlinformationen und das Potenzial, dass das Modell von böswilligen Akteuren ausgenutzt wird. OpenAI betont, dass es aktiv reale Szenarien testet, um diese Risiken zu mindern und den Missbrauch ihrer Technologie zu verhindern.

Aufrufe nach mehr Transparenz

Die Tech-Community hat Aufrufe laut werden lassen, dass OpenAI die Transparenz bezüglich seiner Modelltrainingsdaten – die Ursprünge seiner Datensätze, wie beispielsweise ob sie YouTube-Inhalte enthalten – und seiner Sicherheitsprüfprozesse erhöhen sollte. In Kalifornien arbeitet der Staats senator Scott Wiener an Gesetzen, die Vorschriften für große Sprachmodelle einführen würden, die Unternehmen rechtlich zur Verantwortung ziehen, wenn ihre KI-Technologie verantwortungslos genutzt wird.

Die Zukunft der KI-Sicherheit

Würde dieses Gesetz verabschiedet, würde es OpenAI verpflichten, dass die Grenzmodelle umfangreichen staatlich vorgeschriebenen Risikobewertungen entsprechen, bevor sie der Öffentlichkeit zugänglich gemacht werden. Letztendlich ist die wichtigste Erkenntnis aus der GPT-4o Systemkarte, dass es trotz der Beteiligung externer Experten eine starke Abhängigkeit von OpenAI gibt, Selbstbewertungen seiner Modelle durchzuführen.

Fazit

Während OpenAI seine KI-Technologie weiter vorantreibt, veranschaulicht die Prüfung seiner Sicherheitspraktiken die Notwendigkeit sorgfältiger Aufsicht und transparenter Kommunikation. Interessengruppen und die Öffentlichkeit werden genau beobachten, während sich die neuen Entwicklungen in den Sicherheitsstandards der KI entfalten, in der Hoffnung, dass Organisationen ethische Verantwortung parallel zu technologischen Fortschritten priorisieren.

OpenAI bewertet GPT-4o als mittleres Risiko: Erkenntnisse aus der Systemkarte