AI technology

Google Gemini belebt die Funktion zur Generierung von KI-Personen mit Imagen 3

AI-generated images by Google Gemini using Imagen 3 technology.

Google bringt Bildgenerierungsfunktion im Gemini AI-Chatbot zurück

Google führt die Möglichkeit für Benutzer wieder ein, über seinen Gemini AI-Chatbot Bilder von Personen zu generieren, nachdem die Funktion Anfang dieses Jahres kurzzeitig ausgesetzt wurde. Die Entscheidung folgt auf verschiedene Benutzerbeschwerden über historisch ungenaue Bilder, die mit dem Tool erzeugt wurden, darunter umstrittene Darstellungen wie rassisch vielfältige Nazis.

Launch des Frühzugangs

In einer aktuellen Ankündigung bestätigte Google, dass eine Frühzugangsversion dieser Bildgenerierungsfunktion den Benutzern von Gemini Advanced, Business und Enterprise in den kommenden Tagen in englischer Sprache zur Verfügung stehen wird. Diese Funktionalität wird von Imagen 3, der neuesten Iteration von Googles AI-Text-zu-Bild-Generator, unterstützt.

Was ist Imagen 3?

Imagen 3 wurde diesen Monat leise über Googles AI Test Kitchen eingeführt und soll nun in Gemini AI in allen unterstützten Sprachen integriert werden. Das fortschrittliche Tool verfügt über die Fähigkeit, eine Vielzahl visueller Inhalte zu erstellen, die von fotorealistischen Landschaften bis hin zu strukturierten Ölgemälden reichen, alles generiert mit nur wenigen beschreibenden Worten des Benutzers.

Fehlerbehebung früherer Bedenken

Google hatte die Bildgenerierung von Menschen durch Gemini im Februar zunächst ausgesetzt, da die Häufigkeit historisch ungenauer Ergebnisse besorgniserregend war. Mit dem verbesserten Imagen 3-Modell versichert das Unternehmen, dass es integrierte Schutzmaßnahmen implementiert hat, die darauf abzielen, die Genauigkeit der generierten Bilder zu verbessern. Wie Dave Citron, Senior Director of Product Management für Gemini bei Google, betonte, zeigt das neue Modell vielversprechende Leistungen im Vergleich zu anderen derzeit verfügbaren Bildgenerierungsoptionen.

Was Gemini-Benutzer wissen müssen

  • Gemini wird die Erstellung fotorealistischer Bilder von öffentlichen Personen nicht zulassen.
  • Inhalte, die Minderjährige betreffen, sind strengstens verboten.
  • Generierte Bilder, die grausame, gewalttätige oder sexuelle Themen darstellen, werden nicht erlaubt sein.

Citron betonte, dass nicht jedes von Gemini generierte Bild Perfektion erreichen wird, das Unternehmen jedoch verpflichtet ist, das Feedback der Benutzer im Frühzugang zu hören, um das Tool weiter zu verfeinern.

Vergleich mit der Remagine-Funktion

Es ist wichtig, diese Funktion von Googles neuer Remagine-Funktionalität zu unterscheiden, die es Benutzern ermöglicht, AI-generierte Elemente zu Fotografien hinzuzufügen, die mit der neuesten Reihe von Pixel 9-Smartphones des Unternehmens aufgenommen wurden. Diese gegensätzliche Funktion hebt Googles breitere Strategie hervor, AI-Technologien in seine Verbraucherangebote zu integrieren.

Ausblick

Google plant, die Möglichkeit zur Erstellung AI-generierter Bilder von Personen einem breiteren Publikum anzubieten und bald Unterstützung für weitere Sprachen hinzuzufügen. Diese Expansion spiegelt Googles fortwährende Bemühungen wider, seine AI-Fähigkeiten zu verbessern, während die Komplexität einer genauen und verantwortungsvollen Bildgenerierung bewältigt wird.

Für weitere Informationen zu diesen Updates und um über zukünftige Veröffentlichungen auf dem Laufenden zu bleiben, bleiben Sie mit den offiziellen Kanälen von Google und verwandten Techniknachrichtenseiten verbunden.

Weiterlesen

Google custom AI chatbots called Gems for personalized assistance and creativity.
Mikhail Parakhin, CTO of Shopify, expert in AI and technology development.

Hinterlasse einen Kommentar

Alle Kommentare werden vor der Veröffentlichung geprüft.

Diese Website ist durch hCaptcha geschützt und es gelten die allgemeinen Geschäftsbedingungen und Datenschutzbestimmungen von hCaptcha.