Google présente Whisk : un outil de génération d'images révolutionnaire
Google a dévoilé un outil d'IA innovant nommé Whisk, qui permet aux utilisateurs de générer des images en utilisant des images existantes comme invites, offrant une alternative rafraîchissante aux invites basées sur du texte traditionnel.
Comment fonctionne Whisk
Avec Whisk, vous pouvez télécharger plusieurs images pour indiquer votre sujet, scène et style désirés pour votre image générée par l'IA. Cette flexibilité permet une exploration créative beaucoup plus riche et nuancée. Si vous n'avez pas d'images spécifiques, vous pouvez simplement cliquer sur l'icône des dés, et Google fournira une sélection d'images générées par l'IA pour vous aider à guider votre processus créatif. De plus, les utilisateurs ont la possibilité d'inclure d'autres descriptions textuelles pour affiner leurs résultats d'image.
Expérience et fonctionnalités utilisateur
Une fois les images générées, Whisk présente les résultats avec une invite textuelle correspondante. Les utilisateurs peuvent soit marquer comme favori, télécharger, ou affiner davantage les images en modifiant les invites textuelles ou en fournissant plus de détails via la boîte de texte. Ce processus itératif encourage les utilisateurs à expérimenter et à peaufiner leurs créations.
Vision de Google pour Whisk
Selon un article de blog de Google, Whisk est conçu pour une exploration visuelle rapide plutôt que d'atteindre des modifications d'édition parfaites en pixels. L'entreprise reconnaît que l'IA ne répond pas toujours aux attentes des utilisateurs, d'où la possibilité d'ajuster les invites en conséquence. Cette philosophie de conception positionne Whisk comme un outil d'expérimentation créative plutôt que comme une application de conception graphique de précision.
Performance et résultats
Dans mon expérience initiale avec Whisk, j'ai trouvé engageant de jouer avec diverses images. Bien que le processus de génération d'images prenne quelques secondes, les résultats créatifs - bien que parfois particuliers - sont divertissants et facilement modifiables, permettant une créativité continue.
Fondement technologique : Imagen 3 et Veo 2
Whisk fonctionne sur la dernière version du modèle de génération d'images Imagen 3 de Google, qui a également été annoncé récemment. De plus, Google a présenté le Veo 2, un modèle de génération vidéo amélioré qui possède une compréhension supérieure de la cinématographie. L'entreprise affirme que Veo 2 hallucine moins d'inexactitudes - comme des doigts supplémentaires - que ses prédécesseurs, offrant aux utilisateurs une expérience de génération vidéo plus fiable. Veo 2 sera initialement disponible via VideoFX de Google, avec des plans pour étendre son utilisation à des plateformes comme YouTube Shorts dans l'année à venir.
Conclusion
Avec des outils comme Whisk et les avancées apportées par Imagen 3 et Veo 2, Google repousse les limites de la créativité de l'IA. Ces outils non seulement responsabilisent les utilisateurs, mais favorisent également un environnement d'exploration continue dans l'art numérique et la production vidéo.
Laisser un commentaire
Tous les commentaires sont modérés avant d'être publiés.
Ce site est protégé par hCaptcha, et la Politique de confidentialité et les Conditions de service de hCaptcha s’appliquent.