Google Labs expรฉrimente un nouvel outil de gรฉnรฉration dโimages appelรฉ Whisk, conรงu pour repousser les limites de la crรฉativitรฉ numรฉrique.
Cette fonctionnalitรฉ innovante permet de combiner plusieurs images pour crรฉer une ลuvre unique en jouant sur le sujet, la scรจne et le style. Disponible en phase de test aux รtats-Unis, Whisk pourrait bien transformer la faรงon dont nous concevons les images gรฉnรฉrรฉes par lโintelligence artificielle.
Lire aussi :
- Quelles sont les implications de la bataille juridique entre WordPress et WP Engine pour lโavenir des solutions dโhรฉbergement basรฉes sur WordPress ?
- Comment les technologies de gรฉnรฉration vocale par IA peuvent-elles รชtre rรฉgulรฉes pour รฉviter leur utilisation dans des campagnes de dรฉsinformation ?
Whisk : comment รงa fonctionne ?
Lโoutil repose sur Imagen 3, le modรจle de gรฉnรฉration dโimages dรฉveloppรฉ par Google. Contrairement aux gรฉnรฉrateurs classiques basรฉs sur des descriptions textuelles, Whisk permet aux utilisateurs de partir directement dโimages. Le processus commence par la sรฉlection de trois รฉlรฉments : une image reprรฉsentant le sujet principal, une autre dรฉfinissant le dรฉcor, et une troisiรจme pour le style visuel. Par exemple, vous pouvez prendre une photo personnelle, choisir une scรจne futuriste comme arriรจre-plan et appliquer un style anime.
Une fois les images sรฉlectionnรฉes, Whisk gรฉnรจre automatiquement une lรฉgende dรฉtaillรฉe pour guider le modรจle dans la crรฉation. Les utilisateurs peuvent รฉgalement enrichir le processus en ajoutant des descriptions textuelles prรฉcises, telles que : ยซ Le sujet fait du vรฉlo volant dans un paysage nรฉon ยป.
Willow : la puce quantique de Google pourrait-elle prouver l’existence d’un multivers ?
Des rรฉsultats impressionnants mais perfectibles
Bien que prometteur, Whisk nโest pas exempt de limitations. Google reconnaรฎt que lโoutil se concentre sur des caractรฉristiques clรฉs des images sรฉlectionnรฉes, ce qui peut entraรฎner des rรฉsultats inattendus. Par exemple, le sujet gรฉnรฉrรฉ pourrait ne pas correspondre exactement ร sa taille, sa corpulence ou mรชme sa couleur de peau.
Pour pallier ces imprรฉcisions, Whisk offre la possibilitรฉ de consulter et dโajuster les lรฉgendes gรฉnรฉrรฉes automatiquement. Cela permet aux utilisateurs dโaffiner leurs crรฉations pour se rapprocher de leur vision initiale.
Une disponibilitรฉ limitรฉe mais prometteuse
Actuellement, Whisk est en phase expรฉrimentale et accessible uniquement aux utilisateurs basรฉs aux รtats-Unis via le site labs.google/whisk. Google nโa pas encore annoncรฉ de date de dรฉploiement global, mais cette technologie pourrait sโintรฉgrer ร dโautres services de lโentreprise si les tests sโavรจrent concluants.
Comment Reddit Answers se distingue-t-il des autres outils d’IA comme ChatGPT et Google ?
Avec Whisk, Google continue de repousser les frontiรจres de lโIA gรฉnรฉrative, en proposant des outils innovants qui mettent davantage lโaccent sur lโinteraction utilisateur. En combinant la puissance de lโintelligence artificielle et la crรฉativitรฉ humaine, Whisk pourrait ouvrir de nouvelles perspectives pour les artistes, les designers, et mรชme les amateurs de crรฉation visuelle.