Google a rรฉcemment annoncรฉ la mise ร disposition gรฉnรฉrale de sa technologie de watermarking, SynthID Text, qui permet aux dรฉveloppeurs de marquer et de dรฉtecter les textes gรฉnรฉrรฉs par des modรจles d’IA.
Tรฉlรฉchargeable sur la plateforme d’IA Hugging Face et inclus dans la boรฎte ร outils Responsible GenAI de Google, SynthID Text est dรฉsormais accessible gratuitement aux dรฉveloppeurs et aux entreprises.
Lire aussi :
- Quelles amรฉliorations Google a-t-il apportรฉes ร la fonctionnalitรฉ de gรฉnรฉration d’images de Gemini ?
- Lโoptimisme dโAnthropic sur lโavenir de lโIA : lโIA peut-elle vraiment transformer le monde ?
Comment fonctionne SynthID Text ?
Le processus derriรจre SynthID Text repose sur la maniรจre dont les modรจles de gรฉnรฉration de texte prรฉdisent les mots. Lorsque lโon soumet une requรชte, comme Quel est votre fruit prรฉfรฉrรฉ ?, le modรจle analyse quel token (un caractรจre ou un mot) est le plus susceptible de suivre un autre. Chaque token se voit attribuer un score en fonction de la probabilitรฉ qu’il soit inclus dans le texte gรฉnรฉrรฉ.
SynthID Text ajoute des informations supplรฉmentaires dans cette distribution des tokens en modulant la probabilitรฉ que certains tokens soient choisis. Ces ajustements permettent de crรฉer une empreinte numรฉrique, ou “watermark”, dans le schรฉma de distribution des tokens. Ainsi, en comparant ces schรฉmas, il devient possible de dรฉterminer si un texte a รฉtรฉ gรฉnรฉrรฉ par un outil d’IA ou s’il provient d’une autre source.
Une intรฉgration sans compromis
Google affirme que SynthID Text, intรฉgrรฉ ร ses modรจles Gemini depuis le printemps, n’affecte ni la qualitรฉ, ni la prรฉcision, ni la rapiditรฉ des textes gรฉnรฉrรฉs. Mรชme si le texte est modifiรฉ, paraphrasรฉ ou raccourci, la technologie est capable de dรฉtecter son origine. Toutefois, Google admet que SynthID Text prรฉsente certaines limites, notamment avec des textes courts ou traduits, et avec des rรฉponses ร des questions factuelles, oรน il est difficile de modifier la distribution des tokens sans compromettre l’exactitude.
Vers une adoption gรฉnรฉralisรฉe ?
Google n’est pas seul ร travailler sur le watermarking des textes gรฉnรฉrรฉs par l’IA. OpenAI mรจne รฉgalement des recherches dans ce domaine, bien que leurs technologies n’aient pas encore รฉtรฉ dรฉployรฉes en raison de considรฉrations techniques et commerciales. Si ces techniques se gรฉnรฉralisent, elles pourraient freiner l’usage des “dรฉtecteurs d’IA” souvent inefficaces qui flaguent ร tort des textes comme รฉtant gรฉnรฉrรฉs par l’IA.
Toutefois, la question demeure : cette technologie sera-t-elle largement adoptรฉe ? La lรฉgislation pourrait bien en dรฉcider. En Chine, le marquage des contenus gรฉnรฉrรฉs par IA est dรฉjร obligatoire, et la Californie envisage de suivre le mรชme chemin. D’ici 2026, selon certaines รฉtudes, 90 % des contenus en ligne pourraient รชtre synthรฉtiques, soulignant l’urgence de la situation.
Avec SynthID Text, Google propose une solution technologique qui pourrait rรฉvolutionner la maniรจre dont nous identifions les textes gรฉnรฉrรฉs par IA. Bien que cette technologie ait ses limites, notamment pour les textes courts et factuels, elle constitue une avancรฉe majeure dans le domaine du watermarking. Si lโadoption gรฉnรฉralisรฉe de cette technologie se concrรฉtise, elle pourrait devenir un standard incontournable dans la lutte contre la dรฉsinformation et la fraude en ligne.