Comment SynthID Text permet-il de détecter et de marquer les textes générés par l'IA sans compromettre leur qualité ?

Google a récemment annoncé la mise à disposition générale de sa technologie de watermarking, SynthID Text, qui permet aux développeurs de marquer et de détecter les textes générés par des modèles d’IA.

Téléchargeable sur la plateforme d’IA Hugging Face et inclus dans la boîte à outils Responsible GenAI de Google, SynthID Text est désormais accessible gratuitement aux développeurs et aux entreprises.

Comment fonctionne SynthID Text ?

Le processus derrière SynthID Text repose sur la manière dont les modèles de génération de texte prédisent les mots. Lorsque l’on soumet une requête, comme Quel est votre fruit préféré ?, le modèle analyse quel token (un caractère ou un mot) est le plus susceptible de suivre un autre. Chaque token se voit attribuer un score en fonction de la probabilité qu’il soit inclus dans le texte généré.

SynthID Text ajoute des informations supplémentaires dans cette distribution des tokens en modulant la probabilité que certains tokens soient choisis. Ces ajustements permettent de créer une empreinte numérique, ou “watermark”, dans le schéma de distribution des tokens. Ainsi, en comparant ces schémas, il devient possible de déterminer si un texte a été généré par un outil d’IA ou s’il provient d’une autre source.

Quels sont les risques potentiels des IA capables de tromper les utilisateurs et de contourner les systèmes de sécurité selon les chercheurs d’Anthropic ?

Une intégration sans compromis

Google affirme que SynthID Text, intégré à ses modèles Gemini depuis le printemps, n’affecte ni la qualité, ni la précision, ni la rapidité des textes générés. Même si le texte est modifié, paraphrasé ou raccourci, la technologie est capable de détecter son origine. Toutefois, Google admet que SynthID Text présente certaines limites, notamment avec des textes courts ou traduits, et avec des réponses à des questions factuelles, où il est difficile de modifier la distribution des tokens sans compromettre l’exactitude.

Vers une adoption généralisée ?

Google n’est pas seul à travailler sur le watermarking des textes générés par l’IA. OpenAI mène également des recherches dans ce domaine, bien que leurs technologies n’aient pas encore été déployées en raison de considérations techniques et commerciales. Si ces techniques se généralisent, elles pourraient freiner l’usage des “détecteurs d’IA” souvent inefficaces qui flaguent à tort des textes comme étant générés par l’IA.

Toutefois, la question demeure : cette technologie sera-t-elle largement adoptée ? La législation pourrait bien en décider. En Chine, le marquage des contenus générés par IA est déjà obligatoire, et la Californie envisage de suivre le même chemin. D’ici 2026, selon certaines études, 90 % des contenus en ligne pourraient être synthétiques, soulignant l’urgence de la situation.

Quels sont les principaux défis techniques et sociaux que Google et Kairos Power devront surmonter pour réaliser leur projet de réacteurs nucléaires d’ici 2030 ?

Avec SynthID Text, Google propose une solution technologique qui pourrait révolutionner la manière dont nous identifions les textes générés par IA. Bien que cette technologie ait ses limites, notamment pour les textes courts et factuels, elle constitue une avancée majeure dans le domaine du watermarking. Si l’adoption généralisée de cette technologie se concrétise, elle pourrait devenir un standard incontournable dans la lutte contre la désinformation et la fraude en ligne.

Comment SynthID Text permet-il de détecter et de marquer les textes générés par l’IA sans compromettre leur qualité ?

Comment fonctionne SynthID Text ?

Une intégration sans compromis

Vers une adoption généralisée ?

Partager cet article

Actualités

GTA 6 Online pourrait arriver bien plus tôt que prévu : une fuite dévoile une fenêtre de sortie proche du lancement

GTA 6 : des détails sur une mission potentielle ont fuité et révèlent de nouvelles informations sur le jeu

Monopoly go : jalons de récompenses du tournoi « Tycoon Class », conseils et informations avant sa sortie

GTA 6 : un ancien développeur brise l’illusion et alerte sur des trailers “trop parfaits” qui pourraient tromper les joueurs

GTA 5 : une découverte inattendue révèle un personnage issu d’un jeu Rockstar oublié

LAISSER UN COMMENTAIRE Annuler la réponse