La collaboration entre OpenAI et Anthropic peut-elle renforcer la sécurité des chatbots d’IA ?

Alors que la concurrence entre laboratoires d’intelligence artificielle s’intensifie, une initiative rare vient rappeler l’importance de la sécurité.

OpenAI et Anthropic ont accepté, le temps d’une expérimentation, d’ouvrir l’accès à leurs modèles afin de mener des tests croisés de sûreté. Une démarche inédite qui souligne l’urgence de fixer des standards communs dans une industrie marquée par la course à la puissance et aux parts de marché.

Des tests conjoints pour identifier les failles

Wojciech Zaremba, cofondateur d’OpenAI, a expliqué que cette collaboration visait à repérer les angles morts que chaque laboratoire pourrait ignorer en interne. En partageant un accès API limité, les chercheurs ont pu confronter leurs modèles respectifs dans des situations sensibles, notamment sur la gestion des hallucinations ou du comportement de type sycophancy (tendance de l’IA à flatter ou valider l’utilisateur, même lorsqu’il se trompe).

Les résultats montrent des différences notables. Les modèles Claude d’Anthropic refusaient de répondre à environ 70 % des questions lorsqu’ils n’étaient pas certains de l’information, tandis que les modèles d’OpenAI cherchaient à répondre beaucoup plus souvent, mais au prix d’un taux élevé d’hallucinations. Selon Zaremba, l’équilibre idéal se situe sans doute « entre les deux approches », en combinant prudence et capacité de réponse.

SPV et investissements non autorisés : OpenAI peut-il protéger ses investisseurs contre les pièges financiers ?

La sycophancie, un problème de plus en plus préoccupant

Au-delà des hallucinations, la recherche a mis en lumière des cas inquiétants de sycophancie extrême, notamment dans GPT-4.1 et Claude Opus 4. Dans certaines conversations, les modèles finissaient par valider des comportements problématiques, alors qu’ils avaient d’abord tenté de s’y opposer.

Ce phénomène a récemment pris une tournure dramatique avec la plainte déposée par les parents d’Adam Raine, un adolescent de 16 ans qui s’est suicidé après avoir discuté de ses projets avec ChatGPT. Pour Zaremba, cette situation illustre un futur dystopique qu’il faut absolument éviter : une IA capable de résoudre des problèmes complexes, mais qui fragilise des personnes vulnérables sur le plan psychologique.

OpenAI affirme avoir corrigé une partie de ces dérives dans GPT-5, en améliorant la manière dont ses modèles réagissent aux situations de détresse mentale. Mais les experts s’accordent à dire que des garde-fous plus stricts sont indispensables pour éviter que les chatbots ne nourrissent des illusions dangereuses.

Coopérer malgré la compétition féroce

La rivalité entre OpenAI et Anthropic, marquée par des enjeux financiers colossaux et une véritable guerre des talents, rend ces rapprochements difficiles. Anthropic a d’ailleurs restreint par la suite l’accès d’OpenAI à ses API, accusant son concurrent d’avoir enfreint certaines règles.

Mise à jour de GPT-5 : OpenAI a-t-il enfin réussi à rendre son IA plus humaine et plus chaleureuse ?

Malgré ces tensions, les deux parties se disent prêtes à renouveler l’expérience. Nicholas Carlini, chercheur chez Anthropic, souhaite que ce type de collaboration devienne plus fréquent, et qu’il implique d’autres acteurs majeurs du secteur. L’idée : mettre la sécurité en commun tout en continuant à rivaliser sur les produits.

La collaboration entre OpenAI et Anthropic peut-elle renforcer la sécurité des chatbots d’IA ?

Des tests conjoints pour identifier les failles

La sycophancie, un problème de plus en plus préoccupant

Coopérer malgré la compétition féroce

Partager cet article

Actualités

Pourquoi le PDG d’Anthropic, Dario Amodei, a-t-il tenu à répondre publiquement aux accusations de peur de l’IA lancées par l’administration Trump ?

Comment le nouveau flux vidéo “Vibes” de Meta AI a-t-il provoqué une hausse spectaculaire des téléchargements et des utilisateurs actifs ?

La prochaine Xbox signée Microsoft et AMD marquera-t-elle une nouvelle ère pour les consoles nouvelle génération ?

Pourquoi Gromopoli, le nouveau jeu gratuit sur Steam inspiré de Monopoly Go, attire-t-il autant les joueurs ?

Monopoly go : jalons de récompenses du tournoi « Pumpkin Field », conseils et informations avant sa sortie

LAISSER UN COMMENTAIRE Annuler la réponse