OpenAI a dévoilé lundi son nouveau modèle phare d’intelligence artificielle générative, baptisé GPT-4o, où le o signifie omni.
Cette désignation reflète la capacité du modèle à traiter du texte, de la parole et de la vidéo, faisant de GPT-4o une innovation majeure dans le domaine de l’IA. Selon Mira Murati, directrice technique d’OpenAI, ce modèle offre une intelligence équivalente à celle de GPT-4 mais étend ses capacités à plusieurs modalités et médias, promettant une interaction future plus naturelle et intuitive entre les machines et les utilisateurs.
Lire aussi :
- Pourquoi les investisseurs deviennent-ils de plus en plus prudents vis-à-vis des investissements en intelligence artificielle malgré son potentiel de croissance annoncé ?
- Comment le Royaume-Uni envisage-t-il d’utiliser l’intelligence artificielle pour protéger les jeunes utilisateurs d’internet contre les contenus nuisibles et l’exploitation en ligne ?
Améliorations et fonctionnalités de GPT-4o
GPT-4o enrichit considérablement l’expérience utilisateur sur ChatGPT, la plateforme de chatbot alimentée par l’IA d’OpenAI. Ce nouveau modèle permet des interactions en temps réel et peut même capter les nuances de la voix de l’utilisateur pour y répondre de manière adaptée. Les capacités de vision par ordinateur sont également améliorées, permettant à ChatGPT de répondre rapidement à des questions concernant des photos ou des captures d’écran, que ce soit pour identifier un code logiciel ou une marque de vêtement.
GPT-4o promet des améliorations futures fascinantes, telles que la possibilité pour ChatGPT de “regarder” un match sportif en direct et d’en expliquer les règles, ou de traduire visuellement des menus en différentes langues.
Accessibilité et déploiement du GPT-4o
Le déploiement de GPT-4o sera progressif, débutant avec une version gratuite sur ChatGPT et s’étendant aux abonnés des plans premium ChatGPT Plus et Team, qui bénéficieront de limites de messages quintuplées. Cependant, OpenAI prévoit d’introduire initialement les nouvelles capacités audio du GPT-4o à un petit groupe de partenaires de confiance, en raison du risque potentiel de mauvais usage. Cette stratégie de déploiement graduel vise à garantir une intégration sûre et efficace des nouvelles fonctionnalités.
Déploiement stratégique et accessibilité accrue
Le déploiement de GPT-4o sera progressif, commençant par une intégration gratuite dans ChatGPT avant de s’étendre aux plans premium ChatGPT Plus et Team, qui bénéficieront de limites de messages quintuplées. Toutefois, OpenAI adopte une approche prudente en introduisant initialement les capacités audio de GPT-4o à un petit groupe de partenaires de confiance pour minimiser les risques d’abus. Cette stratégie vise à assurer une intégration sûre et efficace des capacités étendues de GPT-4o.
Vers une interaction plus intuitive et naturelle
Avec le lancement de GPT-4o, OpenAI fait un pas de géant vers une interaction homme-machine plus naturelle et sans effort. Ce modèle représente non seulement une avancée technologique significative, mais il redéfinit également la manière dont nous interagirons avec la technologie à l’avenir. L’avenir promet une intégration encore plus poussée de l’IA dans notre quotidien, rendant nos interactions technologiques plus fluides et intuitives.