Comment le mode vocal avancé de ChatGPT pourrait-il transformer les interactions utilisateur avec l'IA ?

OpenAI a commencé à déployer le mode vocal avancé de ChatGPT, permettant aux utilisateurs d’accéder pour la première fois aux réponses audio hyper-réalistes du GPT-4o.

Cette version alpha est disponible pour un petit groupe d’utilisateurs de ChatGPT Plus, avec un déploiement prévu pour tous les utilisateurs Plus à l’automne 2024.

Une voix réaliste et controversée

Lors de la présentation de la voix du GPT-4o en mai, OpenAI a surpris le public par la rapidité des réponses et la ressemblance frappante avec une voix humaine, en particulier celle de Scarlett Johansson. Après cette démonstration, Johansson a nié avoir donné son consentement et a engagé des avocats pour défendre son image. Bien qu’OpenAI ait affirmé ne pas avoir utilisé sa voix, la société a ensuite retiré la voix de la démonstration. En juin, OpenAI a annoncé un retard dans le lancement du mode vocal avancé pour améliorer les mesures de sécurité.

Quelles sont les conséquences éthiques et légales pour OpenAI après le retrait de la voix controversée ressemblant à celle de Scarlett Johansson dans leur modèle GPT-4o ?

Fonctionnalités du Mode Vocal Avancé

Le mode vocal avancé de ChatGPT diffère du mode vocal précédent en utilisant GPT-4o, un modèle multimodal capable de traiter la conversion voix-texte et texte-voix sans modèles auxiliaires. Cela permet des conversations avec une latence réduite et des réponses plus naturelles. OpenAI affirme que GPT-4o peut également détecter les intonations émotionnelles dans la voix, telles que la tristesse, l’excitation ou même le chant.

Déploiement progressif et sécurité

OpenAI a choisi de déployer progressivement la nouvelle fonctionnalité vocale pour surveiller de près son utilisation. Les utilisateurs sélectionnés recevront une notification dans l’application ChatGPT, suivie d’un e-mail avec des instructions d’utilisation. OpenAI a testé les capacités vocales de GPT-4o avec plus de 100 équipes externes parlant 45 langues différentes. Un rapport sur ces efforts de sécurité est attendu début août.

Le mode vocal avancé sera limité à quatre voix prédéfinies – Juniper, Breeze, Cove et Ember – créées en collaboration avec des acteurs vocaux rémunérés. La voix Sky, présentée dans la démonstration de mai, n’est plus disponible. OpenAI s’efforce d’éviter les controverses liées aux deepfakes et a introduit de nouveaux filtres pour bloquer certaines demandes de génération de musique ou d’autres contenus audio protégés par des droits d’auteur.

Quels sont les principaux défis éthiques et légaux que ChatGPT doit surmonter pour maintenir sa croissance dans le futur ?

En conclusion, le lancement du mode vocal avancé de ChatGPT représente une étape importante pour OpenAI, offrant des interactions plus naturelles et immersives. Cependant, la société devra continuer à naviguer dans les défis éthiques et juridiques associés à cette technologie innovante.

Comment le mode vocal avancé de ChatGPT pourrait-il transformer les interactions utilisateur avec l’IA ?

Une voix réaliste et controversée

Fonctionnalités du Mode Vocal Avancé

Déploiement progressif et sécurité

Partager cet article

Actualités

GTA 6 Online pourrait arriver bien plus tôt que prévu : une fuite dévoile une fenêtre de sortie proche du lancement

GTA 6 : des détails sur une mission potentielle ont fuité et révèlent de nouvelles informations sur le jeu

Monopoly go : jalons de récompenses du tournoi « Tycoon Class », conseils et informations avant sa sortie

GTA 6 : un ancien développeur brise l’illusion et alerte sur des trailers “trop parfaits” qui pourraient tromper les joueurs

GTA 5 : une découverte inattendue révèle un personnage issu d’un jeu Rockstar oublié

LAISSER UN COMMENTAIRE Annuler la réponse