AccueilHigh techComment mettre en place un environnement pour construire votre propre JARVIS (agent...

Comment mettre en place un environnement pour construire votre propre JARVIS (agent chatbot) | par Sinchan Bhattacharya | Mai 2021 2051.fr

Publié le

par

En regardant les films Iron-Man, j’ai toujours souhaité avoir mon propre Jarvis. Je suis sûr que tous les fans d’Iron-Man ressentent la même chose. Bien que Jarvis soit devenu très célèbre après le film Iron Man, les films autour ou impliquant une intelligence artificielle datent du passé. Je me souviens avoir regardé un grand film allemand basé sur l’intelligence artificielle – Metropolis, sorti en 1927.

JARVIS

Dans tous ces films illustrant l’IA, une chose est commune – il est capable de comprendre ce que nous, les humains, disons et de mener une conversation. Bien que cela semble être une activité simple que nous faisons à chaque instant, lorsqu’on la décompose au niveau le plus granulaire, on constate que tous les différents composants du corps humain – les oreilles, le cerveau, la bouche, les neurones, le système nerveux, les canaux calciques – sont complexes. Dans les neurones, les cellules ciliées de la cochlée, le larynx…. se rassemblent pour travailler comme une seule unité et effectuer toutes les actions lors d’une conversation.

Pour que le robot IA puisse faire de même, nous devons lui fournir au moins des oreilles, un cerveau et une bouche (pas bruyante : P). Maintenant, laissons de côté le système matériel (nous en parlerons dans un autre article) et concentrons-nous sur l’aspect logiciel du robot IA.

Nous allons apprendre à configurer un environnement Python de bout en bout pour qu’il puisse.. :

écouter
Comprendre
Parler

Pour les humains, l’écoute est la partie où le signal audio est converti en signaux dans le système auditif et neuronal. Mais pour un agent d’IA, l’écoute consiste à être capable de capturer les signaux audio et de les convertir en quelque chose qui peut être transmis à l’unité de compréhension de l’agent d’IA, quelle qu’elle soit. Cette chose est du texte – TEXTE Lisible. C’est pourquoi on l’appelle un convertisseur parole-texte ou STT.
Speech-to-Text

Nous allons maintenant installer les bibliothèques requises dans Python pour effectuer les tâches STT.

Installation de la bibliothèque SpeechRecognition :

Ouvrez une invite de commande ou une invite conda et écrivez la commande suivante.

pip install SpeechRecognition

Une fois l’installation terminée, vérifiez l’installation en utilisant la commande suivante :

import speech_recognition as sr
sr.__version__

Avec la bibliothèque de reconnaissance vocale installée, essayons une fonction de reconnaissance vocale :

Ici, nous testons la fonction de reconnaissance vocale de Google

filename="c:/audio.wav" #Le fichier audio vocal à convertiravec sr.AudioFile(filename) comme source :
données_audio = r.record(source)
text = r.recognize_google(audio_data)
print(texte)

La bibliothèque Speech_recognizer dispose de plusieurs moteurs de reconnaissance vocale comme Google API, IBM API, Sphinx CMU, etc. Les articles suivants comparent différents moteurs de reconnaissance vocale :

https://link.springer.com/chapter/10.1007/978-3-030-49161-1_7
https://arxiv.org/ftp/arxiv/papers/1904/1904.12403.pdf

Pour construire un robot autonome, c’est-à-dire un robot qui peut fonctionner sans connexion Internet, nous devons utiliser un modèle de reconnaissance vocale qui peut être exécuté localement. Le modèle Sphinx développé à CMU peut fonctionner à cette fin.

Le modèle Sphinx de CMU doit être installé avant d’utiliser ce modèle et voici comment vous pouvez le faire :

Vous pouvez faire une installation par pip :

pip install pocketsphinx

Vous pouvez rencontrer plusieurs erreurs lors de l’installation de pockethpinx, telles que :

Installation du module python pocketphinx : la commande ‘swig.exe’ a échoué.
Visual C ++ manquant
Module PocketSphinx manquant

Le meilleur chemin pour installer CMU Sphinx est le suivant :

Installer Visual C ++ : https://visualstudio.microsoft.com/downloads/
Ouvrez ensuite votre invite de commande Conda et procédez comme suit

conda install swig
python -m pip install --upgrade pip setuptools wheel
pip install pocketsphinx

Une fois l’installation réussie, vous pouvez la tester via ces commandes

filename="c:/audio.wav" #Le fichier audio vocal à convertir avec sr.AudioFile(filename) comme source :
données_audio = r.record(source)
text = r.recognize_sphinx(audio_data)
print(texte)

Photo par James Yarema sur Unsplash

Les modèles vocaux sont connus sous le nom de modèles de synthèse vocale.

Il y a plusieurs moteurs de synthèse vocale disponibles, ici je vais présenter pyttsx de Google et speech to text (gtts).

Pour utiliser pyttsx :

Faire une installation pip de pyttsx peut résulter en une erreur pyttsx : Aucun module nommé “engine”. La solution est donc

pip install pyttsx3
pip install python-engineio

Testez ensuite pyttsx3 en utilisant le code suivant :

import pyttsx3
engine = pyttsx3.init()
text = "Salut je suis Jarvis"
engine.say(texte)
engine.runAndWait()

Maintenant, pour installer Google Text to Speech, suivez les étapes ci-dessous :

pip install gTTS

Et lancer gTTS

import gtts
from playsound import playsoundtts = gtts.gTTS(“Hi I am Jarvis”)
tts.save(“D:/hello.mp3”)
playsound(“D:/hello.mp3”)

Maintenant que vous avez la capacité d’entendre et de parler du robot IA, l’étape suivante consiste à configurer le cerveau, ce que j’aborderai dans un autre article.

J’espère que cet article vous a permis de franchir une étape supplémentaire dans la réalisation de votre robot IA personnel.

Pour développer votre propre module Speech-To-Text, vous pouvez consulter les liens suivants.

https://github.com/jim-schwoebel/voice_datasets
https://deepmind.com/blog/article/wavenet-generative-model-raw-audio

Référence :

https://predictivehacks.com/simple-example-of-speech-to-text/

Les avantages d’un chatbot

On entend constamment parler d’intelligence artificielle dans les films. Elle nous fait rêver, parfois elle nous effraie mais sachez qu’un chatbot peut être très utile sur votre site internet. Le chatbot permet d’automatiser votre service client et offre une réponse 24h/24 et 7j/7. Il permet aussi de dynamiser les ventes et il a la capacité d’influencer les décisions d’achat de vos consommateurs. Il est capable de s’occuper du paiement, il vous aide à mieux connaître vos clients et augmente l’engagement client. Et surtout, il n’est pas humain donc il n’est jamais stressé donc il ne transmet pas son stress. Alors avoir des outils c’est bien, avoir les bons outils sur votre site internet, c’est mieux.

Les inconvénients d’un chatbot

Même si un chatbot peut faire rêver et est très utile, il a aussi quelques lacunes. Les bots ne sont parfois pas programmés pour des questions spécifiques et n’ont donc pas la réponse aux questions de vos clients, ce qui peut parfois agacer. Ils préfèrent donc souvent parler à des humains puisque les chatbots ne comprennent pas de phrases complexes, ne font pas preuve d’empathie, ou encore ils ne savent pas détecter l’ironie dans une phrase. Ils ne savent pas non plus rebondir sur un argument et peuvent donc passer à côté de pas mal de choses.

redaction
redaction
L'équipe d'expert de 2051, avec plus de 10 ans d'expérience dans le secteur, a contribué à plusieurs projets significatifs dans le domaine de la technologie innovatrice. Croyant fermement en un avenir où la technologie améliore la vie quotidienne. Ses articles offrent des perspectives uniques et des analyses approfondies sur les tendances actuelles et futures."

Partager cet article

Actualités