En regardant les films Iron-Man, j’ai toujours souhaitรฉ avoir mon propre Jarvis. Je suis sรปr que tous les fans d’Iron-Man ressentent la mรชme chose. Bien que Jarvis soit devenu trรจs cรฉlรจbre aprรจs le film Iron Man, les films autour ou impliquant une intelligence artificielle datent du passรฉ. Je me souviens avoir regardรฉ un grand film allemand basรฉ sur l’intelligence artificielle – Metropolis, sorti en 1927.
JARVIS
Dans tous ces films illustrant l’IA, une chose est commune – il est capable de comprendre ce que nous, les humains, disons et de mener une conversation. Bien que cela semble รชtre une activitรฉ simple que nous faisons ร chaque instant, lorsqu’on la dรฉcompose au niveau le plus granulaire, on constate que tous les diffรฉrents composants du corps humain – les oreilles, le cerveau, la bouche, les neurones, le systรจme nerveux, les canaux calciques – sont complexes. Dans les neurones, les cellules ciliรฉes de la cochlรฉe, le larynx…. se rassemblent pour travailler comme une seule unitรฉ et effectuer toutes les actions lors d’une conversation.
Pour que le robot IA puisse faire de mรชme, nous devons lui fournir au moins des oreilles, un cerveau et une bouche (pas bruyante : P). Maintenant, laissons de cรดtรฉ le systรจme matรฉriel (nous en parlerons dans un autre article) et concentrons-nous sur l’aspect logiciel du robot IA.
Nous allons apprendre ร configurer un environnement Python de bout en bout pour qu’il puisse.. :
รฉcouter
Comprendre
Parler
Pour les humains, l’รฉcoute est la partie oรน le signal audio est converti en signaux dans le systรจme auditif et neuronal. Mais pour un agent d’IA, l’รฉcoute consiste ร รชtre capable de capturer les signaux audio et de les convertir en quelque chose qui peut รชtre transmis ร l’unitรฉ de comprรฉhension de l’agent d’IA, quelle qu’elle soit. Cette chose est du texte – TEXTE Lisible. C’est pourquoi on l’appelle un convertisseur parole-texte ou STT.
Speech-to-Text
Nous allons maintenant installer les bibliothรจques requises dans Python pour effectuer les tรขches STT.
Installation de la bibliothรจque SpeechRecognition :
Ouvrez une invite de commande ou une invite conda et รฉcrivez la commande suivante.
pip install SpeechRecognition
Une fois l’installation terminรฉe, vรฉrifiez l’installation en utilisant la commande suivante :
import speech_recognition as sr
sr.__version__
Avec la bibliothรจque de reconnaissance vocale installรฉe, essayons une fonction de reconnaissance vocale :
Ici, nous testons la fonction de reconnaissance vocale de Google
filename="c:/audio.wav" #Le fichier audio vocal ร convertiravec sr.AudioFile(filename) comme source :
donnรฉes_audio = r.record(source)
text = r.recognize_google(audio_data)
print(texte)
La bibliothรจque Speech_recognizer dispose de plusieurs moteurs de reconnaissance vocale comme Google API, IBM API, Sphinx CMU, etc. Les articles suivants comparent diffรฉrents moteurs de reconnaissance vocale :
https://link.springer.com/chapter/10.1007/978-3-030-49161-1_7
https://arxiv.org/ftp/arxiv/papers/1904/1904.12403.pdf
Pour construire un robot autonome, c’est-ร -dire un robot qui peut fonctionner sans connexion Internet, nous devons utiliser un modรจle de reconnaissance vocale qui peut รชtre exรฉcutรฉ localement. Le modรจle Sphinx dรฉveloppรฉ ร CMU peut fonctionner ร cette fin.
Le modรจle Sphinx de CMU doit รชtre installรฉ avant d’utiliser ce modรจle et voici comment vous pouvez le faire :
Vous pouvez faire une installation par pip :
pip install pocketsphinx
Vous pouvez rencontrer plusieurs erreurs lors de l’installation de pockethpinx, telles que :
Installation du module python pocketphinx : la commande ‘swig.exe’ a รฉchouรฉ.
Visual C ++ manquant
Module PocketSphinx manquant
Le meilleur chemin pour installer CMU Sphinx est le suivant :
Installer Visual C ++ : https://visualstudio.microsoft.com/downloads/
Ouvrez ensuite votre invite de commande Conda et procรฉdez comme suit
conda install swig
python -m pip install --upgrade pip setuptools wheel
pip install pocketsphinx
Une fois l’installation rรฉussie, vous pouvez la tester via ces commandes
filename="c:/audio.wav" #Le fichier audio vocal ร convertir avec sr.AudioFile(filename) comme source :
donnรฉes_audio = r.record(source)
text = r.recognize_sphinx(audio_data)
print(texte)
Photo par James Yarema sur Unsplash
Les modรจles vocaux sont connus sous le nom de modรจles de synthรจse vocale.
Il y a plusieurs moteurs de synthรจse vocale disponibles, ici je vais prรฉsenter pyttsx de Google et speech to text (gtts).
Pour utiliser pyttsx :
Faire une installation pip de pyttsx peut rรฉsulter en une erreur pyttsx : Aucun module nommรฉ “engine”. La solution est donc
pip install pyttsx3
pip install python-engineio
Testez ensuite pyttsx3 en utilisant le code suivant :
import pyttsx3
engine = pyttsx3.init()
text = "Salut je suis Jarvis"
engine.say(texte)
engine.runAndWait()
Maintenant, pour installer Google Text to Speech, suivez les รฉtapes ci-dessous :
pip install gTTS
Et lancer gTTS
import gtts
from playsound import playsoundtts = gtts.gTTS(“Hi I am Jarvis”)
tts.save(“D:/hello.mp3”)
playsound(“D:/hello.mp3”)
Maintenant que vous avez la capacitรฉ d’entendre et de parler du robot IA, l’รฉtape suivante consiste ร configurer le cerveau, ce que j’aborderai dans un autre article.
J’espรจre que cet article vous a permis de franchir une รฉtape supplรฉmentaire dans la rรฉalisation de votre robot IA personnel.
Pour dรฉvelopper votre propre module Speech-To-Text, vous pouvez consulter les liens suivants.
https://github.com/jim-schwoebel/voice_datasets
https://deepmind.com/blog/article/wavenet-generative-model-raw-audio
Rรฉfรฉrence :
https://predictivehacks.com/simple-example-of-speech-to-text/
Les avantages dโun chatbot
On entend constamment parler dโintelligence artificielle dans les films. Elle nous fait rรชver, parfois elle nous effraie mais sachez quโun chatbot peut รชtre trรจs utile sur votre site internet. Le chatbot permet dโautomatiser votre service client et offre une rรฉponse 24h/24 et 7j/7. Il permet aussi de dynamiser les ventes et il a la capacitรฉ dโinfluencer les dรฉcisions dโachat de vos consommateurs. Il est capable de sโoccuper du paiement, il vous aide ร mieux connaรฎtre vos clients et augmente l’engagement client. Et surtout, il n’est pas humain donc il nโest jamais stressรฉ donc il ne transmet pas son stress. Alors avoir des outils cโest bien, avoir les bons outils sur votre site internet, cโest mieux.
Les inconvรฉnients dโun chatbot
Mรชme si un chatbot peut faire rรชver et est trรจs utile, il a aussi quelques lacunes. Les bots ne sont parfois pas programmรฉs pour des questions spรฉcifiques et nโont donc pas la rรฉponse aux questions de vos clients, ce qui peut parfois agacer. Ils prรฉfรจrent donc souvent parler ร des humains puisque les chatbots ne comprennent pas de phrases complexes, ne font pas preuve d’empathie, ou encore ils ne savent pas dรฉtecter lโironie dans une phrase. Ils ne savent pas non plus rebondir sur un argument et peuvent donc passer ร cรดtรฉ de pas mal de choses.