AccueilHigh techComment mettre en place un environnement pour construire votre propre JARVIS (agent...

Comment mettre en place un environnement pour construire votre propre JARVIS (agent chatbot) | par Sinchan Bhattacharya | Mai 2021 2051.fr

Publiรฉ le

par

En regardant les films Iron-Man, j’ai toujours souhaitรฉ avoir mon propre Jarvis. Je suis sรปr que tous les fans d’Iron-Man ressentent la mรชme chose. Bien que Jarvis soit devenu trรจs cรฉlรจbre aprรจs le film Iron Man, les films autour ou impliquant une intelligence artificielle datent du passรฉ. Je me souviens avoir regardรฉ un grand film allemand basรฉ sur l’intelligence artificielle – Metropolis, sorti en 1927.

JARVIS

Dans tous ces films illustrant l’IA, une chose est commune – il est capable de comprendre ce que nous, les humains, disons et de mener une conversation. Bien que cela semble รชtre une activitรฉ simple que nous faisons ร  chaque instant, lorsqu’on la dรฉcompose au niveau le plus granulaire, on constate que tous les diffรฉrents composants du corps humain – les oreilles, le cerveau, la bouche, les neurones, le systรจme nerveux, les canaux calciques – sont complexes. Dans les neurones, les cellules ciliรฉes de la cochlรฉe, le larynx…. se rassemblent pour travailler comme une seule unitรฉ et effectuer toutes les actions lors d’une conversation.

Pour que le robot IA puisse faire de mรชme, nous devons lui fournir au moins des oreilles, un cerveau et une bouche (pas bruyante : P). Maintenant, laissons de cรดtรฉ le systรจme matรฉriel (nous en parlerons dans un autre article) et concentrons-nous sur l’aspect logiciel du robot IA.

Nous allons apprendre ร  configurer un environnement Python de bout en bout pour qu’il puisse.. :

รฉcouter
Comprendre
Parler

Pour les humains, l’รฉcoute est la partie oรน le signal audio est converti en signaux dans le systรจme auditif et neuronal. Mais pour un agent d’IA, l’รฉcoute consiste ร  รชtre capable de capturer les signaux audio et de les convertir en quelque chose qui peut รชtre transmis ร  l’unitรฉ de comprรฉhension de l’agent d’IA, quelle qu’elle soit. Cette chose est du texte – TEXTE Lisible. C’est pourquoi on l’appelle un convertisseur parole-texte ou STT.
Speech-to-Text

Nous allons maintenant installer les bibliothรจques requises dans Python pour effectuer les tรขches STT.

Installation de la bibliothรจque SpeechRecognition :

Ouvrez une invite de commande ou une invite conda et รฉcrivez la commande suivante.

pip install SpeechRecognition

Une fois l’installation terminรฉe, vรฉrifiez l’installation en utilisant la commande suivante :

import speech_recognition as sr
sr.__version__

Avec la bibliothรจque de reconnaissance vocale installรฉe, essayons une fonction de reconnaissance vocale :

Ici, nous testons la fonction de reconnaissance vocale de Google

filename="c:/audio.wav" #Le fichier audio vocal ร  convertiravec sr.AudioFile(filename) comme source :
donnรฉes_audio = r.record(source)
text = r.recognize_google(audio_data)
print(texte)

La bibliothรจque Speech_recognizer dispose de plusieurs moteurs de reconnaissance vocale comme Google API, IBM API, Sphinx CMU, etc. Les articles suivants comparent diffรฉrents moteurs de reconnaissance vocale :

https://link.springer.com/chapter/10.1007/978-3-030-49161-1_7
https://arxiv.org/ftp/arxiv/papers/1904/1904.12403.pdf

Pour construire un robot autonome, c’est-ร -dire un robot qui peut fonctionner sans connexion Internet, nous devons utiliser un modรจle de reconnaissance vocale qui peut รชtre exรฉcutรฉ localement. Le modรจle Sphinx dรฉveloppรฉ ร  CMU peut fonctionner ร  cette fin.

Le modรจle Sphinx de CMU doit รชtre installรฉ avant d’utiliser ce modรจle et voici comment vous pouvez le faire :

Vous pouvez faire une installation par pip :

pip install pocketsphinx

Vous pouvez rencontrer plusieurs erreurs lors de l’installation de pockethpinx, telles que :

Installation du module python pocketphinx : la commande ‘swig.exe’ a รฉchouรฉ.
Visual C ++ manquant
Module PocketSphinx manquant

Le meilleur chemin pour installer CMU Sphinx est le suivant :

Installer Visual C ++ : https://visualstudio.microsoft.com/downloads/
Ouvrez ensuite votre invite de commande Conda et procรฉdez comme suit

conda install swig
python -m pip install --upgrade pip setuptools wheel
pip install pocketsphinx

Une fois l’installation rรฉussie, vous pouvez la tester via ces commandes

filename="c:/audio.wav" #Le fichier audio vocal ร  convertir avec sr.AudioFile(filename) comme source :
donnรฉes_audio = r.record(source)
text = r.recognize_sphinx(audio_data)
print(texte)

Photo par James Yarema sur Unsplash

Les modรจles vocaux sont connus sous le nom de modรจles de synthรจse vocale.

Il y a plusieurs moteurs de synthรจse vocale disponibles, ici je vais prรฉsenter pyttsx de Google et speech to text (gtts).

Pour utiliser pyttsx :

Faire une installation pip de pyttsx peut rรฉsulter en une erreur pyttsx : Aucun module nommรฉ “engine”. La solution est donc

pip install pyttsx3
pip install python-engineio

Testez ensuite pyttsx3 en utilisant le code suivant :

import pyttsx3
engine = pyttsx3.init()
text = "Salut je suis Jarvis"
engine.say(texte)
engine.runAndWait()

Maintenant, pour installer Google Text to Speech, suivez les รฉtapes ci-dessous :

pip install gTTS

Et lancer gTTS

import gtts
from playsound import playsoundtts = gtts.gTTS(“Hi I am Jarvis”)
tts.save(“D:/hello.mp3”)
playsound(“D:/hello.mp3”)

Maintenant que vous avez la capacitรฉ d’entendre et de parler du robot IA, l’รฉtape suivante consiste ร  configurer le cerveau, ce que j’aborderai dans un autre article.

J’espรจre que cet article vous a permis de franchir une รฉtape supplรฉmentaire dans la rรฉalisation de votre robot IA personnel.

Pour dรฉvelopper votre propre module Speech-To-Text, vous pouvez consulter les liens suivants.

https://github.com/jim-schwoebel/voice_datasets
https://deepmind.com/blog/article/wavenet-generative-model-raw-audio

Rรฉfรฉrence :

https://predictivehacks.com/simple-example-of-speech-to-text/

Les avantages dโ€™un chatbot

On entend constamment parler dโ€™intelligence artificielle dans les films. Elle nous fait rรชver, parfois elle nous effraie mais sachez quโ€™un chatbot peut รชtre trรจs utile sur votre site internet. Le chatbot permet dโ€™automatiser votre service client et offre une rรฉponse 24h/24 et 7j/7. Il permet aussi de dynamiser les ventes et il a la capacitรฉ dโ€™influencer les dรฉcisions dโ€™achat de vos consommateurs. Il est capable de sโ€™occuper du paiement, il vous aide ร  mieux connaรฎtre vos clients et augmente l’engagement client. Et surtout, il n’est pas humain donc il nโ€™est jamais stressรฉ donc il ne transmet pas son stress. Alors avoir des outils cโ€™est bien, avoir les bons outils sur votre site internet, cโ€™est mieux.

Les inconvรฉnients dโ€™un chatbot

Mรชme si un chatbot peut faire rรชver et est trรจs utile, il a aussi quelques lacunes. Les bots ne sont parfois pas programmรฉs pour des questions spรฉcifiques et nโ€™ont donc pas la rรฉponse aux questions de vos clients, ce qui peut parfois agacer. Ils prรฉfรจrent donc souvent parler ร  des humains puisque les chatbots ne comprennent pas de phrases complexes, ne font pas preuve d’empathie, ou encore ils ne savent pas dรฉtecter lโ€™ironie dans une phrase. Ils ne savent pas non plus rebondir sur un argument et peuvent donc passer ร  cรดtรฉ de pas mal de choses.

redaction
redaction
L'รฉquipe d'expert de 2051, avec plus de 10 ans d'expรฉrience dans le secteur, a contribuรฉ ร  plusieurs projets significatifs dans le domaine de la technologie innovatrice. Croyant fermement en un avenir oรน la technologie amรฉliore la vie quotidienne. Ses articles offrent des perspectives uniques et des analyses approfondies sur les tendances actuelles et futures."

Partager cet article

Actualitรฉs