WARNING: THIS SITE IS A MIRROR OF GITHUB.COM / IT CANNOT LOGIN OR REGISTER ACCOUNTS / THE CONTENTS ARE PROVIDED AS-IS / THIS SITE ASSUMES NO RESPONSIBILITY FOR ANY DISPLAYED CONTENT OR LINKS / IF YOU FOUND SOMETHING MAY NOT GOOD FOR EVERYONE, CONTACT ADMIN AT ilovescratch@foxmail.com
Skip to content

Yuki-okuma/ai-robot-chapter3-humble

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

99 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

第3章 音声認識・合成

概要

ROS2とPythonで作って学ぶAIロボット入門(出村・萩原・升谷・タン著,講談社)第3章のサンプルプログラムと補足情報などを掲載しています.

インストール

  • オーディオ関連を扱うためのライブラリを以下のコマンドでインストールします.
sudo apt install portaudio19-dev
sudo apt install pulseaudio
  • Pythonのモジュールとして呼びたすために,以下のコマンドを実行します.
pip3 install pyaudio
  • 音声認識ライブラリを以下のコマンドでインストールします.
pip3 install SpeechRecognition
  • 音声認識器のWhisperを扱うためのライブラリを以下のコマンドでインストールします.
python3 -m pip install git+https://github.com/openai/whisper.git soundfile
  • 音声合成で用いるライブラリをインストールします。
pip3 install gTTS
sudo apt install mpg123
pip3 install mpg123
  • サンプルプログラムを以下のコマンドでGitHubからクローンします.
cd ˜/airobot_ws/src
git clone https://github.com/AI-Robot-Book/chapter3
  • 以下のコマンドでパッケージをビルドします.
cd ˜/airobot_ws
colcon build

ディレクトリ構成

  • speech_service: 音声認識と音声合成のサンプルプログラム

補足情報

  • 3章のサンプルプログラムをDockerコンテナで実行する場合,Ubuntuをホストにする場合のみ動作を確認しています.Windowsで開発されている方は,VMWareなどのバーチャルマシンにUbuntuをインストールしてサンプルプログラムを実行する事ができます.
  • 実行するUbuntuの環境でマイクからの音声入力とスピーカーからの音の出力が出来ていることを事前に確認してください.
  • バーチャルマシン上のUbuntuを使用する場合は、遅れが生じて音声が出力されない事があります.長めの発話文を入力するなどして対応して下さい.
  • 可能であればベッドセットを使用してください.オウム返しの実行中にスピーカーの音がマイクに回って繰り返す場合があります.

About

第3章 音声認識・合成

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 78.3%
  • Shell 16.6%
  • PowerShell 5.1%