SIS Lab
>
Blog
>
音声認識エンジンJuliusをインストールする

音声認識エンジンJuliusをインストールする

更新日:2020.10.25 作成日:2016.12.21

#Julius

音声認識エンジンを調査したときのメモです。

音声認識エンジン

Apple - Siri
Google -
Microsoft - Bing API
Julius

Juliusとは

Juliusは、フリーの高性能音声認識ソフトウェアです。

http://julius.osdn.jp/index.php?q=whatis.html

Juliusのインストール

Juliusで音声から文字起こしする（ディクテーション）をする場合は、最小限のモデル（不特定話者音響モデル + 汎用言語モデル）が必要です。

以下の手順でJulius本体と、モデルをインストールします。

1. 下記URLから最新版のJulius(4.4.2)をダウンロード

2. ダウンロードしたファイルを解凍し、`make install`

$ cd julius-4.4.2
$ ./configure
$ make
$ make install

3. インストールを確認

問題なくインストールされていたら、以下のコマンドを実行すればJuliusのバージョンが表示される。

$ julius -version
JuliusLib rev.4.4.2 (fast)

Engine specification:
-  Base setup   : fast
-  Supported LM : DFA, N-gram, Word
-  Extension    :
-  Compiled by  : gcc -g -O2

Library configuration: version 4.4.2
- Audio input
   primary A/D-in driver   : coreaudio (MacOSX CoreAudio)
   available drivers       :
   wavefile formats        : RAW and WAV only
   max. length of an input : 320000 samples, 150 words
- Language Model
   class N-gram support    : yes
   MBR weight support      : yes
   word id unit            : short (2 bytes)
- Acoustic Model
   multi-path treatment    : autodetect
- External library
   file decompression by   : zlib library
- Process hangling
   fork on adinnet input   : no
- built-in SIMD instruction set for DNN
   SSE AVX FMA
   FMA is available maximum on this cpu, use it

Try `-help' for more information.

4. `Git Large File Storage`のインストール

次の手順においてダウンロードするリポジトリが2GBぐらいあります。そのため、git-lfs（Git Large File Storage）をインストールしないと途中でgit cloneが失敗する（と記載があった）ので、まずは以下のコマンドを実行してGit Large File Storageをインストールします。