AssetStoreまとめ

Unityアセットストアで注目すべきイチオシ情報を毎日お届けします!

Google Cloud Speech Recognition [VR\AR\Mobile\Desktop] Googleの音声認識サービスがUnityで使えるスクリプト

スポンサーリンク

f:id:assetsale:20170407134032j:plain f:id:assetsale:20170406165017j:plain

今日のアセット

Google Cloud Speech Recognition [VR\AR\Mobile\Desktop]

$21.60 => $16.20    25%OFF

 

喋った言葉を文字に変換する「Google Cloud Speech API」を利用した音声認識のスクリプトです。

 

Google Cloud Speechは、88言語サポートされており、日本語もバッチリ音声認識してくれます。

マイクから喋った音声を録音し、音声データをGoogle Cloud Speech APIで通信して結果が返ってきます。

f:id:assetsale:20170406181301g:plain

↑サンプル動画の内容:「Start Record」開始してマイクに向かって喋る「Stop Record」で終了すると録音されたデータをオンラインで認識開始。結果がテキストに表示されたところ。

 

[Unity3D] Google Cloud Speech Recognition - Released - YouTube(0:20)

Google Cloud Speechは、Siriやスマホ内蔵の音声認識より遅延はあるものの、認識率が高くてしかも無料で使えるのがありがたい。

 

↓88言語選べそうなタブ。日本語を試したい

f:id:assetsale:20170406165706j:plain

f:id:assetsale:20170406165708j:plain

f:id:assetsale:20170406165709j:plain

 

 

キーを押している間だけ記録させる方法

キーを押している間だけ音声が記録されるコードです。

 

参考:フォーラム

private void Update()
  {
  if(Input.GetKeyDown(KeyCode.R))
  {
  StartRecord();
  }
  else if (Input.GetKeyUp(KeyCode.R))
  {
  StopRecord();
  }
 
  }

Google Speech APIについて

 

公式サイト

↓Googleによるセットアップのチュートリアル

Cloud Speech API による音声テキスト化

 

利用料金

2017年4月7日時点

0〜60分    無料

61〜1,000,000分    $0.006

f:id:assetsale:20170406185620j:plain

 

参考になるサイトさま

認識にかかる時間は2〜4秒とのこと

 

Unity 5.4.2以降のバージョンが必要
Google Cloud音声認識は、次の機能を提供するUnityのための真のクロスプラットフォームツールです。
•声の録音とその認識
•結果の解析と必要なデータの返却
•実行時音声検出
•音声コンテキストの設定
•88+言語のサポート
•高速音声認識
•フルクラウドスピーチAPIを含む

Google Cloud Speech Recognition

 

警告:
Googleクラウド音声認識の利用規約を必ずお読みください

完全なソースコードが含まれています!

VR \ ARゲームやアプリケーションでのコミュニケーションのために最も必要です!

 

TUTORIAL | Forum Thread

注意:
•il2cppで動作します。
•テスト対象:
- -アンドロイド
--- IOS
--- Windows
- - Mac
--- Linux
--- Windowsストア(Windows Phone \ Windows 10 Mobile \ Windows 8 \ 8.1 \ 10)
--- WebGL *
•コンソールではテストされていない

•Unity Cloud Buildと連携します。

* - WebGLランタイムの音声検出には対応していません

 

ゲームで使うなら

音声認識でチャットの文字入力が出来たら、キーボード入力の遅いユーザーでも気軽にチャットへ参加できそうですね。

音声認識を使ったゲームは、、必殺技を声で喋って発動するような対戦格闘・・・昔ボツになったゲームを思い出す。

 

Google Cloud Speech Recognition [VR\AR\Mobile\Desktop]

16.20ドルの計算結果 (1ドル 110.5730 円)
16.20ドル は、 1,791円

定価21.60ドルなら、2,388円