Skip to content

Instantly share code, notes, and snippets.

@jumbo-in-Jap
Last active October 19, 2017 04:58
Show Gist options
  • Save jumbo-in-Jap/b3fb4135af4872ded40f7fee5a6ae479 to your computer and use it in GitHub Desktop.
Save jumbo-in-Jap/b3fb4135af4872ded40f7fee5a6ae479 to your computer and use it in GitHub Desktop.

音声認識アプリを作る

指定秒間 音声認識をonにして録音+文字起こしをやりたい場合、やり方は多分2つかな どっちも音声の拾って文字で取得できる。

  1. iOS10から提供されている Speech Frameworkを使う
  2. Google Cloud Speech APIを使う

1は試したことあるけど、以下のような制限がある。

  • ずっと認識状態にできない(OSが勝手に認識プロセスを落とす)
  • バッテリー消費がでかい
  • ネットワーク接続必要
  • 1日の回数制限があるらしい(残り回数などを取得するAPIなどはない、エラーが取れるだけ)
  • 精度はいい、いろんな言語対応している

2はGoogleのre:cupイベントでエンジニアがでもやったり、話した感じ精度いいしサンプルもある。

アプリ作る

今はXcode9が最新で、これだけで実機ビルドまでできる。 ライセンスは最後の最後に取ればいい。

オススメの本 https://www.amazon.co.jp/%E6%9C%AC%E6%B0%97%E3%81%A7%E3%81%AF%E3%81%98%E3%82%81%E3%82%8BiPhone%E3%82%A2%E3%83%97%E3%83%AA%E4%BD%9C%E3%82%8A-Xcode-Swift-3-x%E5%AF%BE%E5%BF%9C-%E3%83%A4%E3%83%95%E3%83%BC%E9%BB%92%E5%B8%AF%E3%82%B7%E3%83%AA%E3%83%BC%E3%82%BA/dp/4797389826

SwiftはXcode9からSwift4がデフォルト、Swift3.xで破壊的変更があったので、 過去のライブラリとか動かないものが多いので注意

ライブラリはcocodpodというので管理するといい 使えそうなUIライブラリはここでさがすといい https://www.cocoacontrols.com/

GUIなツールなので、動画系の学習サービスとかで勉強するのが早いと思う。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment