読者です 読者をやめる 読者になる 読者になる

ダイスン

Arsenalとその他もろもろ

Google音声入力を使ってテープ起こしを行う際のハードウェアとソフトウェア

制作 ビジネス

スポンサードリンク

diesoon.hatenablog.com

 

ブログを始めてごく初期に書いたこのようなエントリにいまだに人がくるので、環境などについてもう少し詳しく書こうと思う。

 

Google音声入力を使ったテープ起こしの全体フロー

Google音声入力を使ったテープ起こし作業の全体のフローとしては以下のようになる。

f:id:diesoon:20160823145914j:plain

パソコンで再生した音源(仕事なら支給された音源)を聞きながら、ちょうどよいフレーズで区切って、それをまるでナレーターがしゃべっているかのうように自分の声で朗々としゃべり、その声をGoogle音声入力に聞き取らせる。

当然精度はまだ足りない部分も多く間違いもあるので、それを手入力でリライトしていく。それの繰り返しである。

作業に慣れていき、やがてGoogle音声入力に長文を聞き取らせることに成功すれば、かなりの手間が軽減される。作業のはじめはテープ起こしの従来のやり方通りすべてを手入力で行ったほうが早いかもしれないが、必ずどこかの時点でスピードが逆転するはずだ。作業が終わるころにはGoogle音声入力がかわいく思えていることだろう。

 

上図のハードウェア環境については、オーディオインタフェースは必須ではない。なければないで、パソコンのヘッドフォン端子とマイク入力端子にそれぞれ直接ぶち込めばよろし。ヘッドフォンはイヤホンでも構わないし、マイクはヘッドフォンやイヤホンのケーブルにくっついているものでも大丈夫なはず。要は、パソコンで再生した音声を聞いて自分がしゃべった声をまたパソコンが聞き取れればいいのだ。

オーディオインターフェースはあればあったで便利だろう。安いものでは1万円以下で買える。

 

再生ソフトウェアはAudacity

問題は再生ソフトウェアだ。やってみればわかるが、再生・停止や部分的にちょっと戻ったりを頻繁に行うので、しゃべっている部分を目視できるように、できれば音声データを波形表示できるソフト、それに次第に手をマウスに持ち替えるのが煩わしくなるはずなので、ショートカットが使えるソフトが好ましい。

決してWindows Media PlayeriTunesなどOSに付属の音楽再生ソフトを使おうなどとは思わないほうがいい。効率が悪い。

うちはAdobeが導入されているので、慣れているAdobe Premiere CCを使っているが(こういった作業にも使いやすい)、そういった環境がない方には、「Audacity」(オーダシティ)というフリーウェアの音声編集ソフトを推薦したい。オープンソースでかなりいろいろなことができるソフトウェアで、音編集ジャンルのソフトウェアのなかでは定番的に使われているもののひとつである。

今回は再生だけにしか使用しないが、再生のスタート・ストップや頭出しにも使いやすいはず。支給素材の音量が足りなければボリュームアップなども簡単に行える。

 

osdn.jp

 

これが無料でテープ起こしの自動化を目指した、ぼくのなかでの現時点でのベスト・プラクティスである。