読者です 読者をやめる 読者になる 読者になる

ダイスン

Arsenalとその他もろもろ

テープ起こしの効率化を考えてGoogle音声入力にいたる

ビジネス 制作

スポンサードリンク

久しぶりに「テープ起こし」というレアな仕事があった。とある大きな企業の社内インタビュー。あまり一般では聞かないようなことばも出てくる。

 

タイピングは苦手ではないしコツコツやればいずれ終わるのであるけれど、30分ものでも一応お金をもらってやるプロの仕事としては用字用語合わせたりもしなきゃで、やっぱり3時間くらいはかかってしまう。

 

だが、なにより単純作業のくせに音楽もラジオも聴けないというのが、単調でつまらない。

必携 用字用語辞典 中型版

必携 用字用語辞典 中型版

 

 

そういう事情もあり、若干うんざりしながら作業を始める段になって、そういえば今どきは声もテキストに起こせるのではないかと調べたら、どうもYoutubeである程度できるようだ。

しかしこれがまったく使えない。Youtubeの「自動文字起こし機能」という、アップロードした映像の音声から、AI的なアレで文字起こしをしてくれるという機能。もちろんそれがバッチリうまくいくとは思っていなかったが、思った以上に使えなかったので、それで粗く起こしてリライトするという望みは絶たれた。

 

その後「Google音声入力」という強力ツールを見つけた。

 

ただ、これも結局はGoogleのサービスであるし、Youtubeで使われている技術と同じようなものと思われたので、おそらく人間が聞いても不明瞭なところがある音源をそのまま聞かせても無駄に思えた。

なので、ぼくが取った方法は音源をヘッドフォンで聞きながら、自分で改めてはっきりくっきりとしゃべった音声をGoogle音声入力に聞き取らせるという方法。

 

要するに、テープの音声を機械が理解しやすいように「声で翻訳」してあげるという計画である。なんというコミュニケーション。

 

「Googleドキュメント」というクラウドで使えるGoogle版Officeがあるのはご存知のとおり。Google音声入力を使用するには、Googleドキュメントを使う。Googleドキュメントがデフォルトで音声入力に対応している。

 

メニュー > ツール > 音声入力

 

Google ドキュメント - オンラインでドキュメントを作成、編集できる無料サービス

https://www.google.co.jp/intl/ja/docs/about/

 

Google音声入力を利用したテープ起こしのやり方

f:id:diesoon:20170210191054j:plain

PC(音源データをPLAY)

  ↓

(ヘッドフォン) 

  ↓

 ぼく 

  ↓

(しゃべる) 

  ↓

マイク

  ↓

PC(Google DocsのGoogle音声入力モード)

 

これが思ったよりうまくいった

ヘッドフォンを使ったのはたまに予想しない外部の音も拾っていたから。

作業中に電話があって、話していたことが知らずうちにGoogleドキュメントに入力されていたのを見たときはおまえはHAL9000かと。

 

MP3音源を聞き、それをそのままGoogleドキュメントに向かってうまいことしゃべる。ナレーターのようにしゃべる。するとGoogleドキュメントがするするとテキストに起こしていく。

 

当然、聞き取りミスもかなりあるし、どっちにしろリライトしながらの作業になるのではっきりいって作業はまどろっこしいし遅い。しかし可能性は感じた。少なくともうまく長文が入力できたときなんかはちょっと楽しかった。

 

SONY エレクトレットコンデンサーマイクロホン PCV80U ECM-PCV80U

SONY エレクトレットコンデンサーマイクロホン PCV80U ECM-PCV80U

 

 

面白かったのは、音声入力の聞き取りは単語を区切ってはっきりと発音するよりも、むしろふつうに会話するように早口くらいでしゃべったほうがスムースに聞き取ること。

 

これは音声入力のアルゴリズムによるのだろうけど、単語ひとつひとつを聞き取るのと同時に前後の文脈を読み取って変換していることによるのだと思う。実際に一度変換したあとに数瞬考えてから正しく変換し直されることもある。

つまりセンテンスごとで音声の特徴を掴んで判断しているから、センテンスで入力されたほうが彼には逆にわかりやすいということなのだろう。

 

機械相手だからと不自然に一言一句はっきりとしゃべる必要はなかったのである。

 

しかし、このアルゴリズムを成長させるためにこうやってうちで入力したデータも音声と同時にGoogleにせっせと提出されているのかと思うとそら恐ろしい気もする。

 

また簡単そうに思えて聞き取りが苦手なことばもあったり、さまざまな発見があった。この作業に慣れたらテープ起こしがかなりスピードアップできる可能性がある。

 

会社ではやりづらいだろうが、自宅作業の方はぜひトライしてみたらいい。

 

 

使用するハード・ソフト含め、もうちょいわかりやすく書いた。

blog.diesoon.com