動画の英語音声をGoogleの音声認識を使って自動書き起こしする方法【Googleドキュメント音声入力】

コンピュータ

需要は不明ですが、ふと思いついてしまったので書き残しておきます。

パソコンで再生した英語音声を書き起こしたい

例えば、以下のオバマさんの動画。

この動画の音声を「音声認識」してテキストにしたい。

この動画にかぎらず、パソコンで再生する色んな”音”を、音声認識を使ってテキストとして書き起こしたいわけであります。

YouTubeにアップすれば、YouTubeの機能を使って音声認識できるのですがアップできない動画もある為、別の方法はないものかなと考えていました。

結果

下のような画像の感じで、動画の音声を書き起こすことができるようになりました。オバマさんのスピーチに合わせて、自動で書き起こしが行われています。

Googleドキュメントの音声入力機能を使う

Googleドキュメントに「音声入力」機能があります。

場所は上の画像の通りですね、[ツール]の[音声入力]を押すと音声入力できるようになります。

これを利用しようと考えました。

ステレオミキサーを既定のデバイスにする

Googleドキュメントの音声入力機能を使うためには、パソコンで再生している音を、音声入力機能に入力する必要があります。

その為、「ステレオミキサー」という機能を利用することにしました。以下のサイトの解説がよくまとまっています。

ステレオミキサーの基礎 – VIPで初心者がゲーム実況するには

 

Windowsの[サウンド]の[録音]タブで、ステレオミキサーを既定のデバイスにしてください。よくわからない人はさきほどのリンク先を参照。

 

そして、ステレオミキサーのレベルを100にします。

 

又、ステレオミキサーがない人は[無効化]されてる可能性があるので、右クリックで[無効なデバイスの表示]にチェックが入っていることを確認してください。

それでもステレオミキサーが表示されない人は、パソコンにステレオミキサーが存在しない為、今回の方法は使えません。

※ただしドライバーを入れたら使えるようになる可能性有。私のパソコンはRealtekを使用しているのですが、ドライバの最新版をあてたらステレオミキサーが使用できるようになりました。

スピーカーを既定のデバイスにする

今度は[再生]タブ。スピーカーを既定のデバイスにします。ヘッドホンやディスプレイを既定にすると音声入力できません。

あとはGoogleドキュメントで音声入力を行うだけ

これで設定は完了。あとは普通に動画や音声を流しながら、Googleドキュメントの音声入力を行うだけです。

最初に貼り付けた画像ですが、[ツール]-[音声入力]ですね。

 

ちなみに、音声ボタンの上部で言語を選択できます。最初はおそらく「日本語」になっていますが、English(United States)とかEnglish(United Kingdom)とかお好きな言語を選択して、開始してください。

 

あとは動画を流した状態で、上のボタンをクリックすれば自動で書き起こしされます。