AWS Amazon Transcribeを使ってみた。簡単にテープおこしする方法。音声をテキスト変換したときの感想

簡単にテープおこしする方法

Amazon Transcribeでテープ起こし

簡単にテープおこしするには、AWSの「Amazon Transcribe」を使います。

使い方も超簡単!

音声認識、そしてそのままテキスト化の精度がここまで上がっているとは思いませんでした。

Amazon Transcribeとは

AWSが提供するサービスのひとつで、音声をテキストに変換する機能です。

開発者であれば、アプリケーションにAmazon Transcribeを追加してアプリケーション内で音声のテキスト変換を実施する事ができます

ちなみに医療分野に特化した「Amazon Transcribe Medical」を使えば医療用語などの変換もできます

Amazon Transcribe設定

テープ起こしするためのAmazon Transcribeの設定は簡単です。

AWSのストレージ領域である「S3」にテキスト化させたい音声データを置き、Amazon Transcribeを実行させるだけです。

Amazon Transcribe設定方法

まずは、音声をAWSにアップロードします。そのためAWSのストレージ「バケット」サービスを作ります。

バケットを作る
「onseininsiki」という名前で作成

続いて、作成した「S3」バケットの中にテキスト化したい音声(mp3形式)をアップロードします。

音声をアップロードした所

音声のアップロードが確認できたら、Amazon Transcribeを起動して、音声を選びます。

どの音声をテキスト化させるか選ぶ

で、「create job」で音声を読み込んでテキスト化させます。

ジョブ実行

で、しばらく待つ。そうすると音声がテキスト化されてテキスト形式でダウンロードできるようになります。

音声認識の結果

今回、文豪太宰治の本を朗読している音声を拾ってきて、変換してみました。

出力されるテキストは以下の通りです。

{“jobName”:”dazai”,”accountId”:”082319257837″,”results”:{“transcripts”:[{“transcript”:”太宰治作ああ秋本職の四人ともなればいつどんな注文があるか分からないから常に資材の準備をしておくのである秋についてという注文が来ればよし来たと彼の分の引き出しを開いてあい青赤秋色々のとがあってそのうちの秋の部ののとを選び出し落ち着いてそのの戸を調べるのであるトンボ透き通ると書いてある秋になるとトンボも非弱く肉体は死んで精神だけがふらふら飛んでいる様子をさしていっている言葉らしいトンボの体が秋の日差しに透き通って。}],”items”:

[{“start_time”:”2.84″,”end_time”:”3.58″,”alternatives”:[{“confidence”:”1.0″,”content”:”太宰”}],”type”:”pronunciation”},{“start_time”:”3.58″,”end_time”:”4.14″,”alternatives”:[{“confidence”:”1.0″,”content”:”治”}],”type”:”pronunciation”},{“start_time”:”4.14″,”end_time”:”4.66″,”alternatives”:[{“confidence”:”0.7714″,”content”:”作”}],”type”:”pronunciation”},{“start_time”:”5.74″,”end_time”:”6.04″,”alternatives”:[{“confidence”:”0.4098″,”content”:”ああ”}],”type”:”pronunciation”},{“start_time”:”6.74″,”end_time”:”7.36″,”alternatives”:[{“confidence”:”0.6942″,”content”:”秋”}],”type”:”pronunciation”},{“start_time”:”9.84″,”end_time”:”10.43″,”alternatives”:{“start_time”:”22.61″,”end_time”:”23.1″,”alternatives”:,”status”:”COMPLETED”}

60分までの変換なら、無料枠で出来ます。最初の250000分(約4166時間)は、1分0.024ドルです。

上記価格表によると1時間1.44ドルになりますね。

今後試したい事

議事録

複数喋る人がいたときに、きちんと変換できるか試してみたい。

リアルタイム変換

こちらは既にサービスとしてありますが、動かしてみる事ができませんでした。今後試してみたいと思います。

まとめ

変換は出来た。精度も高い。今回は文学のテキスト化を実施しました。

講演会などもやってみたところ「スピード感をもって」とか「エビデンスが必要です」など英単語の混ざった言葉の変換は変でした。