AWS Lambda + AI = 音声文字起こしと感情分析(その2:Transcribe)

AWSのホームページの初心者ハンズオンにある「AWS Lambda と AWS AI Services を組み合わせて作る音声文字起こし & 感情分析パイプライン 」の内容を自分のAWSアカウントでやってみました。

前回投稿のS3+Lambda連携でログ記録を実装した続きで、2パート目です。
ざっくりと基本構成を図で表してみて、1パート目にTranscribeを追加した構成です。

ちなみに、 Amazon Transcribe については、以前の投稿に

があります。

S3バケット(アウトプット用)を作成:mikolabo-serverless-output

「mikolabo-services-output」を作成した。

Amazon transcribe セットアップ

Lambdaと連携する前に、単独で動かします。

「Create a transcript」をクリック
transcribe セットアップ

① Name 「mikolabo-job」を設定

②③④⑤ Input data は「Browse S3」をクリックして、S3バケットからファイルを指定する。

⑥⑦⑧ Output data は「Browse S3」をクリックして、出力用S3バケットを指定する。

⑨IAMロールを生成する。ロール名は「AmazonTranscribeServiceRole-」が前置している必要がある。「AmazonTranscribeServiceRole-Mikolabo」とした。

⑩「Next」をクリックして抜ける。

オプション設定は今回、設定しない

「Create job」をクリック

Jobが生成された。

Transcribe 「mikolabo-job」の結果を確認

(出力用S3バケット)

アウトプット用S3バケットをクリック

「analytics/」をクリック

jsonテキストが保存されているので、チェックを入れて、
「名前をつけてダウンロード」
をクリック

音声データの内容
「ハンズオン順調ですか手を動かすの楽しいですよね」
を読み取って、文字起こしした結果が、出力用S3バケットにファイル(mikolabo-job.json)として、格納されている!!

作成したjobはこちらにある!!

今回は、ぞの2:Amazon Transcribeを使って文字起こしを試してみました。
次回は、その3:S3への音声ファイルアップロードをトリガに Lambdaを起動し、Transcribeするパイプラインを作ります。