AWS Lambda + AI = 音声文字起こしと感情分析(その2:Transcribe)
AWSのホームページの初心者ハンズオンにある「AWS Lambda と AWS AI Services を組み合わせて作る音声文字起こし & 感情分析パイプライン 」の内容を自分のAWSアカウントでやってみました。
前回投稿のS3+Lambda連携でログ記録を実装した続きで、2パート目です。
ざっくりと基本構成を図で表してみて、1パート目にTranscribeを追加した構成です。
ちなみに、 Amazon Transcribe については、以前の投稿に
- 「Amazon Transcribe で音声の文字起こし」
- 「Amazon Transcribe で文字起こしをジョブ処理してWeb連携する」(APIリファレンスはこちらを参照)
があります。
S3バケット(アウトプット用)を作成:mikolabo-serverless-output
Amazon transcribe セットアップ
Lambdaと連携する前に、単独で動かします。
① Name 「mikolabo-job」を設定
②③④⑤ Input data は「Browse S3」をクリックして、S3バケットからファイルを指定する。
⑥⑦⑧ Output data は「Browse S3」をクリックして、出力用S3バケットを指定する。
⑨IAMロールを生成する。ロール名は「AmazonTranscribeServiceRole-」が前置している必要がある。「AmazonTranscribeServiceRole-Mikolabo」とした。
⑩「Next」をクリックして抜ける。
オプション設定は今回、設定しない
「Create job」をクリック
Jobが生成された。
Transcribe 「mikolabo-job」の結果を確認
(出力用S3バケット)
アウトプット用S3バケットをクリック
「analytics/」をクリック
jsonテキストが保存されているので、チェックを入れて、
「名前をつけてダウンロード」
をクリック
音声データの内容
「ハンズオン順調ですか手を動かすの楽しいですよね」
を読み取って、文字起こしした結果が、出力用S3バケットにファイル(mikolabo-job.json)として、格納されている!!
作成したjobはこちらにある!!
今回は、ぞの2:Amazon Transcribeを使って文字起こしを試してみました。
次回は、その3:S3への音声ファイルアップロードをトリガに Lambdaを起動し、Transcribeするパイプラインを作ります。