2021年7月14日 / 最終更新日 : 2022年12月9日 MikoshibaHiroyuki AI

Amazon Forecast で未来の値を予測する

Forecast は、機械学習を使用して精度の高い予測を行うサービスです。
各店舗の在庫数の予測、各会社の財務予測、必要人員数や原材料といった必要リソースの予測など未来を見通せます。

Forecast は、Amazon.com と同じ技術で、機械学習を使って時系列データによって予測を立てますが、使用に機械学習の経験は必要ありません。

Forecast はサーバープロビジョニングも、機械学習モデルの構築、トレーニング、デプロイも不要です。
実際に使用した分のみ料金が発生し、最低料金や前払いの義務はありません。

Forecast は、時系列データと他の変数 (製品の特徴や店舗の所在地など) が相互にどう影響し合っているのかを自動的に判断することにより、予測精度を最大 50％高めます。

Forecast は予測時間を月単位から時間単位に短縮、設計に何か月も要していた予測精度の水準を、わずか数時間で達成できます。

Forecast では、小売り、物流、金融、広告成果その他を含む、ほぼすべての産業とユースケース向けの予測を立てることができます。

Forecast でのやり取りは、暗号化により保護されます。コンテンツは、Amazon Key Management Service を介してカスタマーキーと共に暗号化され、ユーザーリージョンに保管されます。

また、管理者はIAMアクセス許可ポリシーを介して Forecast へのアクセスを制御できるので、機密情報は安全かつ極秘に保たれます。

Amazon Forecast の料金

予測の生成

例えば、ある店舗商品１個の需要は、10 日間予測であろうが、10 年間予測であろうが、1 つの予測 (1 つの時系列) となります。予測は、1,000 単位 (1,000 未満は切り上げ) で課金されます。
予測はデフォルトで 3 つの分位値 (10%、50%、90%) で生成され、合計予測数は 3 の倍数で増加します。変位値 (1?5)はいつでも上書きし、選択した特定の予測に対してのみ支払うことができます。

データストレージ

Forecastモデルのトレーニングに使用するためのデータ (GB 単位) の保存にかかる料金です。

トレーニング時間

お客様提供データに基づき、カスタマイズ予測モデルをトレーニングする時間に 1 時間単位で課金されます。
特定のシナリオでは、複数ジョブの並行実行や特定リソースを必要とするため、トレーニング時間と実行時間はは必ずしも同じではありません。
時間には予測子と予測の作成に費やされる時間も含まれます。

無料利用枠：最初の 2 か月間は以下無料

予測の生成: 1 か月あたり最大 10,000 の時系列予測
データストレージ: 1 か月あたり最大 10 GB
トレーニング時間: 1 か月あたり最大 10 時間

Amazon Forecast ハンズオン

アマゾンが用意している初心者向けシナリオに沿って、Forecastを試しました。

１．データの準備

過去の家庭の電力使用量のデータから将来の使用量を予測するモデルを構築する
学習データを以下のURLからダウンロード・解凍

（Small） http://bit.ly/22Z4QCj
（Large） https://amzn.to/2kEBwRs

electricityusagedata.csvというファイルを確認する

各家庭の毎時の電⼒使⽤量（左から時刻、電⼒量、家庭のID）

マネジメントコンソールからS3画面を表示し、CSVファイルをアップロードするバケットを選択

CSVファイルがアップロードされました。

アップロードしたCSVファイルをクリック

「S3　URI　をコピー」をクリックして、URLをメモっておく

s3://skillsetxxxx/electricityusagedata.csv

２. データセットのインポート

左の Ξ からメニューを開き、「Dataset groups」メニューが表⽰されるのでクリック

データセットグループを作成

Create dataset group を選択してデータセットグループを作成
TARGET_TIME_SERIES, RELATED_TIME_SERIES, ITEM_METADATA の3種のデータセットを
データセットグループに登録可能
このハンズオンでは、必須の TARGET_TIME_SERIES のみ利用する