AI予測演算子

AI予測オペレータは、履歴時系列データを使用して、将来のトレンドの予測を生成します。

この演算子は、特定の予測タスクのモデル選択、ハイパーパラメータ・チューニングおよび機能識別を自動化することで、データ・サイエンス・プロセスを簡素化および迅速化します。

オペレータは使いやすく拡張性があり、データ・サイエンティストのチームと同じくらい強力です。予測を開始するには、次のYAML構成を使用します。
kind: operator
type: forecast
version: v1
spec:
    datetime_column:
        name: ds
    historical_data:
        url: https://raw.githubusercontent.com/facebook/prophet/main/examples/example_yosemite_temps.csv
    horizon: 3
    target_column: y

この例は、このドキュメントを通してさまざまな方法で拡張されています。ただし、表示されているパラメータ以外のすべてのパラメータはオプションです。

詳細は、ADSドキュメントの予測のセクションを参照してください。

モデリング・オプション

完璧なモデルは存在しない。オペレータのコア機能は、様々なモデル・フレームワークから選択できる機能です。エンタープライズAIの場合、通常、1つまたは2つのフレームワークが問題領域に最適なパフォーマンスを発揮します。各モデルは、データセット・サイズ、頻度、複雑さ、季節性など、様々な仮定に対して最適化されます。どのフレームワークが適切かを判断する最良の方法は、経験的なテストです。ADSチームは、いくつかの企業予測の問題の経験に基づいて、従来の統計モデルから複雑な機械学習やディープ・ニューラル・ネットワークに至るまで、次のフレームワークが最も効果的であることがわかりました。
  • Prophet
  • ARIMA
  • LightGBM
  • NeuralProphet
  • AutoTS
ノート

AutoTSは、単一のモデリング・フレームワークではなく、多数の組合せです。AutoTS algorithms include (v0.6.15): ConstantNaive, LastValueNaive, AverageValueNaive, GLS, GLM, ETS, ARIMA, FBProphet, RollingRegression, GluonTS, SeasonalNaive, UnobservedComponents, VECM, DynamicFactor, MotifSimulation, WindowRegression, VAR, DatepartRegression, UnivariateRegression, UnivariateMotif, MultivariateMotif, NVAR, MultivariateRegression, SectionalMotif, Theta, ARDL, NeuralProphet, DynamicFactorMQ, PytorchForecasting, ARCH, RRVAR, MAR, TMF, LATC, KalmanStateSpace, MetricMotif, Cassandra, SeasonalityMotif, MLEnsemble, PreprocessingRegression, FFT, BallTreeMultivariateMotif, TiDE, NeuralForecast, DMD.

自動選択

予測を初めて使用したユーザーの場合、オペレータには自動選択オプションもあります。これは、トレーニング・データを複数の検証セットに分割し、各フレームワークを評価し、最適な検証セットを決定しようとするため、最も計算負荷の高いオプションです。ただし、自動選択は最適なモデルの検索を保証するものではなく、エンド・ユーザーのデフォルト構成としては、その複雑さのためお薦めしません。

モデルの指定

「モデリング・オプション」のリストから必要なモデルを手動で選択し、モデル・パラメータ・スロットに挿入できます。例:
kind: operator
type: forecast
version: v1
spec:
    datetime_column:
        name: ds
    historical_data:
        url: https://raw.githubusercontent.com/facebook/prophet/main/examples/example_yosemite_temps.csv
    horizon: 3
    model: <INSERT_MODEL_NAME_HERE>
    target_column: y

評価と説明

エンタープライズAIソリューションとして、オペレーターは予測の評価と説明が予測自体と同じくらい重要であることを保証します。

レポート中

オペレータが実行されるたびに、完了した作業を要約するレポートが生成されます。レポートは次のとおりです。
  • 入力データのサマリー。
  • 予測のビジュアライゼーション。
  • 主な傾向の一覧です。
  • 追加機能の説明(SHAP値を使用)。
  • メトリックの表
  • 構成YAMLファイルのコピー。

メトリック

様々なユースケースが、様々なメトリックに最適化されています。オペレータを使用すると、最適化するメトリックを次のリストから指定できます。
  • サイトマップ
  • RMSE
  • スマップ
  • MSE
オプションで、メトリックをYAMLファイルで指定できます。
kind: operator
type: forecast
version: v1
spec:
    datetime_column:
        name: ds
    historical_data:
        url: https://raw.githubusercontent.com/facebook/prophet/main/examples/example_yosemite_temps.csv
    horizon: 3
    model: prophet
    target_column: y
    metric: rmse

説明

追加のデータが指定されている場合、オペレータはオプションで、SHAP値を使用してこれらの機能(列)の説明を生成できます。YAMLファイルで説明を有効にできます。
kind: operator
type: forecast
version: v1
spec:
    datetime_column:
        name: ds
    historical_data:
        url: https://raw.githubusercontent.com/facebook/prophet/main/examples/example_pedestrians_covid.csv
    additional_data:
        url: additional_data.csv
    horizon: 3
    model: prophet
    target_column: y
    generate_explanations: True
``` formatted YAML ```
大規模なデータセットでは、SHAP値の生成にコストがかかる場合があります。エンタープライズ・アプリケーションは、10進数の精度に対するニーズが計算コストと異なる場合があります。したがって、演算子にはいくつかのオプションがあります。
FAST_APPROXIMATE (デフォルト)
生成されるSHAP値は通常、真の値の1%以内であり、時間の1%を必要とします。
貸借一致
生成されるSHAP値は通常、真の値の0.1%以内であり、時間の10%が必要です。
HIGH_ACCURACY
完全な精度で真のSHAP値を生成します。
kind: operator
type: forecast
version: v1
spec:
    datetime_column:
        name: ds
    historical_data:
        url: https://raw.githubusercontent.com/facebook/prophet/main/examples/example_yosemite_temps.csv
    horizon: 3
    model: prophet
    target_column: y
    generate_explanations: True
    explanations_accuracy_mode: BALANCED
最適な精度モードを選択するには経験的なテストが必要ですが、FAST_APPROXIMATEは実世界のデータに十分です。
ノート

前述の例では、追加のデータがないため説明は生成されません。機能yのSHAP値は100%です。