異常検出
異常検出演算子は、異常検出を任意のエンタープライズ・アプリケーションに統合するためのロー・コード・ツールです。
時系列構造的異常検出を使用して、データ内の異常な瞬間を時間別およびID別にフラグ設定します。
詳細は、ADSドキュメントの「異常検出」セクションを参照してください。
データの入力
異常検出演算子は、次のデータ・セットを受け入れます。
- ターゲット列。
- (オプション)ターゲットが日時および系列で索引付けされるように、1つ以上の系列列。
- (オプション)任意の数の追加変数。
この入力データの他に、検証データを指定できます(使用可能な場合)。検証データには、入力データのすべての列とanomaly
というバイナリ列が必要です。anomaly
列の値は、異常な行の場合はマイナス1、通常の行の場合は1である必要があります。
最後に、テスト・メトリックを受信し、オペレータのパフォーマンスをより簡単に評価するためのtest_data
を指定します。テスト・データは、日付および(オプションで)シリーズ別に索引付けする必要があります。テスト・データは、異常な行の場合はマイナス1、通常の行の場合は1の値にする必要があります。
異常検出ジョブは、次のyamlで構成できます。
kind: operator
type: anomaly
version: v1
spec:
input_data:
url: https://raw.githubusercontent.com/facebook/prophet/main/examples/example_yosemite_temps.csv
model: autots
target_column: y
次のコマンドを使用して演算子を実行します。
ads operator run -f anomaly.yaml
Mulitvariateの異常検出
関連していると思われる追加の変数がある場合は、多変量異常検出を使用します。入力データで指定された追加列はすべて、ターゲット列が異常であるかどうかの検索に使用されます。
自動モデル選択
オペレータ・ユーザーは、それらを使用するために基礎となるモデルについて何も知る必要はありません。デフォルトでは、モデルをauto
に設定します。ただし、モデリング・パラメータをより詳細に制御する場合は、モデル・パラメータをautots
またはautomlx
に設定し、パラメータをmodel_kwargs
に直接渡します。