Esta página ha sido traducida por una máquina.

Operador de previsión de IA

El operador de previsión de IA utiliza datos de series temporales históricas para generar previsiones para tendencias futuras.

Este operador simplifica y acelera el proceso de ciencia de datos mediante la automatización de la selección de modelos, el ajuste de hiperparámetros y la identificación de funciones para una tarea de predicción específica.

El operador es fácil de usar y ampliar, y tan potente como un equipo de científicos de datos. Para empezar con una previsión, utilice la siguiente configuración de YAML:
kind: operator
type: forecast
version: v1
spec:
    datetime_column:
        name: ds
    historical_data:
        url: https://raw.githubusercontent.com/facebook/prophet/main/examples/example_yosemite_temps.csv
    horizon: 3
    target_column: y

Este ejemplo se amplía de varias formas a lo largo de esta documentación. Sin embargo, todos los parámetros más allá de los que se muestran son opcionales.

Para obtener más información, consulte la sección Previsión de la documentación de ADS.

Opciones de modelado

No existe un modelo perfecto. Una característica principal del Operador es la capacidad de seleccionar entre varios marcos de modelos. Para la IA empresarial, normalmente uno o dos marcos funcionan mejor para el espacio problemático. Cada modelo está optimizado para diferentes suposiciones, como el tamaño del conjunto de datos, la frecuencia, la complejidad y la estacionalidad. La mejor manera de decidir qué marco es correcto para usted es a través de pruebas empíricas. Basado en la experiencia con varios problemas de previsión empresarial, el equipo de ADS ha encontrado que los siguientes marcos son los más efectivos, que van desde modelos estadísticos tradicionales hasta aprendizaje automático complejo y redes neuronales profundas:
  • Profeta
  • ARIMA
  • LightGBM
  • NeuralProphet
  • AutoTS
Nota

AutoTS no es un único marco de modelado, sino una combinación de varios. AutoTS algorithms include (v0.6.15): ConstantNaive, LastValueNaive, AverageValueNaive, GLS, GLM, ETS, ARIMA, FBProphet, RollingRegression, GluonTS, SeasonalNaive, UnobservedComponents, VECM, DynamicFactor, MotifSimulation, WindowRegression, VAR, DatepartRegression, UnivariateRegression, UnivariateMotif, MultivariateMotif, NVAR, MultivariateRegression, SectionalMotif, Theta, ARDL, NeuralProphet, DynamicFactorMQ, PytorchForecasting, ARCH, RRVAR, MAR, TMF, LATC, KalmanStateSpace, MetricMotif, Cassandra, SeasonalityMotif, MLEnsemble, PreprocessingRegression, FFT, BallTreeMultivariateMotif, TiDE, NeuralForecast, DMD.

Seleccionar Automáticamente

Para los usuarios nuevos en la previsión, el operador también tiene una opción de selección automática. Esta es la opción más costosa computacionalmente, ya que divide los datos de entrenamiento en varios conjuntos de validación, evalúa cada marco e intenta decidir el mejor. Sin embargo, la selección automática no garantiza la búsqueda del mejor modelo y no se recomienda como configuración por defecto para los usuarios finales debido a su complejidad.

Especificar el modelo

Puede seleccionar manualmente el modelo necesario de la lista en Opciones de Modelado e insertarlo en el espacio de parámetros del modelo. Por ejemplo:
kind: operator
type: forecast
version: v1
spec:
    datetime_column:
        name: ds
    historical_data:
        url: https://raw.githubusercontent.com/facebook/prophet/main/examples/example_yosemite_temps.csv
    horizon: 3
    model: <INSERT_MODEL_NAME_HERE>
    target_column: y

Evaluación y explicación

Como solución de IA empresarial, el operador garantiza que la evaluación y explicación de las previsiones sean tan críticas como las propias previsiones.

Informes

Con cada ejecución de operador, se genera un informe para resumir el trabajo realizado. El informe incluye lo siguiente:
  • Resumen de los datos de entrada.
  • Visualización de la previsión.
  • Listado de las principales tendencias.
  • Explicación (mediante valores SHAP) de características adicionales.
  • Una tabla de métricas.
  • Una copia del archivo YAML de configuración.

Métricas

Los diferentes casos de uso se optimizan para diferentes métricas. El operador permite a los usuarios especificar la métrica que desean optimizar de la siguiente lista:
  • MAPE
  • RMSE
  • PYME
  • ECM
Opcionalmente, la métrica se puede especificar en el archivo YAML:
kind: operator
type: forecast
version: v1
spec:
    datetime_column:
        name: ds
    historical_data:
        url: https://raw.githubusercontent.com/facebook/prophet/main/examples/example_yosemite_temps.csv
    horizon: 3
    model: prophet
    target_column: y
    metric: rmse

Explicaciones

Cuando se proporcionan datos adicionales, el operador puede generar de manera opcional explicaciones para estas funciones (columnas) mediante valores SHAP. Puede activar explicaciones en el archivo YAML:
kind: operator
type: forecast
version: v1
spec:
    datetime_column:
        name: ds
    historical_data:
        url: https://raw.githubusercontent.com/facebook/prophet/main/examples/example_pedestrians_covid.csv
    additional_data:
        url: additional_data.csv
    horizon: 3
    model: prophet
    target_column: y
    generate_explanations: True
``` formatted YAML ```
Con grandes conjuntos de datos, los valores SHAP pueden ser costosos de generar. Las aplicaciones empresariales pueden variar en su necesidad de precisión decimal en comparación con el costo computacional. Por lo tanto, el operador ofrece varias opciones:
FAST_APPROXIMATE (valor por defecto)
Los valores SHAP generados suelen estar dentro del 1% de los valores verdaderos y requieren el 1% del tiempo.
CUADRADO
Los valores SHAP generados suelen estar dentro del 0,1% de los valores verdaderos y requieren el 10% del tiempo.
HIGH_ACCURACY
Genera los valores SHAP verdaderos con toda precisión.
kind: operator
type: forecast
version: v1
spec:
    datetime_column:
        name: ds
    historical_data:
        url: https://raw.githubusercontent.com/facebook/prophet/main/examples/example_yosemite_temps.csv
    horizon: 3
    model: prophet
    target_column: y
    generate_explanations: True
    explanations_accuracy_mode: BALANCED
La selección del mejor modo de precisión requiere pruebas empíricas, pero FAST_APPROXIMATE suele ser suficiente para datos reales.
Nota

El ejemplo anterior no genera explicaciones debido a que no hay datos adicionales. Los valores de SHAP son 100% para la función y.