このページは機械翻訳したものです。

PySpark 3.0およびデータ・フローconda環境が導入されました

Python 3.7上のPySpark 3.0およびデータ・フローCPU(バージョン3.0)conda環境を使用すると、Apache SparkおよびMLlibのパワーを適用して、モデルを大規模にトレーニングできます。PySparkSQLは、パラレル処理を使用して、oノートブック内から大量の構造化データおよび半構造化データを分析します。大規模なジョブの場合、Sparkアプリケーションを開発し、データ・フロー・サービスに送信できます。スラグ名はpyspark30_p37_cpu_v3です。

詳細は、データ・サイエンスADS SDKおよびocifs SDKを参照してください。データ・サイエンス・ブログをご覧ください。

この記事は役に立ちましたか。