PySpark 3.0およびデータ・フローconda環境が導入されました
- サービス: データ・サイエンス
- リリース日: 2022年2月9日
Python 3.7上のPySpark 3.0およびデータ・フローCPU(バージョン3.0)conda環境を使用すると、Apache SparkおよびMLlibのパワーを適用して、モデルを大規模にトレーニングできます。PySparkSQLは、パラレル処理を使用して、oノートブック内から大量の構造化データおよび半構造化データを分析します。大規模なジョブの場合、Sparkアプリケーションを開発し、データ・フロー・サービスに送信できます。スラグ名はpyspark30_p37_cpu_v3
です。
詳細は、データ・サイエンス、ADS SDKおよびocifs SDKを参照してください。データ・サイエンス・ブログをご覧ください。