PySpark V3.0 conda環境が導入されました。
- サービス: データ・サイエンス
- リリース日: 2021年6月1日
PySpark V3.0 condaを使用して、データ・フロー・ジョブを作成するか、PySparkをローカルで実行します。このconda環境では、PySparkバージョンがV2.4.4からV3.0.2に更新され、データ・フローのアップグレードと互換性があります。condaは、Oracle Accelerated Data Science (ADS) SDK v2.2.1ライブラリを使用したPython 3.7に基づいています。Oracle Autonomous Databaseの操作、およびparquetファイルでのsnappy圧縮のサポートを提供します。このconda環境はCPU用です。スラグ名はpyspark30_p37_cpu_v1です。
詳細は、データ・サイエンスおよびデータ・サイエンスAPIを参照してください。