データ・フローを開始する前に
データ・フローの使用を開始する前に、次が必要です:
- Oracle Cloud Infrastructureアカウント。トライアル・アカウントは、データ・フローのデモに使用できます。
- Oracle Cloudサービスのサービス管理者ロール。サービスがアクティブ化されると、Oracleから選択したアカウント管理者に資格証明およびURLが送信されます。アカウント管理者は、サービスへのアクセスを必要とする各ユーザーのアカウントを作成します。
- 次のようなサポート対象ブラウザがあります:
-
Microsoft Internet Explorer 11.x以上
-
Mozilla Firefox ESR 38以上
-
Google Chrome 42以上
-
- Sparkアプリケーションをオブジェクト・ストレージにアップロードします。
.zip
や.gzip
などのzipフォーマットでパッケージ化しないでください。 - 処理のデータをOracle Cloud Infrastructureオブジェクト・ストレージにロードします。データは外部データ・ソースまたはクラウドから読み取ることができます。データ・フローは、Oracle Cloud Infrastructureオブジェクト・ストアに格納されているデータのパフォーマンスとセキュリティを最適化します。
- サポートされるアプリケーション・タイプは、次のとおりです:
- Java
- Scala
- SparkSQL
- PySpark (Python 3のみ)
- この表には、データ・フローでサポートされているSparkバージョンを記載しています。
この表は参照専用であり、包括的ではありません。
サポートされているSparkのバージョン Sparkバージョン Hadoop Java Python Scala oci-hdfs oci-java-sdk Sparkのドキュメント Spark 3.5.0 3.3.4 17.0.10 3.11.5 2.12.18 3.3.4.1.4.2 3.34.1 Sparkリリース3.5.0のガイド Spark 3.2.1 3.3.1 11.0.14 3.8.13 2.12.15 3.3.1.0.3.2 2.45.0 Sparkリリース3.2.1のガイド Spark 3.0.2 3.2.0 1.8.0_321 3.6.8 2.12.10 3.2.1.3 1.25.2 Sparkリリース3.0.2のガイド Spark 2.4.4 2.9.2 1.8.0_162 3.6.8 2.11.12 2.9.2.6 1.25.0 Sparkリリース2.4.4のガイド
ノート
Oracle Cloud Infrastructureコンソール、APIまたはCLIを使用してクラウド・リソースに説明、タグまたはわかりやすい名前を割り当てる場合、機密情報を入力しないでください。これは、データ・フローでアプリケーションを作成または編集する場合に適用されます。
Oracle Cloud Infrastructureコンソール、APIまたはCLIを使用してクラウド・リソースに説明、タグまたはわかりやすい名前を割り当てる場合、機密情報を入力しないでください。これは、データ・フローでアプリケーションを作成または編集する場合に適用されます。