Conda環境の表示
環境エクスプローラを使用して、ノートブック・セッション内のすべてのconda環境をリストします。
データ・サイエンス・サービスは、一連の事前構築済データ・サイエンスconda環境を提供し、JupyterLab「ランチャ」タブで「環境エクスプローラ」を選択してアクセスできます:
-
既存のconda環境を参照します。
-
conda環境を検索します。
-
ノートブック・セッションに事前構築済のデータ・サイエンスconda環境をインストールします。
-
conda環境をインストールすると、クローニングできます。
-
所有するオブジェクト・ストレージ・バケットにインストールされているconda環境を公開します。
各ボタンをクリックして、これらのカテゴリのconda環境を参照して環境エクスプローラの使用を開始します。環境カテゴリごとにタブの色が異なることに注意してください。各環境は、個別の環境カードに表示されます。環境のバージョンごとに個別のカードがあります。
環境エクスプローラでは、conda環境をアーキテクチャ、非推奨およびソース・タイプでフィルタできます。フィルタを有効にすると、リストされているconda環境が制限されます。デフォルトでは、非推奨のconda環境は表示されません。「非推奨の表示」を選択すると、検索結果にこれらの環境が含まれます。
複数のソース・タイプ・フィルタを有効にすると(ボタンの末尾にあるxに注意してください)、相加効果があります。「Data Science Conda環境」を使用して、データ・サイエンス・サービスによって提供されるconda環境を表示します。「公開されたConda環境」を使用して、公開した環境を表示します。「インストールされたCda環境」を使用して、ノートブック・セッションにインストールされたcda環境を表示します。
各ソース・タイプ・フィルタ内には、カッコ内に2つの数字があります。最初の数字は、選択されているconda環境の数を示します。2番目の数字は、そのフィルタ・ソース・タイプで使用可能なconda環境の合計数を示します。
検索を使用して、リストされているconda環境をさらにフィルタできます。検索基準に一致しないconda環境が動的にフィルタ処理されます。一致したテキストは、各conda環境の詳細で強調表示されます。デフォルトでは、検索はあいまい一致を実行します。ただし、強力な検索言語がサポートされています。検索フィールドに入力すると、結果が即座に表示され、検索問合せに関連する一致するconda環境が表示されます。テキストは黄色で強調表示され、簡単に見つけることができます。次の方法で検索できます:
-
<Token>は、<Token>とあいまい一致のアイテムを返します
-
<Example> <Token>は、<Example>と<Token>のあいまい一致のアイテムを返します
-
<Example> | <Token>は、<Example>または<Token>のあいまい一致のアイテムを返します
-
="<Example> <Token>"は、<Example> <Token>と完全に一致するアイテムを返します
-
<Token>は、<Token>を含むアイテムを返します
-
!<Token>は、<Token>を含まないアイテムを返します
-
^<Token>は、<Token>で始まるアイテムを返します
-
!^<Token>は、<Token>で始まらないアイテムを返します
-
<Token>$は<Token>で終わるアイテムを返します
-
!<Token>$は、<Token>で終わらないアイテムを返します
conda環境のリストは、環境エクスプローラを開くとキャッシュされます。使用可能な環境のリストをリフレッシュできます。
環境エクスプローラには、リスト・ビューとカード・ビューがあります。検索バーの左側にあるボタンで、ビューを制御します。どちらのビューも、タイトル、環境のバージョン、言語のバージョン、アーキテクチャ、作成日、サイズ、人間が読める名前、説明、キー・ライブラリ、ソースの場所などの情報を提供します。また、環境のインストール、アンインストール、公開およびクローニングを行うコマンドもあります。
カード・ビューでは、各conda環境が個別のカードに表示されます。このビューには、conda環境に関するほとんどの情報が表示されます。表示されるconda環境の数が少ない場合に使用できます。
リスト・ビューには、各conda環境のサマリーが1行で表示され、多くの環境が表示される場合に最適です。行の矢印を切り替えて、環境に関する詳細の表示と非表示を切り替えます。列見出しを使用して、結果をソートできます。カラム名を数回クリックすると、並べ替え順が変更されます。環境のすべてのバージョンが1行で表されます。環境に複数のバージョンがある場合は、ドロップダウン・リストを使用してバージョンを切り替えることができます。
新しいconda環境は最初にリストされ、カードの上部にNEWとマークされます。非推奨の環境は、バージョン番号の横に「非推奨」とマークされます。
ボタンを使用してカードをフィルタできます。たとえば、「公開されたConda環境」を選択して、公開された環境のみを表示します。デフォルトでは、非推奨の環境は表示されないため、「非推奨の表示」を選択する必要があります。「CPU」または「GPU」を選択して、シェイプでフィルタすることもできます。環境ボタンおよび「非推奨の表示」チェック・ボックスには、フィルタリングに基づいて環境の数が表示されます。
左下には、Python condaカーネルとノートブックの状態がアイコンの横に表示されます。この名前またはノートブックの右上隅にある名前をクリックすると、conda環境を変更できます。
すべてのConda環境
「すべてのConda環境」タブには、すべてのデータ・サイエンス、インストール済および公開済Conda環境のカード・リストが表示されます。ノートブック・セッションでのConda環境のインストールおよびテナンシのオブジェクト・ストレージ・バケットへのConda環境の公開を参照してください。
データ・サイエンスConda環境
「環境エクスプローラ」タブの「データ・サイエンスConda環境」フィルタでは、データ・サイエンス・サービスで提供されるconda環境がリストされます。これらの環境は、データ・サイエンス・サービス・チームによってキュレーションされています。環境は、機械学習作業(GPU用一般機械学習など)を行うための特定のツールおよびフレームワーク(PySparkなど)の提供に重点を置いています。または、ビジネス・ユース・ケースを解決するための包括的な環境を提供します。
次のようにodsc conda
CLIを使用して、ターミナル・ウィンドウから直接データ・サイエンスconda環境をリストできます:
odsc conda list
オプションの引数-o
を使用して公開されたconda環境をリストしたり、-l
を使用してインストールされたConda環境をリストできます。
各データ・サイエンスconda環境には、環境にインストールされているライブラリの使用を開始する際に役立つ、独自のノートブック例のセットが付属しています。これらの環境は定期的に更新され、新しい環境が定期的にリストに追加されます。データ・サイエンス環境を参照してください。
特定のデータ・サイエンスconda環境の古いバージョンは、引き続きインストールできます。データ・サイエンスconda環境を使用するには、ノートブック・セッションにインストールする必要があります。
ノートブック・セッションでデータ・サイエンスconda環境にアクセスするには、サービスまたはNATゲートウェイを介してトラフィックがルーティングされるようにVCNおよびサブネットを構成する必要があります。そうしないと、ノートブック・セッションはデータ・サイエンス環境を読むことができません。
インストールされたConda環境
「環境エクスプローラ」タブの「インストールされたConda環境」タブには、ノートブック・セッションで現在インストールされ、使用可能なconda環境がリストされます。
すべての新しいノートブック・セッションにはconda環境がインストールされていないため、データ・サイエンスconda環境のいずれかをインストールする必要があります。ノートブック・セッションへのConda環境のインストールを参照してください。
ノートブック・セッションでconda環境を作成することもできます。作成されたすべてのconda環境は、「インストールされたConda環境」カテゴリにあります。
データ・サイエンスconda環境または公開されたconda環境をインストールできます。インストールされたすべてのConda環境は、/home/datascience/conda
ディレクトリのブロック・ボリュームに格納されます。
ノートブック・セッションを非アクティブにし、再度アクティブにすると、以前にインストールしたすべてのconda環境が再び使用できるようになります。再アクティブ化では、ノートブック・セッションをアクティブ化した後、Python依存関係を再インストールする必要はありません。
公開されたConda環境
公開されたconda環境をリストする前に、バケット名およびネームスペースを指定して
odsc conda init
を実行する必要があります。テナンシのオブジェクト・ストレージ・バケットへのConda環境の公開を参照してください。または、odsc conda
CLIを使用して、次を実行して、ターミナル・ウィンドウから直接公開されたconda環境をリストできます:
odsc conda list -o
conda環境を公開していない場合は、情報メッセージが表示されます。
ノートブック・セッションにconda環境をインストールした後、ノートブックの実行、さらにPythonライブラリのインストール、およびそのconda環境内のライブラリのバージョンを変更できます。conda環境を公開すると、管理するオブジェクト・ストレージ・バケットにconda環境を保存またはアーカイブできます。
conda環境の公開には、次のようなメリットがあります:
- チームとの共有が可能:
-
conda環境を公開すると、同じオブジェクト・ストレージ・バケットにアクセスできる他のチーム・メンバーが使用できるようになります。事前構築されたデータ・サイエンス環境をインストールするのと同様に、以前に公開されたConda環境をノートブック・セッションにインストールできます。これにより、データ・サイエンティストはチーム間で環境を管理および共有できます。以前は不可能だったノートブック・セッション間でcda環境を共有できます。
- モデルの再現性:
-
ADSでは、モデルがモデル・カタログに保存されるたびに、モデルがトレーニングされたconda環境を公開できます。ADSは、その環境の参照をモデル・アーティファクトの一部である
runtime.yaml
ファイルに保持します。モデルを監査する必要がある場合は、runtime.yaml
ファイルで参照されているトレーニング中のconda環境を再インストールすることで、モデルがトレーニングされた正確なconda環境を取得します。
環境を公開する前に、conda環境の格納に使用するネームスペースおよびバケットを指定する必要があります。これは、
odsc conda init
コマンドで行います。リソース・プリンシパルを使用するか、odsc conda
がオブジェクト・ストレージ・バケットに読取りおよび書込みできるように適切な構成およびキー・ファイルを設定していることを確認してください。