Esta página ha sido traducida por una máquina.

Instalación de entornos Conda en una sesión del bloc de notas

Para utilizar entornos conda en sesiones de bloc de notas, debe instalarlos.

Puede instalar un entorno conda publicado o de Data Science haciendo clic en Instalar en la tarjeta de entorno. Puede copiar y ejecutar el fragmento de código en una ventana de terminal. El nuevo entorno se instala en un volumen en bloque en la carpeta /home/datascience/conda. Las carpetas en /home/datascience/conda corresponden a slugs de los entornos conda.

Una vez que el entorno está listo para utilizarse como núcleo de Notebook, la nueva entrada de entorno se muestra en el separador Installed Conda Environments del separador Environment Explorer. A continuación, hay disponible un nuevo núcleo para ese entorno conda concreto en el separador Launcher de JupyterLab en la categoría Notebook. Puede comenzar a trabajar en ese entorno conda haciendo clic en el icono del núcleo del entorno para abrir un nuevo separador para abrir un nuevo archivo de bloc de notas.

O bien, puede abrir un nuevo Notebook haciendo clic en File, seleccione New y, a continuación, seleccione un núcleo para la sesión de Notebook.

Importante

Dado que todos los entornos conda instalados se almacenan en el volumen en bloque en /home/datascience, estos entornos están disponibles después de activar la sesión. No necesita volver a instalar los entornos conda después de desactivar la sesión de bloc de notas.

Instale un entorno conda mediante el comando odsc conda en un separador de ventana de terminal JupyterLab:

odsc conda install --slug <slug>

<slug> es el nombre para URL del entorno que desea instalar. El nombre para URL se muestra en la tarjeta de entorno en el separador Environment Explorer. Se le pedirá que cambie la versión del entorno, lo cual es opcional. Puede tardar unos segundos en mostrarse el nuevo núcleo en el separador Launcher de JupyterLab.

Por defecto, odsc conda busca entornos conda de Data Science con el valor <slug> coincidente o <name> y <version>. Puede dirigir un cubo de Object Storage que aloje entornos conda publicados agregando la opción --override. Busca el entorno conda de destino en el cubo definido en el archivo config.yaml personalizado creado por odsc conda init. Por ejemplo:

odsc conda install --override --slug <slug>

Muestre todas las opciones de instalación admitidas con odsc conda install -h.

Los entornos conda también se pueden instalar mediante archivos tar. Proporcione el URI de los archivos tar especificándolo con la opción --uri. Puede ser una ruta local, enlaces de PAR o un enlace de OCI.

Instalación desde un archivo local:
odsc conda install --uri <path_to_the_local_environment_tar_file>
Instalación con un enlace PAR:
odsc conda install --uri <http_link_to_the_environment_tar_file>
Instalación con un enlace de OCI mediante la autenticación de entidad de recurso:
odsc conda install --uri <oci://my-bucket@my-namespace/path_to_tar_file>
Importante

No se recomienda instalar bibliotecas en el entorno base (Python 3) porque no se conservan después de la reactivación del bloc de notas. La mejor práctica es clonar el entorno base y, a continuación, instalar en él bibliotecas.

Actualización del entorno PySpark Conda

Estos pasos solo son necesarios si ha instalado la versión anterior del entorno conda PySpark y desea conservarlo para un posible uso futuro. Si no necesita el entorno antiguo ni ha realizado ninguna configuración específica para Spark, le recomendamos que suprima el entorno antiguo antes de continuar con la instalación de la nueva versión.

  1. Preparación para la actualización del entorno conda PySpark:
    • Abra la sesión de Notebook de Data Science.
    • Busque el directorio spark_conf_dir en el directorio raíz y, a continuación, cámbielo a spark_conf_dir_v2. La acción de cambio de nombre desactiva temporalmente el entorno pyspark32_p38_cpu_v2.

      Puede revertir cambiando el nombre de spark_conf_dir_v2 a spark_conf_dir y, a continuación, pyspark32_p38_cpu_v2 vuelve a estar operativo.

  2. Actualización del entorno conda de Pyspark:
    • Abra un terminal y ejecute el comando:

      odsc conda install -s pyspark32_p38_cpu_v3

      El comando instala un entorno conda V3 y crea un nuevo directorio spark_conf_dir.

  3. Verificación de cambios de configuración:
    • Si ha realizado cambios personalizados en la configuración antigua de spark_conf_dir_v2, como modificaciones en core-site.xml o spark-defaults.conf, asegúrese de que estos cambios se copian en sus respectivos archivos en el nuevo directorio spark_conf_dir_v2.

¿Le ha resultado útil este artículo?