Configuración manual de un arrendamiento de Data Science

En este tutorial, configurará su arrendamiento para Data Science y lo probará mediante la creación de una sesión de bloc de notas.

Este tutorial está dirigido a los usuarios administradores porque tienen los permisos de acceso necesarios.

En este tutorial va a hacer lo siguiente:

1. Creación de un grupo de usuarios de científicos de datos.

2. Creación de un compartimento para su trabajo.

3. (Opcional) Creación de una VCN y una subred.

4. Creación de políticas.

5. Creación de un grupo dinámico con políticas.

6. Creación de una sesión de bloc de notas.

Antes de empezar

Para realizar este tutorial, debe tener lo siguiente:

  • Una cuenta de Oracle Cloud Infrastructure (OCI) de pago o una nueva cuenta con promociones de Oracle Cloud. Consulte Solicitar y gestionar promociones de Oracle Cloud gratis.

  • Privilegios de administrador para la cuenta de OCI.
  • Al menos un usuario de su arrendamiento que desee acceder al servicio de ciencia de datos. Este usuario debe crearse en IAM.

1. Creación de un grupo de usuarios de científicos de datos

Cree un grupo de usuarios para que los científicos de datos trabajen en él.

  1. Abra un explorador soportado e introduzca la URL de la consola:
    https://cloud.oracle.com
  2. Introduzca su Nombre de cuenta de nube, también conocido como su nombre de arrendamiento, y seleccione Siguiente.
  3. Conéctese con su nombre de usuario y contraseña.
  4. Abra el menú de navegación y seleccione Identidad y seguridad. En Identity, haga clic en Domains.

    Se muestra una lista de los dominios de su arrendamiento.

  5. Seleccione el nombre del dominio en el que desea trabajar.
  6. Siga los pasos de Creación de un grupo para crear un grupo.
  7. Asigne al nuevo grupo el nombre data-scientist e introduzca una descripción.
  8. Siga los pasos de Adición de Usuarios a un Grupo para agregar un usuario al grupo que ha creado.
  9. Repita la adición de todos los usuarios de científicos de datos al grupo de científicos de datos.

2. Creación de un compartimento para su trabajo

Crear un compartimento para los recursos de ciencia de datos.

  1. Siga los pasos de Creación de un compartimento para crear un compartimento.
  2. Introduzca un nombre para el nuevo compartimento data-science-work y, a continuación, una descripción.
  3. Confirme que el compartimento aparece en la lista de compartimentos.

3 (Opcional) Creación de una VCN y una subred

Este paso es opcional. Al crear una sesión de bloc de notas en el Paso 6. Creación de una sesión de bloc de notas, puede elegir crear una red por defecto con la configuración adecuada para las sesiones de bloc de notas.

Importante

Puede omitir la creación de una red y la configuración de subredes y gateways si selecciona la red por defecto al crear un bloc de notas. Si la red por defecto está configurada en un bloc de notas, no puede cambiarla al reactivar el bloc de notas.

En esta sección se muestran los usuarios que necesitan acceso a sus redes virtuales en la nube, cómo crear una VCN y, posteriormente, cómo seleccionar la subred recomendada para las sesiones de bloc de notas. Por ejemplo, si está realizando el tutorial Programación de ejecuciones de trabajos de Data Science, cree esta red y utilícela tanto para la sesión de bloc de notas en Data Science como para el espacio de trabajo en el servicio Data Integration.

  1. Siga los pasos de Creación de una VCN para crear una VCN.
  2. Introduzca datascience-vcn para el Nombre de VCN.
  3. Seleccione el compartimento data-science-work. Este compartimento aloja la VCN que crea en esta sección. Este nuevo compartimento tardará tiempo en aparecer en la lista de compartimentos, por lo que refresque la página hasta que aparezca.
  4. Para Configurar VCN y subredes, mantenga los valores por defecto:
    • Bloque de CIDR de VCN: 10.0.0.0/16
    • Bloque de CIDR de subred pública: 10.0.0.0/24
    • bloque de CIDR de subred privada: 10.0.1.0/24
    • Utilizar los nombres de host de DNS en esta VCN: seleccionado

    Utilice esta VCN y su subred privada, Private Subnet-datascience-vcn al crear una sesión de bloc de notas.

  5. Seleccione Ver red virtual en la nube para revisar la VCN y las subredes.
Nota

Para obtener acceso de salida a la red pública de Internet, recomendamos que utilice una subred privada con una ruta a un gateway de NAT. Un gateway de NAT proporciona a las instancias de una subred privada acceso a Internet. La VCN que cree en este paso crea una subred privada con acceso de salida a Internet a través del gateway de NAT de la VCN.

4. Creación de políticas

Antes de que los usuarios inicien sus sesiones de Notebook, debe configurar las políticas de Data Science.

  1. Abra el menú de navegación y seleccione Identidad y seguridad. En Identidad, haga clic en Políticas.
  2. Seleccione Crear política.
  3. Introduzca data-science-policy para el nombre. .
  4. Introduzca Política para los usuarios y el servicio de ciencia como la descripción.
  5. Seleccione el compartimento data-science-work.
  6. SeleccioneMostrar editor manual.
  7. Introduzca las cinco sentencias de política siguientes en el campo Creador de política:
    allow service datascience to use virtual-network-family in compartment data-science-work
    allow group data-scientists to manage data-science-family in compartment data-science-work
    allow group data-scientists to use virtual-network-family in compartment data-science-work 
    allow group data-scientists to manage buckets in compartment data-science-work 
    allow group data-scientists to manage objects in compartment data-science-work 
  8. Seleccione Crear para crear la política.

Explicación de las políticas:

  • Para permitir al servicio de ciencia de datos asociar su VCN a su sesión de Notebook y enrutar el tráfico de salida desde el entorno de Notebook, agregue:

    allow service datascience to use virtual-network-family in compartment data-science-work
  • Para permitir al grupo data-scientists realizar operaciones en todos los recursos de Data Science del compartimento data-science-work (proyectos, sesiones de Notebook, modelos, despliegues de modelos, solicitudes de trabajo, trabajos y ejecuciones de trabajos), agregue:

    allow group data-scientists to manage data-science-family in compartment data-science-work
  • Para permitir a esos científicos de datos utilizar la VCN que ha creado y asociarla a su sesión de Notebook, agregue:

    allow group data-scientists to use virtual-network-family in compartment data-science-work 
  • Para permitir a esos científicos de datos crear y gestionar cubos, como la adición de artefactos y entornos conda a cubos, agregue:

    allow group data-scientists to manage buckets in compartment data-science-work
    allow group data-scientists to manage objects in compartment data-science-work 
Consejo

En lugar de especificar qué recursos gestionar, como cubos, objetos o familia de redes virtuales, para permitir a los científicos de datos derechos administrativos en su compartimento, en el que pueden gestionar todos los recursos de los servicios de OCI, sustituya las cinco políticas anteriores por las dos políticas siguientes:
allow group data-scientists to manage all-resources in compartment data-science-work
allow service datascience to use virtual-network-family in compartment data-science-work 

5. Creación de un grupo dinámico con políticas

Cree un grupo dinámico para los recursos de Data Science y permita a este grupo dinámico acceder a otros recursos de OCI, como Object Storage y Logging.

Para otorgar permiso a los recursos de OCI a fin de acceder a otros recursos de OCI, primero debe agregar los recursos a un grupo dinámico, en lugar de a un grupo de usuarios. A continuación, debe escribir políticas para permitir que el grupo dinámico acceda a los recursos especificados. En este momento, el grupo dinámico tiene tres recursos de Data Science: sesiones de libro de notas, despliegues de modelos y ejecuciones de trabajos.

  1. Abra el menú de navegación y seleccione Identidad y seguridad. En Identidad, haga clic en Servicios.
  2. Seleccione el compartimento data-science-work.
  3. Para el atributo OCID, haga clic en Copiar para guardar todo OCID en el bloc de notas.
  4. En la pista que muestra la página actual, haga clic en Compartimentos para volver a la lista de compartimentos.
  5. Siga los pasos de Creación de un grupo dinámico para crear un grupo dinámico.
  6. Introduzca lo siguiente:
    • Name: grupo-dinámico-ciencia-datos
    • Descripción: grupo dinámico de Data Science.
  7. En la sección Reglas de coincidencia, seleccione Coincidir con cualquier regla definida a continuación.
  8. Introduzca las tres reglas de coincidencia siguientes. Sustituya <compartment-ocid> por el OCID del compartimento que ha copiado.
    Regla 1:
    ALL {resource.type='datasciencenotebooksession', resource.compartment.id='<compartment-ocid>'}

    La regla de coincidencia anterior significa que todas las sesiones de libro de notas que se crean en el compartimento son miembros de data-science-dynamic-group.

    Haga clic en Regla adicional y agregue la siguiente regla:

    Regla 2:

    ALL {resource.type='datasciencemodeldeployment', resource.compartment.id='<compartment-ocid>'}

    La regla de coincidencia anterior significa que todos los despliegues de modelo que se crean en el compartimento son miembros de data-science-dynamic-group.

    Haga clic en Regla adicional y agregue la siguiente regla:

    Regla 3:

    ALL {resource.type='datasciencejobrun', resource.compartment.id='<compartment-ocid>'}

    La regla de coincidencia anterior significa que todas las ejecuciones de trabajos que se crean en el compartimento son miembros de data-science-dynamic-group.

  9. Haga clic en Crear.

    A continuación, debe escribir políticas para permitir que los recursos de este grupo dinámico accedan a otros servicios de OCI.

  10. En la pista que muestra la página actual, haga clic en Identidad.
  11. Seleccione Políticas.
  12. Seleccione Crear política.
  13. Introduzca lo siguiente:
    • Nombre: data-science-dynamic-group-policy.
    • Descripción: política para el grupo dinámico Data Science.
  14. En lugar del compartimento data-science-work, seleccione el compartimento más alto, que es su arrendamiento.
    Importante

    La política no se puede crear si no utiliza el arrendamiento.
  15. SeleccioneMostrar editor manual.
  16. Introduzca las siguientes sentencias de política en el campo Creador de política:
    allow dynamic-group data-science-dynamic-group to manage data-science-family in compartment data-science-work
    allow dynamic-group data-science-dynamic-group to manage dataflow-family in compartment data-science-work
    allow dynamic-group data-science-dynamic-group to read compartments in tenancy
    allow dynamic-group data-science-dynamic-group to read users in tenancy
    allow dynamic-group data-science-dynamic-group to use log-content in compartment data-science-work
    allow dynamic-group data-science-dynamic-group to use log-groups in compartment data-science-work
    allow dynamic-group data-science-dynamic-group to manage object-family in compartment data-science-work
  17. Seleccione Crear para crear la política.

Puede utilizar este grupo dinámico para proporcionar a las sesiones de bloc de notas y los despliegues de modelos que estén en el compartimento data-science-work acceso a otros recursos de OCI del arrendamiento.

Explicación de las políticas:

  • Para permitir que las sesiones de Notebook realicen operaciones de CRUD en entradas del catálogo de modelos, proyectos y recursos de sesión de Notebook, agregue:

    allow dynamic-group data-science-dynamic-group to manage data-science-family in compartment data-science-work
    
  • Para permitir que las sesiones del Notebook realicen operaciones de CRUD en aplicaciones y ejecuciones de flujos de datos, agregue:

    allow dynamic-group data-science-dynamic-group to manage dataflow-family in compartment data-science-work
  • Para permitir que las sesiones del Notebook muestren y lean compartimentos y nombres de usuario que están en el arrendamiento, agregue:

    allow dynamic-group data-science-dynamic-group to read compartments in tenancy
    allow dynamic-group data-science-dynamic-group to read users in tenancy
  • Para permitir que los despliegues de modelos emitan logs al servicio Logging, agregue:

    allow dynamic-group data-science-dynamic-group to use log-content in compartment data-science-work
  • Para permitir que las ejecuciones de trabajos creen logs y registren detalles de ejecución de trabajos en el servicio Logging, agregue:

    allow dynamic-group data-science-dynamic-group to use log-groups in compartment data-science-work
  • Para permitir que las sesiones de bloc y los despliegues de modelos lean y escriban archivos en cubos de almacenamiento de objetos, en el compartimento data-science-work, agregue:

    allow dynamic-group data-science-dynamic-group to manage object-family in compartment data-science-work
Consejo

  • La política anterior permite a los despliegues de modelos acceder a cualquier cubo del compartimento data-science-work.
  • Para otorgar a los despliegues de modelos acceso de lectura a cubos específicos fuera del compartimento data-science-work, especifique los nombres de cubos y sus compartimentos en la política.
  • Ejemplo: para permitir que los despliegues de modelos accedan a los entornos conda publicados del cubo published-conda-env y a los artefactos del modelo del cubo model-artifacts, agregue:
    allow dynamic-group data-science-dynamic-group to read objects in compartment <another-compartment> where ANY {target.bucket.name='published-conda-envs', target.bucket.name='model-artifacts'}
  • Si las sentencias de política mencionan el arrendamiento o incluyen compartimentos fuera del compartimento data-science-work, en el cuadro de diálogo Crear política, para la opción Compartimento, seleccione <your-tenancy> (root). De esta forma, además del compartimento, la política puede incluir reglas para otros compartimentos en el arrendamiento.

6. Creación de una sesión de bloc de notas

Por último, debe crear una sesión de bloc de notas y probar su acceso a la red pública de Internet.

  1. Abra el menú de navegación y seleccione Analytics & AI. En Aprendizaje automático, seleccione Data Science.
  2. Seleccione Crear proyecto.
  3. Seleccione el compartimento data-science-work.
  4. (Opcional) Introduzca Initial Project en Nombre.
  5. (Opcional) Introduzca mi primer proyecto para la descripción.
  6. Seleccione Crear.
  7. Seleccione Create Notebook session.
  8. En Compartimento, seleccione data-science-work.
  9. (Opcional) Introduzca my-first-notebook-session en Nombre.
  10. En Unidad de computación, haga clic en Seleccionar.
  11. Seleccione las siguientes opciones:
    • Tipo de instancia: Máquina Virtual
    • Serie de unidades: Intel
    • Nombre de unidad: VM.Standard3. Flexible
  12. Para VM.Standard3. Flexibilizar, mantenga las asignaciones por defecto:
    • Número de OCPU: 1
    • Cantidad de memoria (GB): 16
  13. Seleccione Seleccionar unidad.
  14. En Tamaño de almacenamiento en bloque, introduzca 100 GB para asociar a la máquina virtual.
  15. Seleccione Red personalizada y seleccione la VCN datascience-vcn y la subred Subred privada-datascience-vcn para enrutar el tráfico de salida desde la sesión de Notebook.
    En lugar de redes personalizadas, puede seleccionar la opción Red por defecto que crea la red para usted. Con la red por defecto, puede omitir el Paso 3. Creación de una VCN y una subred de este tutorial. En este tutorial se muestran las redes personalizadas para los usuarios con configuraciones personalizadas, para que puedan ver los pasos.
  16. SeleccioneVer página de detalles al hacer clic en Crear.
  17. Seleccione Crear para crear su primera sesión de Notebook.

    La creación de la sesión de bloc de notas tarda unos minutos. Cuando el estado de la sesión de bloc de notas pasa a Activo, puede abrir la sesión de bloc de notas.

  18. Seleccione Abrir.
  19. Introduzca sus credenciales de Oracle Cloud Infrastructure para acceder a la interfaz de usuario de JupyterLab.
  20. Si no tiene un separador denominado Launcher, seleccione File y, a continuación, New Launcher.
  21. En Launcher, en Other (Otro), seleccione el icono Terminal (Terminal) para iniciar una nueva sesión de terminal.
  22. Para realizar una prueba simple, compruebe que puede acceder a la red pública de Internet desde la sesión de bloc de notas ejecutando este comando:

    Debería ver una respuesta similar a la siguiente:

    (base) bash-4.2$ wget --spider https://www.oracle.com
    Spider mode enabled. Check if remote file exists.
    --<date>--  https://www.oracle.com/
    Resolving www.oracle.com (www.oracle.com)... 
    Connecting to www.oracle.com (www.oracle.com)... connected.
    HTTP request sent, awaiting response... 200 OK
    Length: unspecified [text/html]
    Remote file exists and could contain further links,
    but recursion is disabled -- not retrieving.

    El mensaje Solicitud HTTP enviada, esperando respuesta... 200 OK indica que la prueba se ha realizado correctamente y que tiene acceso a la red pública de Internet en su sesión de bloc de notas.