Configuración manual de un arrendamiento de Data Science
En este tutorial, configurará su arrendamiento para Data Science y lo probará mediante la creación de una sesión de bloc de notas.
Este tutorial está dirigido a los usuarios administradores porque tienen los permisos de acceso necesarios.
En este tutorial va a hacer lo siguiente:
1. Creación de un grupo de usuarios de científicos de datos.
2. Creación de un compartimento para su trabajo.
3. (Opcional) Creación de una VCN y una subred.
Antes de empezar
Para realizar este tutorial, debe tener lo siguiente:
-
Una cuenta de Oracle Cloud Infrastructure (OCI) de pago o una nueva cuenta con promociones de Oracle Cloud. Consulte Solicitar y gestionar promociones de Oracle Cloud gratis.
- Privilegios de administrador para la cuenta de OCI.
-
Al menos un usuario de su arrendamiento que desee acceder al servicio de ciencia de datos. Este usuario debe crearse en IAM.
1. Creación de un grupo de usuarios de científicos de datos
Cree un grupo de usuarios para que los científicos de datos trabajen en él.
2. Creación de un compartimento para su trabajo
Crear un compartimento para los recursos de ciencia de datos.
- Siga los pasos de Creación de un compartimento para crear un compartimento.
- Introduzca un nombre para el nuevo compartimento data-science-work y, a continuación, una descripción.
- Confirme que el compartimento aparece en la lista de compartimentos.
3 (Opcional) Creación de una VCN y una subred
Este paso es opcional. Al crear una sesión de bloc de notas en el Paso 6. Creación de una sesión de bloc de notas, puede elegir crear una red por defecto con la configuración adecuada para las sesiones de bloc de notas.
Puede omitir la creación de una red y la configuración de subredes y gateways si selecciona la red por defecto al crear un bloc de notas. Si la red por defecto está configurada en un bloc de notas, no puede cambiarla al reactivar el bloc de notas.
En esta sección se muestran los usuarios que necesitan acceso a sus redes virtuales en la nube, cómo crear una VCN y, posteriormente, cómo seleccionar la subred recomendada para las sesiones de bloc de notas. Por ejemplo, si está realizando el tutorial Programación de ejecuciones de trabajos de Data Science, cree esta red y utilícela tanto para la sesión de bloc de notas en Data Science como para el espacio de trabajo en el servicio Data Integration.
Para obtener acceso de salida a la red pública de Internet, recomendamos que utilice una subred privada con una ruta a un gateway de NAT. Un gateway de NAT proporciona a las instancias de una subred privada acceso a Internet. La VCN que cree en este paso crea una subred privada con acceso de salida a Internet a través del gateway de NAT de la VCN.
4. Creación de políticas
Antes de que los usuarios inicien sus sesiones de Notebook, debe configurar las políticas de Data Science.
Explicación de las políticas:
-
Para permitir al servicio de ciencia de datos asociar su VCN a su sesión de Notebook y enrutar el tráfico de salida desde el entorno de Notebook, agregue:
allow service datascience to use virtual-network-family in compartment data-science-work
-
Para permitir al grupo
data-scientists
realizar operaciones en todos los recursos de Data Science del compartimentodata-science-work
(proyectos, sesiones de Notebook, modelos, despliegues de modelos, solicitudes de trabajo, trabajos y ejecuciones de trabajos), agregue:allow group data-scientists to manage data-science-family in compartment data-science-work
-
Para permitir a esos científicos de datos utilizar la VCN que ha creado y asociarla a su sesión de Notebook, agregue:
allow group data-scientists to use virtual-network-family in compartment data-science-work
-
Para permitir a esos científicos de datos crear y gestionar cubos, como la adición de artefactos y entornos conda a cubos, agregue:
allow group data-scientists to manage buckets in compartment data-science-work allow group data-scientists to manage objects in compartment data-science-work
En lugar de especificar qué recursos gestionar, como cubos, objetos o familia de redes virtuales, para permitir a los científicos de datos derechos administrativos en su compartimento, en el que pueden gestionar todos los recursos de los servicios de OCI, sustituya las cinco políticas anteriores por las dos políticas siguientes:
allow group data-scientists to manage all-resources in compartment data-science-work
allow service datascience to use virtual-network-family in compartment data-science-work
5. Creación de un grupo dinámico con políticas
Cree un grupo dinámico para los recursos de Data Science y permita a este grupo dinámico acceder a otros recursos de OCI, como Object Storage y Logging.
Para otorgar permiso a los recursos de OCI a fin de acceder a otros recursos de OCI, primero debe agregar los recursos a un grupo dinámico, en lugar de a un grupo de usuarios. A continuación, debe escribir políticas para permitir que el grupo dinámico acceda a los recursos especificados. En este momento, el grupo dinámico tiene tres recursos de Data Science: sesiones de libro de notas, despliegues de modelos y ejecuciones de trabajos.
Puede utilizar este grupo dinámico para proporcionar a las sesiones de bloc de notas y los despliegues de modelos que estén en el compartimento data-science-work
acceso a otros recursos de OCI del arrendamiento.
Explicación de las políticas:
-
Para permitir que las sesiones de Notebook realicen operaciones de CRUD en entradas del catálogo de modelos, proyectos y recursos de sesión de Notebook, agregue:
allow dynamic-group data-science-dynamic-group to manage data-science-family in compartment data-science-work
-
Para permitir que las sesiones del Notebook realicen operaciones de CRUD en aplicaciones y ejecuciones de flujos de datos, agregue:
allow dynamic-group data-science-dynamic-group to manage dataflow-family in compartment data-science-work
-
Para permitir que las sesiones del Notebook muestren y lean compartimentos y nombres de usuario que están en el arrendamiento, agregue:
allow dynamic-group data-science-dynamic-group to read compartments in tenancy allow dynamic-group data-science-dynamic-group to read users in tenancy
-
Para permitir que los despliegues de modelos emitan logs al servicio Logging, agregue:
allow dynamic-group data-science-dynamic-group to use log-content in compartment data-science-work
-
Para permitir que las ejecuciones de trabajos creen logs y registren detalles de ejecución de trabajos en el servicio Logging, agregue:
allow dynamic-group data-science-dynamic-group to use log-groups in compartment data-science-work
-
Para permitir que las sesiones de bloc y los despliegues de modelos lean y escriban archivos en cubos de almacenamiento de objetos, en el compartimento
data-science-work
, agregue:allow dynamic-group data-science-dynamic-group to manage object-family in compartment data-science-work
- La política anterior permite a los despliegues de modelos acceder a cualquier cubo del compartimento data-science-work.
- Para otorgar a los despliegues de modelos acceso de lectura a cubos específicos fuera del compartimento data-science-work, especifique los nombres de cubos y sus compartimentos en la política.
- Ejemplo: para permitir que los despliegues de modelos accedan a los entornos conda publicados del cubo
published-conda-env
y a los artefactos del modelo del cubomodel-artifacts
, agregue:allow dynamic-group data-science-dynamic-group to read objects in compartment <another-compartment> where ANY {target.bucket.name='published-conda-envs', target.bucket.name='model-artifacts'}
- Si las sentencias de política mencionan el arrendamiento o incluyen compartimentos fuera del compartimento
data-science-work
, en el cuadro de diálogo Crear política, para la opción Compartimento, seleccione <your-tenancy> (root). De esta forma, además del compartimento, la política puede incluir reglas para otros compartimentos en el arrendamiento.
6. Creación de una sesión de bloc de notas
Por último, debe crear una sesión de bloc de notas y probar su acceso a la red pública de Internet.
Siguiente paso
Ha configurado correctamente un arrendamiento de Data Science y creado un proyecto de Data Science que incluye una sesión de bloc de notas. Ahora puede continuar con las siguientes tareas: