Pilotes de GPU non inclus dans les images de plate-forme Oracle Linux

Les images de plate-forme Oracle Linux 8 ou Oracle Linux 9 fournies avec Compute Cloud@Customer n'incluent pas de pilotes GPU. Si vous créez une instance de GPU, vous devez installer manuellement les pilotes de GPU.

Détails

Si une installation Compute Cloud@Customer inclut des noeuds de calcul avec des GPU, vous pouvez y accéder en sélectionnant une forme dédiée. Les formes GPU peuvent être sélectionnées pour des instances de calcul basées sur une image de plate-forme Oracle Linux 8 ou Oracle Linux 9. Les versions d'image actuelles n'incluent pas les pilotes de GPU. Le système d'exploitation de l'instance détecte les GPU alloués, mais pour les utiliser, vous avez besoin de la boîte à outils CUDA du site développeur NVIDIA pour installer les pilotes requis.

Remarque

Le téléchargement important et l'installation du référentiel local nécessitent une grande quantité d'espace disque. Le volume d'initialisation par défaut de 50 Go est insuffisant sur Oracle Linux 9 et n'est suffisant que sur Oracle Linux 8. Nous vous recommandons vivement d'augmenter la taille du volume d'initialisation à au moins 60 Go et d'étendre le système de fichiers en conséquence.

Contournement

Une fois l'instance créée, connectez-vous à l'instance et installez le kit d'outils CUDA. Suivez les instructions de votre version d'Oracle Linux.

Installation de pilotes GPU dans une instance Oracle Linux 9
  1. A partir de la ligne de commande de l'instance, téléchargez et installez le RPM de la boîte à outils CUDA pour votre système d'exploitation.

    $ wget https://developer.download.nvidia.com/compute/cuda/12.8.0/local_installers/cuda-repo-rhel9-12-8-local-12.8.0_570.86.10-1.x86_64.rpm
    $ sudo rpm -i cuda-repo-rhel9-12-8-local-12.8.0_570.86.10-1.x86_64.rpm
    $ sudo dnf clean all
    $ sudo dnf install cuda-toolkit-12-8
  2. Activez le référentiel yum Oracle Linux 9 EPEL. Installez le package dkms.

    $ sudo yum-config-manager --enable ol9_developer_EPEL
    $ sudo dnf install dkms
  3. Installez les pilotes GPU.

    $ sudo dnf install cuda-12-8
  4. Vérifiez l'installation à l'aide de l'interface de gestion système NVIDIA.

    $ nvidia-smi
    +-----------------------------------------------------------------------------------------+
    | NVIDIA-SMI 570.86.10              Driver Version: 570.86.10      CUDA Version: 12.8     |
    |-----------------------------------------+------------------------+----------------------+
    | GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
    | Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
    |                                         |                        |               MIG M. |
    |=========================================+========================+======================|
    |   0  NVIDIA L40S                    Off |   00000000:00:05.0 Off |                    0 |
    | N/A   26C    P8             23W /  350W |       1MiB /  46068MiB |      0%      Default |
    |                                         |                        |                  N/A |
    +-----------------------------------------+------------------------+----------------------+
    
    +-----------------------------------------------------------------------------------------+
    | Processes:                                                                              |
    |  GPU   GI   CI              PID   Type   Process name                        GPU Memory |
    |        ID   ID                                                               Usage      |
    |=========================================================================================|
    |  No running processes found                                                             |
    +-----------------------------------------------------------------------------------------+
Installation de pilotes GPU dans une instance Oracle Linux 8
  1. A partir de la ligne de commande de l'instance, téléchargez et installez le RPM de la boîte à outils CUDA pour votre système d'exploitation.

    $ wget https://developer.download.nvidia.com/compute/cuda/12.8.0/local_installers/cuda-repo-rhel8-12-8-local-12.8.0_570.86.10-1.x86_64.rpm
    $ sudo rpm -i cuda-repo-rhel8-12-8-local-12.8.0_570.86.10-1.x86_64.rpm
    $ sudo dnf clean all
    $ sudo dnf install cuda-toolkit-12-8
  2. Activez le référentiel yum Oracle Linux 8 EPEL. Installez le package dkms.

    $ sudo yum-config-manager --enable ol8_developer_EPEL
    $ sudo dnf install dkms
  3. Installez les pilotes GPU.

    $ sudo dnf install cuda-12-8
  4. Installez le module de noyau NVIDIA.

    $ sudo scl enable gcc-toolset-13 bash
    # dkms install nvidia-open -v 570.86.10

    Si cette erreur make apparaît alors que le module de noyau est construit, vous pouvez l'ignorer en toute sécurité.

    Cleaning build area...(bad exit status: 2)
    Failed command:
    make -C /lib/modules/5.15.0-206.153.7.el8uek.x86_64/build M=/var/lib/dkms/nvidia-open/570.86.10/build clean
  5. Vérifiez l'installation à l'aide de l'interface de gestion système NVIDIA.

    # nvidia-smi
    +-----------------------------------------------------------------------------------------+
    | NVIDIA-SMI 570.86.10              Driver Version: 570.86.10      CUDA Version: 12.8     |
    |-----------------------------------------+------------------------+----------------------+
    | GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
    | Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
    |                                         |                        |               MIG M. |
    |=========================================+========================+======================|
    |   0  NVIDIA L40S                    Off |   00000000:00:05.0 Off |                    0 |
    | N/A   26C    P8             23W /  350W |       1MiB /  46068MiB |      0%      Default |
    |                                         |                        |                  N/A |
    +-----------------------------------------+------------------------+----------------------+
    
    +-----------------------------------------------------------------------------------------+
    | Processes:                                                                              |
    |  GPU   GI   CI              PID   Type   Process name                        GPU Memory |
    |        ID   ID                                                               Usage      |
    |=========================================================================================|
    |  No running processes found                                                             |
    +-----------------------------------------------------------------------------------------+