Pilotes de GPU non inclus dans les images de plate-forme Oracle Linux
Les images de plate-forme Oracle Linux 8 ou Oracle Linux 9 fournies avec Compute Cloud@Customer n'incluent pas de pilotes GPU. Si vous créez une instance de GPU, vous devez installer manuellement les pilotes de GPU.
- Détails
-
Si une installation Compute Cloud@Customer inclut des noeuds de calcul avec des GPU, vous pouvez y accéder en sélectionnant une forme dédiée. Les formes GPU peuvent être sélectionnées pour des instances de calcul basées sur une image de plate-forme Oracle Linux 8 ou Oracle Linux 9. Les versions d'image actuelles n'incluent pas les pilotes de GPU. Le système d'exploitation de l'instance détecte les GPU alloués, mais pour les utiliser, vous avez besoin de la boîte à outils CUDA du site développeur NVIDIA pour installer les pilotes requis.
Remarque
Le téléchargement important et l'installation du référentiel local nécessitent une grande quantité d'espace disque. Le volume d'initialisation par défaut de 50 Go est insuffisant sur Oracle Linux 9 et n'est suffisant que sur Oracle Linux 8. Nous vous recommandons vivement d'augmenter la taille du volume d'initialisation à au moins 60 Go et d'étendre le système de fichiers en conséquence.
- Contournement
-
Une fois l'instance créée, connectez-vous à l'instance et installez le kit d'outils CUDA. Suivez les instructions de votre version d'Oracle Linux.
Installation de pilotes GPU dans une instance Oracle Linux 9-
A partir de la ligne de commande de l'instance, téléchargez et installez le RPM de la boîte à outils CUDA pour votre système d'exploitation.
$ wget https://developer.download.nvidia.com/compute/cuda/12.8.0/local_installers/cuda-repo-rhel9-12-8-local-12.8.0_570.86.10-1.x86_64.rpm $ sudo rpm -i cuda-repo-rhel9-12-8-local-12.8.0_570.86.10-1.x86_64.rpm $ sudo dnf clean all $ sudo dnf install cuda-toolkit-12-8
-
Activez le référentiel yum Oracle Linux 9 EPEL. Installez le package
dkms
.$ sudo yum-config-manager --enable ol9_developer_EPEL $ sudo dnf install dkms
-
Installez les pilotes GPU.
$ sudo dnf install cuda-12-8
-
Vérifiez l'installation à l'aide de l'interface de gestion système NVIDIA.
$ nvidia-smi +-----------------------------------------------------------------------------------------+ | NVIDIA-SMI 570.86.10 Driver Version: 570.86.10 CUDA Version: 12.8 | |-----------------------------------------+------------------------+----------------------+ | GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |=========================================+========================+======================| | 0 NVIDIA L40S Off | 00000000:00:05.0 Off | 0 | | N/A 26C P8 23W / 350W | 1MiB / 46068MiB | 0% Default | | | | N/A | +-----------------------------------------+------------------------+----------------------+ +-----------------------------------------------------------------------------------------+ | Processes: | | GPU GI CI PID Type Process name GPU Memory | | ID ID Usage | |=========================================================================================| | No running processes found | +-----------------------------------------------------------------------------------------+
Installation de pilotes GPU dans une instance Oracle Linux 8-
A partir de la ligne de commande de l'instance, téléchargez et installez le RPM de la boîte à outils CUDA pour votre système d'exploitation.
$ wget https://developer.download.nvidia.com/compute/cuda/12.8.0/local_installers/cuda-repo-rhel8-12-8-local-12.8.0_570.86.10-1.x86_64.rpm $ sudo rpm -i cuda-repo-rhel8-12-8-local-12.8.0_570.86.10-1.x86_64.rpm $ sudo dnf clean all $ sudo dnf install cuda-toolkit-12-8
-
Activez le référentiel yum Oracle Linux 8 EPEL. Installez le package
dkms
.$ sudo yum-config-manager --enable ol8_developer_EPEL $ sudo dnf install dkms
-
Installez les pilotes GPU.
$ sudo dnf install cuda-12-8
-
Installez le module de noyau NVIDIA.
$ sudo scl enable gcc-toolset-13 bash # dkms install nvidia-open -v 570.86.10
Si cette erreur
make
apparaît alors que le module de noyau est construit, vous pouvez l'ignorer en toute sécurité.Cleaning build area...(bad exit status: 2) Failed command: make -C /lib/modules/5.15.0-206.153.7.el8uek.x86_64/build M=/var/lib/dkms/nvidia-open/570.86.10/build clean
-
Vérifiez l'installation à l'aide de l'interface de gestion système NVIDIA.
# nvidia-smi +-----------------------------------------------------------------------------------------+ | NVIDIA-SMI 570.86.10 Driver Version: 570.86.10 CUDA Version: 12.8 | |-----------------------------------------+------------------------+----------------------+ | GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |=========================================+========================+======================| | 0 NVIDIA L40S Off | 00000000:00:05.0 Off | 0 | | N/A 26C P8 23W / 350W | 1MiB / 46068MiB | 0% Default | | | | N/A | +-----------------------------------------+------------------------+----------------------+ +-----------------------------------------------------------------------------------------+ | Processes: | | GPU GI CI PID Type Process name GPU Memory | | ID ID Usage | |=========================================================================================| | No running processes found | +-----------------------------------------------------------------------------------------+
-