GPU-Treiber, die nicht in Oracle Linux-Plattformimages enthalten sind

Die mit Compute Cloud@Customer bereitgestellten Oracle Linux 8- oder Oracle Linux 9-Plattformimages enthalten keine GPU-Treiber. Wenn Sie eine GPU-Instanz erstellen, müssen Sie die GPU-Treiber manuell installieren.

Details

Wenn eine Compute Cloud@Customer-Installation Compute Nodes mit GPUs enthält, können Sie auf diese zugreifen, indem Sie eine dedizierte Ausprägung auswählen. Die GPU-Ausprägungen können für Compute-Instanzen basierend auf einem Oracle Linux 8- oder Oracle Linux 9-Plattformimage ausgewählt werden. Die aktuellen Imageversionen enthalten keine GPU-Treiber. Das Instanz-BS erkennt die zugewiesenen GPUs. Um diese zu verwenden, benötigen Sie jedoch das CUDA-Toolkit von der NVIDIA-Entwicklersite, um die erforderlichen Treiber zu installieren.

Hinweis

Die Installation des großen Downloads und des lokalen Repositorys erfordert viel Festplattenspeicher. Das standardmäßige 50-GB-Boot-Volume ist bei Oracle Linux 9 nicht ausreichend und bei Oracle Linux 8 nur ausreichend groß. Es wird dringend empfohlen, die Boot-Volume-Größe auf mindestens 60 GB zu erhöhen und das Dateisystem entsprechend zu erweitern.

Workaround

Melden Sie sich nach dem Erstellen der Instanz bei der Instanz an, und installieren Sie das CUDA Toolkit. Befolgen Sie die Anweisungen für Ihre Oracle Linux-Version.

GPU-Treiber in einer Oracle Linux 9-Instanz installieren
  1. Laden Sie in der Befehlszeile der Instanz die CUDA Toolkit rpm für Ihr BS herunter, und installieren Sie sie.

    $ wget https://developer.download.nvidia.com/compute/cuda/12.8.0/local_installers/cuda-repo-rhel9-12-8-local-12.8.0_570.86.10-1.x86_64.rpm
    $ sudo rpm -i cuda-repo-rhel9-12-8-local-12.8.0_570.86.10-1.x86_64.rpm
    $ sudo dnf clean all
    $ sudo dnf install cuda-toolkit-12-8
  2. Aktivieren Sie das yum-Repository für Oracle Linux 9 EPEL. Installieren Sie das Package dkms.

    $ sudo yum-config-manager --enable ol9_developer_EPEL
    $ sudo dnf install dkms
  3. Installieren Sie GPU-Treiber.

    $ sudo dnf install cuda-12-8
  4. Prüfen Sie die Installation mit der NVIDIA System Management Interface.

    $ nvidia-smi
    +-----------------------------------------------------------------------------------------+
    | NVIDIA-SMI 570.86.10              Driver Version: 570.86.10      CUDA Version: 12.8     |
    |-----------------------------------------+------------------------+----------------------+
    | GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
    | Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
    |                                         |                        |               MIG M. |
    |=========================================+========================+======================|
    |   0  NVIDIA L40S                    Off |   00000000:00:05.0 Off |                    0 |
    | N/A   26C    P8             23W /  350W |       1MiB /  46068MiB |      0%      Default |
    |                                         |                        |                  N/A |
    +-----------------------------------------+------------------------+----------------------+
    
    +-----------------------------------------------------------------------------------------+
    | Processes:                                                                              |
    |  GPU   GI   CI              PID   Type   Process name                        GPU Memory |
    |        ID   ID                                                               Usage      |
    |=========================================================================================|
    |  No running processes found                                                             |
    +-----------------------------------------------------------------------------------------+
GPU-Treiber in einer Oracle Linux 8-Instanz installieren
  1. Laden Sie in der Befehlszeile der Instanz die CUDA Toolkit rpm für Ihr BS herunter, und installieren Sie sie.

    $ wget https://developer.download.nvidia.com/compute/cuda/12.8.0/local_installers/cuda-repo-rhel8-12-8-local-12.8.0_570.86.10-1.x86_64.rpm
    $ sudo rpm -i cuda-repo-rhel8-12-8-local-12.8.0_570.86.10-1.x86_64.rpm
    $ sudo dnf clean all
    $ sudo dnf install cuda-toolkit-12-8
  2. Aktivieren Sie das yum-Repository für Oracle Linux 8 EPEL. Installieren Sie das Package dkms.

    $ sudo yum-config-manager --enable ol8_developer_EPEL
    $ sudo dnf install dkms
  3. Installieren Sie GPU-Treiber.

    $ sudo dnf install cuda-12-8
  4. Installieren Sie das NVIDIA Kernel-Modul.

    $ sudo scl enable gcc-toolset-13 bash
    # dkms install nvidia-open -v 570.86.10

    Wenn dieser make-Fehler angezeigt wird, während das Kernelmodul erstellt wird, können Sie ihn problemlos ignorieren.

    Cleaning build area...(bad exit status: 2)
    Failed command:
    make -C /lib/modules/5.15.0-206.153.7.el8uek.x86_64/build M=/var/lib/dkms/nvidia-open/570.86.10/build clean
  5. Prüfen Sie die Installation mit der NVIDIA System Management Interface.

    # nvidia-smi
    +-----------------------------------------------------------------------------------------+
    | NVIDIA-SMI 570.86.10              Driver Version: 570.86.10      CUDA Version: 12.8     |
    |-----------------------------------------+------------------------+----------------------+
    | GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
    | Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
    |                                         |                        |               MIG M. |
    |=========================================+========================+======================|
    |   0  NVIDIA L40S                    Off |   00000000:00:05.0 Off |                    0 |
    | N/A   26C    P8             23W /  350W |       1MiB /  46068MiB |      0%      Default |
    |                                         |                        |                  N/A |
    +-----------------------------------------+------------------------+----------------------+
    
    +-----------------------------------------------------------------------------------------+
    | Processes:                                                                              |
    |  GPU   GI   CI              PID   Type   Process name                        GPU Memory |
    |        ID   ID                                                               Usage      |
    |=========================================================================================|
    |  No running processes found                                                             |
    +-----------------------------------------------------------------------------------------+