heterodb / pg-strom

PG-Strom - Master development repository
http://heterodb.github.io/pg-strom/
Other
1.27k stars 163 forks source link

[JP] Linux kernelを更新した時にMOFEDの再ビルドが必要な件の記述(Docs Issue ?) #779

Closed ytooyama closed 3 weeks ago

ytooyama commented 4 weeks ago

には

Linux kernelのバージョンアップとMOFEDドライバ

RHEL系列のディストリビューションにおいて、MODEDドライバはDKMS(Dynamic Kernel Module Support)を使用しません。 そのため、Linux kernelをバージョンアップした場合には、上記の手順を再度実行し、新しいLinux kernelに対応したMOFEDドライバを再インストールする必要があります。

後述のCUDA Toolkitのインストールなど、パッケージ更新のタイミングでLinux kernelがアップデートされる事もありますが、その場合でも同様です。

と書かれています。

一方、NVIDIA MLNX OFEDのドキュメントによると...

次のような記述があり、読み方によっては「ビルドをするのではなくてmlnx_add_kernel_support.shを実行することで、新しいバージョンのカーネルサポートを追加できる」とも取れますし、「RHEL/SLESが提供する標準カーネルのアップデートを適用した場合、mlnx_add_kernel_support.shを実行する必要はない」とも取れるので、どう対応するのが適切なのか分かりにくいです。

ドキュメントのこの部分をもう少し説明が必要と思われます。

If your kernel version does not match with any of the offered pre-built RPMs, you can add your kernel version by using the “mlnx_add_kernel_support.sh” script located inside the MLNX_OFED package.

カーネルバージョンが提供された事前構築されたRPMと一致しない場合は、MLNX_OFEDパッケージ内にある「mlnx_add_kernel_support.sh」スクリプトを使用してカーネルバージョンを追加できます。
On Redhat and SLES distributions with errata kernel installed there is no need to use the mlnx_add_kernel_support.sh script. The regular installation can be performed and weak-updatesmechanismwill create symbolic links to the MLNX_OFED kernel modules.

Redhat and SLES distributions with errata kernelがインストールされた環境では、mlnx_add_kernel_support.shスクリプトを使用する必要はありません。定期的なインストールを実行でき、weak-updatesmechanismはMLNX_OFEDカーネルモジュールへのシンボリックリンクを作成します。
The “mlnx_add_kernel_support.sh” script can be executed directly from themlnxofedinstallscript. For further information, please see '--add-kernel-support' option below.

「Mlnx_add_kernel_support.sh」スクリプトは、themlnxofedinstallscriptから直接実行できます。詳細については、以下の「--add-kernel-support」オプションを参照してください。
kaigai commented 4 weeks ago

これ、公式からDLできるパッケージがそのままだと使えないので、アップデートされたカーネル用にインストール媒体を作るという話に見えますね。 ちょっとLinux kernelをアップデートして試してみましょうか。 (UbuntuだとDKMSで自動アップデートなのに比べると、めんどっちい・・・。)

ytooyama commented 4 weeks ago

Kujiraも使えるようになったので、mlnx_add_kernel_support.shとやらの中身を見つつ、実行して挙動を確認してみようと思います。

kaigai commented 4 weeks ago

なんかインストール媒体を作ってくれましたよ。

[kaigai@buri MLNX_OFED_LINUX-23.10-2.1.3.1-rhel9.3-x86_64]$ sudo ./mlnx_add_kernel_support.sh -m . --make-tgz
Note: This program will create MLNX_OFED_LINUX TGZ for rhel9.3 under /tmp directory.
Do you want to continue?[y/N]:y
See log file /tmp/mlnx_iso.123252_logs/mlnx_ofed_iso.123252.log

Checking if all needed packages are installed...
Building MLNX_OFED_LINUX RPMS . Please wait...
Creating metadata-rpms for 5.14.0-427.18.1.el9_4.x86_64 ...
WARNING: If you are going to configure this package as a repository, then please note
WARNING: that it contains unsigned rpms, therefore, you need to disable the gpgcheck
WARNING: by setting 'gpgcheck=0' in the repository conf file.
Created /tmp/MLNX_OFED_LINUX-23.10-2.1.3.1-rhel9.3-x86_64-ext.tgz
ytooyama commented 4 weeks ago

手元でも同様でした。アップデートして再起動した後、新しいLinux kernelで起動した時はこれでインストールイメージを作れるので、新しいMOFEDがリリースされるまではこれをつかって再インストールしてねということなんでしょうかね。

ytooyama commented 3 weeks ago

基本的にはカーネルバージョンが変わるたびにMOFEDの再インストールが必要ということで理解しました。 状況が変わってきた場合は再度オープンします。