ZABBIXでNVIDIA-GPUを監視する際の注意事項

昔取った杵柄

ZABBIXでは、NVIDIA-GPUを監視することが可能なのは会社員時代からよく理解しているんですが、そのプラグインの設定がUbuntu側の仕様に沿ってないらしいので備忘録として掲示します。参考URLは以下の通りです。本記事で記述しているのはそこからの引用になります。

Zabbix 7.2でGPU監視を有効化|7.0からのアップグレードとnvmlエラー対策記録 | sakakinox.net

まず実行すべきは Nvidia by Zabbix agent 2 との連携で必要となるプラグインのインストールです。
以下は、sudo su – を実行した後に行う作業となります。

apt install zabbix-agent2-plugin-nvidia-gpu

本来これがインストールされた時点で zabbix-agent2 を再起動すればよいはずですが、そのままではエラーになってエージェント自体起動できなくなります。

必要となるのは、libnvidia-ml.so.1 というファイルに対して /usr/lib/libnvidia-ml.so からシンボリックリンクを張ることでして、以下のコマンドを実行する必要があります。

ln -s /usr/lib/x86_64-linux-gnu/libnvidia-ml.so.1 /usr/lib/libnvidia-ml.so

ZABBIXはGUIポチポチで簡単ってプロダクトではないので、このあたり意識の持ち方には気をつけねばです(。>д<。)ゞ。

コメント

タイトルとURLをコピーしました