SNMP

よみ:えすえぬえむぴー

ネットワーク機器やUPSの状態監視・制御に用いられる標準プロトコル。電源イベントとサーバログを連携させることで、原因解析や自動停止制御が行いやすくなる。

SNMPで「電源の見える化」を行う

SNMPはネットワーク機器だけでなく、 UPS・PDU・ DC-UPSなどの電源機器でも一般的に使われています。 電圧・電流・バッテリ残量・温度・アラーム状態などを監視システムに集約し、 異常の兆候を早期に捉えることで計画停止での対処が可能になります。

GPUクラスタやHPC環境では、SNMPを通じて 「どのラックのどの系統に負荷が集中しているか」 「どの設備のバッテリが劣化しているか」を把握し、 電源BCPの観点でボトルネックを潰していきます。

関連する考え方・用語

この用語が出てくる記事