InfiniBand / AI Fabric 専用 DC-UPS

AIが要求する電源を、 人間の技術で実装した
IB 専用 UPS

GPUクラスタは、数ミリ秒の電圧ドロップでさえ 大規模ジョブを失います。
本機は、InfiniBand スイッチGPUノードのためだけに設計された 0ms 無瞬断 DC-UPS
DC52Vバス・5kWモジュールを N 倍スケールし、 AGMバッテリーにより 5〜30分の安定バックアップを実現します。

  • DC52V 共通バス+3系統 ORing MOSFET による 0ms 切替
  • 5kW モジュール × N台 並列で Pod〜ラック単位までスケール
  • AGM バッテリー採用(非リチウム)で 5〜30分バックアップ & 高信頼
  • 監視モジュール2台冗長構成で SNMP 監視・ログ・制御を二重化

※ 本ページは先行検証用の技術LPです。量産仕様はお打合せにて定義します。

AI-UPS システム構成(概略)

[AC PSU]──┬──▶ DC/DC Conv ─▶ ORing MOSFET ─┐
           │                                   │
[DC Bus]───┴───────────────────────────────────┤──▶ DC52V 共通バス ─▶ IB Switch / GPU Node
                                               │
[AGM Pack #1] ─▶ BMU ─▶ ORing MOSFET ──────────┤
                                               │
[AGM Pack #2] ─▶ BMU ─▶ ORing MOSFET ──────────┘

監視・制御:×2(HA構成)
 - SNMPv2c/v3, Syslog, REST Hook
 - バス電圧・電流・SoC・温度・アラーム一括収集
      

図は概念構成です。実際のインターフェース数・BMU構成・保護デバイスは ご利用の IB スイッチ/ラック設計に合わせて最適化します。

解決策:AI ファブリック専用に設計された DC-UPS アーキテクチャ

既にデジタル防災無線局向けオフグリッド電源や商用運転中のエンジンUPS/船舶用無瞬停電源で培ったアーキテクチャをベースに、 負荷側を InfiniBand/GPU ファブリックに最適化した構成です。

0ms 無瞬断を実現する DC52V 共通バス

  • DC52V 共通バスに AC PSU と複数の AGM Pack を常時接続
  • ・ORing MOSFET により、電源喪失時も 0ms で経路自動切替
  • BMU(Battery Management Unit)が電流バランス・保護を実施
  • ・DC 出力側は IB スイッチ/GPU ノードに合わせた 専用配線&保護を設計

5kW モジュールを N倍でスケール

  • ・1モジュールあたり 5kW クラス(DC52V 約100A)を標準単位に設計
  • ・ラック内で 2〜4台、Pod単位で 8〜20台まで並列接続可能
  • ・NVIDIA IB スイッチ(7kW級)〜 Pod(〜100kW級)まで構成を分割
  • ・将来の省電力化/GPU世代交代にも モジュール数の調整だけで追従

監視ユニット ×2 台による冗長 SNMP / ログ基盤

  • ・既存 SNMP ボードで運用してきた自社 MIB を、RFC1628 ベースの UPS-MIBに整理
  • ・2台で Active/Standby または Dual-Active 構成
  • ・SNMPv2c/v3 による DC バス・バッテリ・BMU・温度・アラームの一括監視
  • ・ローカル SSD に 長期ログを保持し、電源イベントを完全トレース

オフグリッド/自律分散にも展開可能

  • ・既存のエンジンUPS(デュアルフューエル)のアーキテクチャを継承
  • ・将来的に「AI ノードごとの自律電源」へスケールアウト可能
  • ・グリッド喪失時も一定時間クラスタを維持し、優雅なシャットダウンを実現
  • ・マイクログリッド構成や再エネとの組み合わせ PoC にも対応

AI-UPS v1.0 仕様サマリ

下記は v1.0 想定仕様です。実際の案件では、 接続対象の IB スイッチ/GPU ラック構成・バックアップ時間要件に応じて 個別にチューニングします。

モデル名 AI-UPS v1.0(AIUPS-IB-5K ベース構成)
用途 InfiniBand スイッチ/GPU ノード向け DC52V 無瞬断電源(ノード/ラック/Pod 単位)
電気仕様(1 モジュールあたり)
定格出力 5kW @ DC52V(約 96A)
出力電圧レンジ:50〜54V(IB スイッチ仕様に応じて調整)
スケーラビリティ 1〜4 モジュール:ラック/IB スイッチ単位(5〜20kW)
5〜20 モジュール:Pod/ゾーン単位(25〜100kW クラス)
入力系 上位 AC-DC PSU からの DC バス入力を想定(例:200〜240Vac 50/60Hz → DC52V)
※ AC 側仕様はデータセンター側インフラに合わせて設計
無瞬断機構 DC52V 共通バス + ORing MOSFET による 0ms 切替
PSU 系統喪失時も、AGM バッテリー系へ瞬断無しでフェイルオーバー
バッテリー/バックアップ時間(例)
バッテリー種別 AGM バッテリー(密閉型鉛蓄電池)4 直列構成(48〜52V クラス)
実績ベースでの容量・メーカー選定(船舶・エンジン UPS での実績品)
バックアップ時間目安 例:負荷 5kW 時
・5分バックアップ:おおよそ 8〜10Ah クラス(高負荷条件)
・15分バックアップ:おおよそ 20〜25Ah クラス
・30分バックアップ:おおよそ 40〜50Ah クラス
※ 実際は温度・放電レート・寿命設計を加味して個別計算
BMU/保護機能 BMU による電圧監視・電流制限・温度監視・過放電保護
バッテリー系統ごとにヒューズ/ブレーカを配置
監視・制御・インターフェース
コントローラ 2 台(HA 構成)
Active/Standby または Dual-Active 構成に対応
ネットワーク Ethernet 1000BASE-T ×2(コントローラごとに独立)
管理ネットワーク/監視ネットワークへの分離も可能
プロトコル SNMPv2c / v3(RFC1628 ベース UPS-MIB + ベンダ MIB)
Syslog 出力、REST Webhook(オプション)、メール通知(オプション)
監視項目(例) DC バス電圧・電流、各 AGM Pack 電圧・電流・SoC、温度、ORing 状態、アラーム状態、 ログイベント(瞬停検知・系統切替・バッテリテスト結果 など)
メカニカル/環境条件(目安)
実装形態 19インチラックマウント(4U〜6U 目安)または キャビネット実装(案件別設計)
使用温度範囲 0〜40℃(AGM バッテリー寿命を考慮した推奨範囲)
※ データセンター標準温度条件に合わせて評価
その他 冷却方式:強制空冷(ファン冗長構成を想定)
適用規格・認証:安全規格/EMC/船級などは案件ごとに協議

※ 上記はドラフト仕様です。最終仕様は個別仕様書(InfiniBand_UPS_v1_spec_AGM 等)にて定義します。

どこに AI-UPS を入れるべきか?― 代表的な適用ポイント

AI クラスタ全体に一台の巨大UPSをぶら下げるのではなく、 「どこを絶対に落とさないか」 という観点で分割配置することを推奨しています。

🔀

Use Case 1:IB スイッチ/コアファブリック

Q3401-RD のような 400G/800G IB スイッチの コア層 に AI-UPS を直結。 Pod 全体を守る「最後の砦」として、ここだけは 0ms 無瞬断を保証します。

🖥️

Use Case 2:GPU ノード/ラック単位

8GPU ノード×数台が収まるラック単位で 5kW〜20kW 構成を実装。 再起動に時間のかかるノード群をまとめて守りつつ、障害ドメインを限定します。

🌐

Use Case 3:ログ/制御プレーン

ジョブスケジューラ・メタデータDB・監視系など、 「落ちると復旧手順が複雑なサーバ群」に小規模 AI-UPS を配置。 管理プレーンを優先的に保護します。

クラスタ全体への配置イメージ(テキスト図)

[上位 IB Core Switch]  ── AI-UPS (5〜10kW) ── UPS 保護ドメイン A
        │
        ├─ [IB Leaf Switch] ── AI-UPS (5〜20kW) ── UPS 保護ドメイン B(ラック単位)
        │
        └─ [GPU Nodes / Storage] ── ラック内 AI-UPS(任意)

[Control / Logging / Scheduler] ── 小容量 AI-UPS ── UPS 保護ドメイン C

※ 停電時:
  - ドメイン A,B,C は 5〜30分稼働を維持
  - バックアップ時間内にジョブの中断処理・データフラッシュ・優雅なシャットダウンが可能
        

なぜ「リチウム」ではなく AGM なのか? ― AI データセンターにおける安全性と継続性

GPU クラスタ用電源において最も重要なのは、エネルギー密度よりも 「確実に動き続けること」です。
当社の AI-UPS は、既に船舶・エンジン UPS・産業用途で実績のある AGM(Absorbent Glass Mat)バッテリーを採用します。 これは AI データセンターにとって、以下の理由から合理的な選択です。

AGM 採用のメリット

  • ・密閉型・液漏れリスクが極めて小さく、火災リスクが低い
  • ・温度変化や過充電に対してマージンが大きく、設計自由度が高い
  • ・「安全のために止まる」保護設計ではなく、「動き続ける」ことを前提とした構造
  • ・既に当社製品として DC UPSは10年以上の実績あり
  • ・部品期待寿命12年、5〜30分クラスのバックアップ時間であれば、容量・寿命ともに余裕の設計

AI-UPS 用 AGM 容量設計の考え方

  • ・対象負荷(例:IB スイッチ 7kW)の実効消費電力をベースに計算
  • ・5分/15分/30分 など、ジョブ制御ポリシーに合わせたバックアップ時間を選択
  • ・「瞬停対策」と「優雅な停止」の両方を満たす最小容量を提案
  • ・バッテリ更新サイクルやラック内スペースも含めて、TCO ベースでの最適化を行います
比較項目 AGMバッテリー(AI-UPS) リチウムイオン UPS
安全性 発火・熱暴走リスクが低く、構造が単純で状態把握が容易 高エネルギー密度ゆえに熱設計・保護設計が複雑
運用思想 止めずに動かし続けることを前提とした設計が可能 異常時は保護回路が動作し、電源を遮断して停止する設計が中心
バックアップ時間 5〜30分クラスの「優雅な停止」に最適 長時間バックアップに有利だが AI 用途では過剰な場合も多い
実績 船舶・エンジンUPS・産業用途で長期運用実績 データセンター用リチウムUPSとして普及中だが、火災リスクをどう許容するか設計判断が必要

防災無線局・船舶・エンジン UPS から AI クラスタへ。

慧通信技術工業株式会社は、自律・分散・非同期オフグリッド電源として船舶・発電設備・産業機械向けの 無瞬停 DC 電源・エンジン UPS を長年提供してきました。

24時間365日、止めることが許されないシステムを支えてきた経験と、 自社開発の SNMP 監視基盤/MIB 群を組み合わせることで、 AI クラスタに最適化された新しい DC-UPS として再構成しています。

※ 本ページの AI-UPS はコンセプト提案〜PoC フェーズの製品です。 実機仕様・認証・納期などは個別案件ごとに協議の上、定義いたします。

AI-UPS 開発のベースとなる実績

  • ・総務省デジタル防災無線局向けにオフグリッド電源設備を供給
  • ・エンジン UPS(デュアルフューエル)を商船向けに供給
  • ・オフグリッド・自律分散電源システム「パーソナルエナジー」シリーズ
  • ・自社 SNMP ボードと豊富な MIB 実装実績(WHM, PCS, バッテリ, DC計測 等)
  • ・長期連続稼働を前提とした DC 電源/監視システム設計ノウハウ

よくあるご質問

Q. まだ具体的なクラスタ構成が固まっていません。それでも相談できますか?
はい、問題ありません。まずは現在想定されている GPU 数・IB スイッチ構成・ラック数と、 「どこまで落としたくないか(IBだけ・GPUノードも含めるか)」をお聞かせください。 そこから逆算して、必要な UPS ドメインと容量レンジをご提案します。
Q. 既存の商用 UPS と併用することは可能ですか?
可能です。ラック単位で AC-UPS を設置しつつ、その中の IB スイッチや一部 GPU ノードだけを DC-UPS(AI-UPS)で二重化する構成など、段階的な導入も想定しています。
Q. バッテリーの寿命や更新サイクルはどの程度を見込めばよいですか?
AGM バッテリーは運用条件により変わりますが、一般的には 5〜7年程度を目安としています。 サイクル数・浮動充電条件・温度条件などをヒアリングの上、最適な容量と更新サイクルを設計します。
Q. PoC 段階ではどこまで対応してもらえますか?
PoC 用の構成検討、概算容量計算、システム構成図の作成、MIB 定義の整理など、 仕様検討段階からご一緒します。必要に応じて、既存の SNMP ボード/ログ基盤の流用案も提示します。

「AI が止まらない電源」を、一緒に設計しませんか?

本 AI-UPS は、「お客様の AI クラスタに最適化された専用電源」を共に設計するためのプラットフォームです。

具体的な容量設計・AGM バッテリ選定・MIB 定義の整理まで、 技術的なディスカッションベースでご相談ください。

AI-UPS について問い合わせる

「AI-UPSについて」と明記いただくとスムーズです。