AI活用に伴う消費電力の増大に対し
IWONは光コンピューティングへ実装領域を拡大
    NTTが提唱する光技術を活用した情報通信基盤構想「IOWN(Innovative Optical and Wireless Network)構想」が、新たなフェーズへと進化している。これまでネットワークサービスを中心に展開されてきたIOWNは、AI時代の電力課題に対応すべく、光コンピューティングを軸とした低消費電力化と、分散化するインフラの最適運用という二つの方向性を打ち出した。本記事では、その詳細について10月6日にアナリスト・投資家向けのイベント「NTT PR/IR DAY」で語られた内容をベースに紹介する。
ネットワークサービスから
IOWN構想は新たな段階に
     NTTが提唱する光技術を活用した情報通信基盤構想「IOWN(Innovative Optical and Wireless Network)構想」は、以下の三つの要素から構成されている。
・APN(All-Photonics Network):光信号のみで通信を行うネットワーク
・PEC(Photonics-Electronics Convergence):光技術と電子技術を融合させた装置
・DCI(Data-Centric Infrastructure):データを中心に据えたインフラ設計思想

常務取締役
常務執行役員
CCXO
Co-CAIO
大西佐知子氏
 2023年に発表した「IOWN 1.0」では、APNを中心に超高速・低遅延の特長を生かしたネットワークサービスの実装が進められていた。例えば、TBSテレビとNTTドコモビジネスが新規に構築したリモートプロダクションセンターと、撮影現場である国立競技場をIOWN APNで接続することで、制作拠点にとらわれない柔軟な設備環境を実現した事例が挙げられる。
 本記者会見では、IOWN 1.0の次の段階として「IWON 2.0」が語られた。IWON 2.0では、ネットワークの領域から、低消費電力の実現を目指す光コンピューティングへと実装領域を拡大するという。その背景には、AI市場の急速な拡大に伴う消費電力の増加がある。AI市場は、2030年には2021年実績比で20倍の約280兆円に達すると予測されており、それに比例してデータセンターの電力消費量も急増する見通しだ。消費電力量は2024年の415TWhから、2030年には約2倍の945TWhに達するとされている。
 この電力増加を引き起こしている要因の一つが、AIの活用に不可欠な計算リソースであるGPUサーバーだ。GPUサーバーは従来のサーバーと比べて約5.9倍の電力を消費し、さらにAIの高度化に伴い、1台当たりのGPU搭載数も年率1.8倍のペースで増加している。「このまま推移すれば、2030年にはデータセンターやネットワーク全体の電力消費量が、2023年度の東京都の年間消費電力量を上回る規模に達する可能性もあり、電力需給のひっ迫による計画停電のリスクもあります」と、NTT 常務取締役 常務執行役員 CCXO Co-CAIO 大西佐知子氏は警鐘を鳴らす。さらに、AIの導入・運用にかかるコストも企業にとって無視できない負担となっている。企業におけるAI活用のコストは従来比で約75%増加しており、ROIの低下が懸念されている。
光コンピューティングで
インフラ電力を最適化
    
代表取締役副社長
副社長執行役員
CTO
星野理彰氏
NTTはこの課題に、二つの方向からアプローチしている。一つ目が、光コンピューティングによるインフラの総消費電力の低減だ。「GPUサーバー内ではCPU、メモリ、ストレージ、GPU間で大量のデータ通信が行われています。AIの活用が進み、GPUの搭載数が拡大するにつれて、サーバー内部の通信量も増大していくため、通信そのものが消費する電力を削減する必要が生じています。そこで活用するのが、光による通信です。サーバー内部での通信は電気による通信を用いていますが、大容量の電気による通信は伝送距離が延びると、飛躍的に消費電力が増加してしまいます。一方で光による通信の場合、処理速度や伝送距離によって消費電力の差がほとんど増加しません。そこでNTTグループではサーバーの中のボード間を光でつなぐデバイス『PEC-2』の開発を進めています」と、NTT 代表取締役副社長 副社長執行役員 CTO 星野理彰氏は話す。
PEC-2は、低消費電力の光コンピューティングを実現するための光電融合スイッチに搭載される主要コンポーネントだ。このPEC-2の開発は、NTTの子会社であるNTTイノベーティブデバイスが担当しており、Broadcomが開発した特定用途向け集積回路(ASIC:Application Specific Integrated Circuit)の直近に配置される設計となっている。これにより、電気配線の距離を最小限に抑え、通信時の消費電力を削減している。PEC-2とASICを組み込んだスイッチボードは、Acctonによって光電融合スイッチとしてパッケージ化され、製品化が進められている。

提供:NTT

代表取締役副社長
CTO
富澤将人氏
この光電融合スイッチの優位性について、NTTイノベーティブデバイス 代表取締役副社長 CTO 富澤将人氏は次のように語る。「光エンジンについて、競合製品では半田づけによる固定式が一般的ですが、光電融合スイッチでは取り外し可能なソケット型を採用しています。これにより、万が一故障が発生しても個別に交換が可能で、修理コストを抑えられます。また、光エンジンの交換が容易であることから、導入先の要件に応じた柔軟な構成変更も可能です」
分散化するAIインフラを
一つのリソースとして見立てる
     二つ目が、インフラの効率的な運用だ。AIの利活用が多様な業務プロセスに広がる中で、GPUなどの計算リソースの稼働率にばらつきが生じており、インフラ全体の最適化が求められている。
 従来は、AIの活用領域が限定的だったため、必要な分のGPUリソースを構築し、高い稼働率で運用することが可能だった。しかし現在では、業界や業務ごとに異なるAIモデルが構築されるようになり、リソースの稼働状況に偏りが生まれている。さらに、AIをはじめとするインフラ需要の増加により、首都圏では電力供給が限界に近付き、電力に余裕のある地方へのデータセンターやGPUリソースの分散配置が進んでいる。本来であれば、1カ所に集約して効率的に運用を行いたいが、現実には分散運用が避けられない状況にあるのだ。
 先進企業では、複数の大規模AIモデルを運用しており、膨大なGPUリソースを必要としている。そのため、各拠点におけるGPUの使用状況や消費電力などを可視化し、リソースに余裕のある拠点に優先的にAI処理を割り当てるといった、効率的な運用を目指す取り組みを開始している。また、再生可能エネルギーを活用しやすい地方に拠点を配置することで、より多くのグリーンエネルギーを活用できる環境づくりも進められている。
 このように分散配置されたGPUリソースを、IOWN APNで高速に接続することで、あたかも一つの巨大なコンピューティングリソースとして機能させることが可能になる。多段化されたGPU間や地理的に離れた拠点間をIOWN APNで結ぶことで、AIの用途や利用状況に応じて、GPUなどのコンピューティングリソースを柔軟に割り当てられるのだ。さらに、処理内容や負荷に応じて、必要な電力供給が可能な拠点へリソースを割り当てることで、安定的かつ効率的なインフラ運用が実現できる。
 最後に大西氏は「AIの利用による豊かな社会と環境負荷の低減の両立にチャレンジしていきます」と締めくくった。

          



