ホーム > PC-Webzineアーカイブ > NVIDIAの最新GPUはユニバーサル対応

NVIDIAの最新GPUはユニバーサル対応

NVIDIAの最新GPUはユニバーサル対応

2017年12月15日更新

最新アーキテクチャーはユニバーサルGPU

General Purpose computing on GPU

HPCにもGRIDにも対応

 HPCやAI、ディープラーニング用途のサーバーのデータ処理能力を向上させる用途で活用が広がっているのがGPU(Graphics Processing Unit)だ。逐次処理用に最適化された数個のコアで構成されるCPUに対して、GPUは複数のタスクに同時に対応できるように設計された何千ものコアで構成されている。並列作業を効率よく処理できるGPUの性能が、HPCやディープラーニングなどの膨大な計算処理の高速化に貢献するのだ。

 そのGPUの提供で市場をリードしているのがNVIDIAである。同社が提供するGPUには、ゲーミング用の「GeForce」、プロフェッショナルグラフィクス用の「Quadro」、そしてHPCやAI用途で利用される「Tesla」の三つのラインアップが存在する。従来までTeslaは、HPCとディープラーニング向け、GRID向け(仮想デスクトップ用途など)にそれぞれ製品がわかれていた。例えば、仮想デスクトップで3DCGなどを制作したり、CADなどを活用する場合にはGRID向けのTeslaが採用されていた。しかし、Pascalというアーキテクチャーが採用された世代からその境界が曖昧になり、最新アーキテクチャーのVolta世代では、一つの製品で、HPCやディープラーニング、GRID利用までを網羅できるようになっている。

 エヌビディア エンタープライズマーケティング シニアマネージャーの佐々木邦暢氏は、「VoltaではユニバーサルGPUというコンセプトのもと、一つの製品でHPCやディープラーニング、GRIDに対応できるようにしました」と説明する。これは、一つのGPUをHPC用途にもGRID用途でも使用したいというニーズに呼応した結果でもある。例えば、昼間はVDIでCADを稼働させるために、そして夜間には設計の最適化を目的とした大規模計算のためにGPUを活用するようなケースに対応できるという。

エヌビディア エンタープライズマーケティング シニアマネージャー HPC/DL/Cloud担当 佐々木邦暢 氏

ディープラーニング処理に最適化

 最新製品となる第7世代Voltaアーキテクチャーを採用した「Tesla V100」は、ピーク性能で現行世代のPascalの5倍、その前の世代のMaxwellアーキテクチャーの15倍の処理能力を提供する。ディープラーニングなどの処理に最適化されたTensor Coreを640基備えていて、120テラフロップスのディープラーニングパフォーマンスを実現するという。CPUとGPU、GPUとGPUの接続には、NVLinkとPCIeに対応。NVLinkは300GB/s、PCIeは32GB/sとなる。「Tesla V100は、HPCとAIのための大きな飛躍を遂げたGPUです」と佐々木氏は一言で表す。すでにTesla V100に対応したサーバー製品も発表され始めている。

 企業におけるAIやディープラーニングの活用状況については、「徐々に始まっている」と佐々木氏は見解を明かす。そうした状況に応じてGPUの採用も増えている。例えば、AIを利用したマルウェア対策ソリューションの提供で市場を開拓しているCylanceなどのシステムでもTeslaが採用されているという。またデータベースがAIに対応することで、データ分析用途としてのGPU活用も増えるだろうと佐々木氏は予測する。

「売上データをもとに行われる需要予測などにおいて、ディープラーニングとGPUを組み合わせることで飛躍的に精度を向上させられるのです。ログファイルの分析でシステムの運用管理性を高めたりすることも可能でしょう。また、従来あきらめていた画像や音声などの非構造化データの活用も、GPUを組み合わせたディープラーニングによって実現できるようになります。それによって新たな成果が得られるようになるはずです」

 GPU対応はクラウドサービスでもすでに始まっている。Amazonをはじめとしたクラウドサービスベンダーは続々とGPU対応を実施しているのだ。そのため、GPUを利用できるシステムをクラウドで採用するかオンプレで導入するかはユーザーニーズによって分かれるだろう。顧客の要望を踏まえた上でオンプレでの導入メリットをアピールできれば、GPU対応サーバーの販売を前進させられるはずだ。

「Tesla V100」
AIワークロードを加速できるよう設計されているTensor Core 640基を備え、120テラフロップスのディープラーニングパフォーマンスを実現。210億を超えるトランジスタを備えている。

キーワードから記事を探す