ニュース
NVIDIA,PCIe版「Tesla V100」搭載システムの2017年内発売を予告。Volta世代の「AI向けGPU」
- 倍精度浮動小数点演算(FP64)性能:7 TFLOPS
- 単精度浮動小数点演算(FP32)性能:14 TFLOPS
- 半精度浮動小数点演算(FP16)性能:112 TFLOPS
- 公称消費電力:250W
Tesla V100搭載システムは,Hewlett Packard EnterpriseをはじめとするNVIDIAのパートナーから,2017年内に発売予定とのことである。
一方,ハードウェア接続形態と公称性能値以外に違いはないようで,CUDA Core数が5120基で,4x4の行列演算を高速に処理する「Tensor Core」数が640基,HBM2ベースのグラフィックスメモリ容量が16GBで,メモリバス帯域幅が900GB/sといったスペックはNVLink版と同一である。
PCIeに対応したからといって,PCIe版Tesla V100カードはゲーマーが使うものではないが,次世代GPUであるVolta世代GPUが対応プラットフォームを広げているというのは,同世代GPUを採用するGeForceが登場する日も少しづつ近づいていることの証と言えなくもない。
次世代のGeForceが,Tesla V100と同様にHBM2を採用するのか,それともGDDR5XやGDDR6といったメモリ技術を採用するのかどうかは分からないが,新しいGeForceの姿が少し見えてきたと考えると,ゲーマーにとっても楽しみな話題ではないだろうか。
NVIDIAのTesla V100 製品情報ページ(英語)
世界最高のエネルギー効率を誇るスーパーコンピューター上位 13 位※すべてで採用
フランクフルト -ISC- (2017年6月19日) - エクサスケールコンピューティングの実現を目指すNVIDIA は本日、世界最高のエネルギー効率を誇る高性能コンピューティング (HPC) システムの新しいGreen500 リストで、測定された上位13位の全システムにおいて、NVIDIA Tesla AI スーパーコンピューティングプラットフォームが採用されていることを発表しました。13 のシステムすべてが NVIDIA Tesla P100 データ センター GPUアクセラレーターを搭載しており、うち4つはNVIDIA DGX-1 AI スーパーコンピューターをベースとしています。
- ムーアの法則が減速するなかで、NVIDIA Tesla GPU は引き続きコンピューティングを拡張し、2年間でパフォーマンスを3倍に
- Tesla V100 GPU が、米国エネルギー省のSummit スーパーコンピューターで 200 ペタフロップスのHPC と 3 エクサフロップスの AI パフォーマンスを実現へ
- 主要クラウド プロバイダー各社が NVIDIA Volta GPU プラットフォームの市場投入を表明
また NVIDIA は本日、NVIDIA Tesla GPUによって、HPC アプリケーションのパフォーマンスが、2年前にリリースされたKepler アーキテクチャの3倍に向上したことを示すパフォーマンスデータも公開しました。これにより、近年すでに減速が始まっていたムーアの法則による予測レベルを大幅に超えてパフォーマンスが高まります。
さらに NVIDIA は、AI と従来の HPC アプリケーションを単一のプラットフォーム上で統合する NVIDIA Tesla V100 GPU アクセラレーターが、年内にオンラインで提供が開始される米国エネルギー省 (DOE) の Summitスーパーコンピューターで、200ペタフロップスの64ビット浮動小数点性能と3エクサフロップス以上の AIパフォーマンスを実現する見込みであると発表しました。
NVIDIA GPU が世界で最も環境にやさしいスーパーコンピューターを後押し国際スーパーコンピューティング ショー (ドイツ・フランクフルトで開催) で本日発表された Green500 リストでは、NVIDIA Tesla P100 GPU を搭載した東京工業大学の TSUBAME 3.0 システムが1位を獲得しました。TSUBAME 3.0システムは、1ワットあたり14.1ギガフロップスの電力効率を記録しました。これは、前回 1 位のシステム (最新のリストでは 10位にランクインした NVIDIA の SATURNV) の効率を50%も上回る数字です。
次に、最新リストの2位〜6位には、Yahoo Japan、日本の産業技術総合研究所、日本の革新知能統合研究センター(理研)、ケンブリッジ大学、およびスイス国立コンピューティング センター (CSCS: 欧州最速スーパーコンピューターの栄冠に輝いた Piz Daint の本拠地) が続きます。ほかにも、NVIDIA を採用した上位 13 位の主要システムには、E4 Computer Engineering、オックスフォード大学、東京大学などが選ばれています。
NVIDIA Tesla GPU アクセラレーターを完全に最適化された AI ソフトウェア パッケージと統合する、NVIDIA のDGX-1 AI スーパーコンピューターをベースとするシステムには、理研の「RAIDEN」、オックスフォード大学の「JADE」、主要ソーシャルメディアおよびテクノロジ サービス企業のハイブリッド クラスター、そして、NVIDIA の「SATURNV」などが挙げられます。
NVIDIA のアクセラレーテッド コンピューティング担当ゼネラル マネージャーであるイアン・バック (Ian Buck)は、次のように述べています。「世界で最も困難な課題に立ち向かう研究者の皆様は、HPC と AIの最新技術を利用するため、パワフルな統合されたコンピューティング アーキテクチャを探し求めています。当社の AI スーパーコンピューティングプラットフォームは、コンピューター科学やデータサイエンスの分野向けに単一のアーキテクチャを実現。世界有数の頭脳に、イノベーションのスピードを加速し、解決不能な問題を解決するさまざまな機能を提供します。」
東京工業大学の松岡聡教授は、次のように述べています。「TSUBAME 3.0 スーパーコンピューターを開発した私たちの目標は、HPC とAI の両方に対応した単一のパワフルなプラットフォームを提供するとともに、日本を代表するフラッグシップスーパーコンピューターの一つとして、最適なエネルギー効率を実現することです。最も重要なのは、マルチペタスケールのトップレベルの本番マシンにより、この成果を達成できたという点です。NVIDIA Tesla P100 GPU のおかげで、その両目標で優れた実績をあげることができました。この革命的な AI スーパーコンピューティングプラットフォームにより、日本の科学研究と科学教育を促進できます。」
Volta から「エクサスケール」へ
NVIDIA は、オークリッジ国立研究所にある米国エネルギー省科学局ユーザー施設のオークリッジ リーダーシップコンピューティング施設に対して、Summit スーパーコンピューターに適したエクサスケール レベルのパフォーマンス (スピード、効率、AIコンピューティング性能の飛躍的向上) を年内に実現できる見込みについても発表しました。
NVIDIA Tesla V100 アクセラレーターが搭載された Summit は、200ペタフロップスのパフォーマンスを実現すると予測されています (これに対して、現在の世界最速システムである中国の TaihuLight(太湖之光)は、93 ペタフロップスです)。また Summit は、3エクサフロップス以上のハーフプレシジョンのテンソル演算を達成し、卓越した AI コンピューティング性能を実現すると見込まれています。
オークリッジ国立研究所のコンピューティングおよび計算科学のアソシエート ラボラトリー ディレクター、ジェフ・ニコルズ (Jeff Nichols) 氏は、次のように述べています。「AI によって HPCが拡張されるとともに、その相乗効果によって、世界のいくつかの最重要課題を解決するためのイノベーションが加速されています。オークリッジのプリエクサスケールスーパーコンピューター『Summit』では、AI と HPC の両方で優れた単一の統合アーキテクチャを提供する NVIDIA Volta GPU を採用しています。私たちは、AI スーパーコンピューティングが研究者や科学者にブレークスルーとなる効果をもたらすと信じています。」
すべての主要クラウドで Volta を採用
V100 GPU アクセラレーターの卓越したコンピューティング性能は、世界をリードするクラウド サービスプロバイダー数社から年内にもサービスとして提供される予定です。Voltaベースのサービスを提供する意欲とサポート計画を表明した企業には、Amazon Web Services、Baidu、Google Cloud Platform、Microsoft Azure、Tencent などが名を連ねています。
Volta: AI スーパーコンピューティングに適した究極のアーキテクチャ
Volta の提供範囲を拡大するために、NVIDIA は新しい Tesla V100 GPU アクセラレーターを標準サーバー向けの PCIe フォームファクターでご用意しました。Volta は、PCIe システムと、以前に発表した NVIDIA NVLink インターコネクトテクノロジ搭載システムの市場投入によって、HPC を変革し、スーパーコンピューター、企業、およびクラウドに画期的な AIテクノロジをもたらすことをお約束します。
PCIe フォームファクターの仕様は以下のとおりです。
- NVIDIA GPU BOOST テクノロジによるダブルプレシジョン浮動小数点性能は 7テラフロップス、シングルプレシジョン浮動小数点性能は 14 テラフロップス、ハーフプレシジョン浮動小数点性能は 112 テラフロップス
- 16GB の CoWoS HBM2 スタック メモリで、900 GB/秒のメモリ帯域幅を実現
- PCIe Gen 3 インターコネクトに対応 (最大 32 GB/秒の双方向帯域幅)
- 消費電力 250 ワット
PCIe ベースのシステム用の NVIDIA Tesla V100 GPU アクセラレーターは、Hewlett Packard Enterprise (HPE) をはじめ、NVIDIA の再販パートナーやメーカーより 2017 年中に発売予定です。
Hewlett Packard Enterprise (HPE) の HPC および AI 担当バイスブレジデント兼ゼネラルマネージャー、ビル・マネル (Bill Mannel) 氏は、次のように述べています。「HPE は、ディープラーニングおよび AI 専用HPE Apollo システムのイノベーションに、NVIDIA Tesla V100 テクノロジアーキテクチャの業界をリードするユニークな強みを取り入れることで、お客様の洞察とインテリジェンスを高めることができるでしょう。HPEは、お客様の高まる需要に応えるため、自社のポートフォリオに含まれる 3 種類のシステムで PCIe インターコネクトを採用した NVIDIA Volta をサポートし、NVLink 2.0 システムへの早期アクセスを実現します。」
NVIDIA Tesla スーパーコンピューティング プラットフォームの詳細については、www.nvidia.com/tesla をご覧ください。
※数値測定されたシステムの上位13位を指します
- 関連タイトル:
NVIDIA RTX,Quadro,Tesla
- 関連タイトル:
Volta(開発コードネーム)
- この記事のURL:
Copyright(C)2010 NVIDIA Corporation