
6,000基のNVIDIA A100 GPU が4エクサフロップスの混合精度性能を提供し、NERSCの科学の進歩を支援
米国立エネルギー研究科学計算センター (NERSC) がこのほど、世界最速のAIスーパーコンピューター、Perlmutterの稼働を発表した。本システムは、宇宙の3次元地図の作製や、グリーンエネルギー源のための素粒子相互作用の探求などに役立てられる予定のスーパーコンピューターだ。7,000人以上の研究者に約4エクサフロップスのAI性能を提供する。
つまり、PerlmutterはAIが使用する16ビットと32ビットの混合精度演算において、地球上で最速のシステムということ。しかも、この性能には、年内にローレンスバークレー国立研究所に置かれる本システムに予定されているフェーズ2の性能は含まれていない。
現在、24種類以上のアプリケーションを、世界最大のA100搭載システムであるPerlmutterの6,159基のNVIDIAA100 Tensor コア GPUで初めて動かすための準備が進められている。いずれも、天体物理学や気候科学をはじめとする科学の進歩を目指している。
■宇宙の3次元地図
あるプロジェクトでは、Perlmutterを利用して過去最大の3次元可視宇宙地図を作製する。
Perlmutterは、1回の露光で5,000もの銀河を捉えることができる宇宙カメラの一種である暗黒エネルギー分光計器(DESI)からのデータを処理する。
研究者が一夜で数十回の露光を捉えて、次の夜にDESIを向ける方角を知るためには、PerlmutterのGPUのスピードが必要。1年分の公開データの準備には、従来のシステムでは数週間から数か月を要したが、Perlmutterはわずか数日で完了させるのに役立つだろう。
NERSCのデータアーキテクトで、研究者のコードをPerlmutterに対応させるのを支援しているローリントーマス(Rollin Thomas)氏は、「予備研究ではGPUによって20倍の高速化が達成され、本当に満足しています」と述べている。
■パールマッター氏の飽くなき好奇心が結実
DESIの地図は、加速し続ける宇宙の膨張の裏にある不思議な物理である暗黒エネルギーに光を当てることを目的にしている。暗黒エネルギーは、バークレー研究所の現役天体物理学者で、新しいスーパーコンピューターの名前の由来となった、2011年にノーベル賞を受賞したソールパールマッター(Saul Perlmutter)氏の研究によって主に発見された。
ノーベル賞受賞につながった発見に続くプロジェクトで、パールマッター氏と共に研究を行ったトーマス氏は、「私にとって、パールマッター氏は、飽くなき好奇心と楽観主義へのこだわりを正しく組み合わせることで、人間に何ができるかを示すよい例です」と述べている。
■スーパーコンピューターがAIとHPCを融合
NERSCの新しいスーパーコンピューター上で実行される多くのプロジェクトも、同様の精神によって支えられている。たとえば、材料科学の研究は、バッテリーやバイオ燃料の改善への方向性を示す可能性がある原子相互作用の発見を目指している。
従来のスーパーコンピューターでは、Quantum Espressoなどのプログラムで、原子数個のシミュレーションを数ナノ秒間にわたって生成するのに必要な計算を処理するのがやっとだった。しかし、極めて正確なシミュレーションと機械学習を組み合わせることで、より多くの原子を、より長い時間にわたって研究できるようになる。
NERSCのアプリケーションパフォーマンススペシャリストで、研究者のプロジェクト立ち上げを支援しているブランドン クック(Brandon Cook)氏は、「従来、バッテリーの界面のような大きな系の完全な原子シミュレーションを行うことは不可能だったが、今や科学者はPerlmutterを利用してその計画を立てています」と述べている。
そこで特別の役割を果たすのがA100のTensorコアだ。Tensorコアは、シミュレーションのための倍精度浮動小数点演算と、ディープラーニングに必要な混合精度演算の両方を高速化する。
同様の研究が昨年11月、NVIDIA V100 GPUを使用したBerkeleyGWプログラムで、ゴードンベル賞の最終候補としてNERSCに認められた。NERSCでプロジェクトの指揮とアプリケーション性能の監督の任に当たるジャックデスリッペ(Jack Deslippe)氏は、「A100の有り余る性能は、そうした取り組みのレベルを引き上げることを約束します」と述べている。
■ソフトウェアがPerlmutterを支える
デスリッペ氏は、システムが使用するNVIDIAHPCSDKに含まれるOpenMPやその他のプログラミングモデルのサポートを挙げ、「ソフトウェアもPerlmutterの戦略的要素です」と言う。
これとは別に、GPU向けのデータサイエンス用オープンソースコードであるRAPIDSは、NERSCの拡大するPythonプログラマーチームの研究を迅速化することが期待される。
RAPIDSは、NERSCのCoriスーパーコンピューター上のすべてのネットワークトラフィックを解析するプロジェクトにおいて、従来のCPUを使用した研究の約600倍もの高速化という価値をもたらした。
「RAPIDSがデータによる科学的発見の加速において大きな役割を果たすと確信しました」とトーマス氏は述べている。
■コロナ禍への対処
Perlmutterは、コロナ禍にもかかわらず、予定通りに進んでいる。しかし、チームはシステムのエクサスケールのアプリケーションのコードに関する、在宅勤務の研究者によるハッカソンの実施方法といった重要な手順の見直しを迫られた。
その一方で、Hewlett Packard Enterpriseのエンジニアは、新しいシステムに対応できるように施設のアップグレードを行ったNERSCスタッフと協力しながら、システムのフェーズ1の構築に貢献した。「特に現在のコロナ禍の厳しい制約の中で、現場でシステムの立ち上げに尽力してくれた人々には深く感謝しています」とトーマス氏は述べている。
NVIDIAの創業者/CEOであるジェンスン フアン(Jensen Huang)は、バーチャルのローンチイベントで、Perlmutterによって科学を進歩させる計画について、バークレー研究所のスタッフを祝福した。
「PerlmutterのAIとハイパフォーマンス コンピューティングを融合する能力は、材料科学や量子物理学、気候予測、生物学研究をはじめとする幅広い分野におけるブレイクスルーにつながるでしょう」とフアンは述べている。
■スケジュールどおりにAIスーパーコンピューターが稼働
バーチャル除幕式は、まさに1つのマイルストーンだ。「科学向けAIは、米国エネルギー省の重点分野であり、素粒子物理学、材料科学、バイオエネルギーといった分野で、概念実証から本格稼働への移行が進んでいます」と語るのは、NERSCでデータおよびアナリティクスサービスグループのリーダーを務めるワヒド ビムジ(Wahid Bhimji)氏だ。
「ニューラルネットワークモデルはますます大規模化が進んでおり、より強力なリソースを利用したいという需要があります。A100GPU、オールフラッシュファイルシステム、およびストリーミングデータ機能を搭載したPerlmutterは、こうしたAIのニーズに対応する上で絶好のタイミングです。」
Perlmutterの利用を希望する研究者は、システムの利用申請を提出することができる。
出典元:NVIDIAブログ
https://blogs.nvidia.com/blog/2021/05/27/nersc-perlmutter-ai-supercomputer/
構成/こじへい
からの記事と詳細 ( 米国立エネルギー研究科学計算センターで世界最速のAIスーパーコンピューター「Perlmutter」が稼働 - @DIME )
https://ift.tt/3vYVNk0
No comments:
Post a Comment