世界初、スーパーコンピュータ「富岳」を用いてグラフ解析性能200 TeraTEPSを突破
10期連続Graph500首位、高いビッグデータ処理能力を証明
東京科学大学、理化学研究所、株式会社フィックスターズ、日本電信電話株式会社、富士通株式会社による共同研究グループ※は、大規模グラフ解析に関するスーパーコンピュータの国際的な性能ランキングである「Graph500」のBFS(Breadth-First Search:幅優先探索)部門において、スーパーコンピュータ「富岳」[用語1]の測定結果を大幅に向上させ、世界第1位を獲得しました。「富岳」としては10期連続での世界第1位となります。今回達成した性能は約204 TeraTEPS(テラテップス)[用語2]で、世界で初めて200 TeraTEPSを上回りました。
このランキングは、現在米国ジョージア州アトランタのジョージア・ワールド・コングレス・センターおよびオンラインで開催中のHPC(ハイパフォーマンス・コンピューティング:高性能計算)に関する国際会議「SC24」にて、Graph500 Committeeから発表されました。また、SC24では本測定の詳細に関する論文を共同研究グループから発表します。
大規模グラフ解析の性能は大規模かつ複雑なデータ処理が求められるビッグデータの解析における重要な指標です。共同研究グループは「富岳」を用いた大規模グラフ処理技術の開発を引き続き進めていきます。
※共同研究グループ
-
理化学研究所 計算科学研究センター
- 運用技術部門 ユニットリーダー 山本啓二
- 運用技術部門 技師 中尾昌広
-
東京科学大学 総合研究院 デジタルツイン研究ユニット
- 教授 藤澤克樹
- 研究員 山村圭一郎
-
株式会社フィックスターズ
- エグゼクティブエンジニア 上野晃司
- ディレクター 高木瞭
- シニアエンジニア 井上雄登
- シニアエンジニア 柴田敦也
- シニアエンジニア 大野真暉
- ディレクター 寺西寛人
- シニアエンジニア 鈴木浩介
- エンジニア 阪本哲郎
- エンジニア 南規楽
-
日本電信電話株式会社 コンピュータ&データサイエンス研究所
- 主幹研究員 高橋寛幸
- 主任研究員 及川一樹
- 主任研究員 新井淳也
- 研究員 尾形嵐士
- 研究員 今西遼人
「富岳」測定結果
共同研究グループは、「富岳」の152,064ノード[用語3](全体の約95.7%)を用いて、約8.8兆個の頂点と140.7兆個の枝から構成される超大規模グラフに対する幅優先探索問題を平均0.69秒で解きました。「Graph500」のスコアは204.068 TeraTEPSで、前回(2024年5月)の性能から38.038 TeraTEPS(約23%)向上しました。今回の測定では、共同研究グループが開発した省メモリ化技術を用いることで、「Graph500」ランキングでこれまで例がない大規模なグラフの処理に成功しました。一般に大規模な問題ほど効率的な並列処理が可能であるため、省メモリ化技術は性能面でも良い効果をもたらしました。さらに乱数による性能の変動を抑えるため、良い性能を与える乱数シード値の探索を導入しました。今回の大幅な性能向上はこれらの要因によって達成されたものです。技術の詳細および「富岳」での評価結果はSC24にて以下の論文で発表します。
J. Arai, M. Nakao, Y. Inoue, K. Teranishi, K. Ueno, K. Yamamura, M. Sato, and K. Fujisawa, "Doubling Graph Traversal Efficiency to 198 TeraTEPS on the Supercomputer Fugaku," SC24: International Conference for High Performance Computing, Networking, Storage and Analysis, Atlanta, GA, USA, 2024, pp. 1-14.
Graph500について
実社会における複雑な現象は、大規模なグラフ(頂点と枝によりデータ間の関連性を示したもの)として表現される場合が多いため、コンピュータによる高速なグラフ解析が必要とされています。例えば、ソーシャル・ネットワーキング・サービス(SNS)などでは、「誰と誰がつながっているか」といった関連性のあるデータを解析する際にグラフ解析が用いられます。さらにSociety 5.0[用語4]に向けた取り組みにおいて、IoT(Internet of Things)などの技術で取得された大量のデータをグラフに変換して計算機で高速処理することにより、新しい価値を産み出す新規ビジネスの開拓が推進されています。これらは新しい産業の創出と廃棄物排出の削減の両立を目的としており、「持続可能な開発目標(SDGs)[用語5]」のうち特に9(産業・技術革新・社会基盤)および11(持続可能なまちづくり)の推進に大きく寄与することが期待されています。このような多種多様な応用力を持つグラフ解析の性能を競うのが「Graph500」です。
「Graph500」は2010年にBFS部門と共に始まり、現在はSSSP(Single-Source Shortest Path:単一始点最短路)とGreen(BFSの電力効率)を加えた3部門それぞれのランキングが年に2回更新されます。BFSおよびGreen部門では頂点間の枝の長さが同じグラフを扱うのに対し、SSSP部門では頂点間の枝の長さが異なるグラフを扱い、単位時間(1秒)当たりの処理数でランキングします。
「Graph500」では大規模グラフを扱うため、グラフのデータを複数台のノードに分散して配置する必要があり、「富岳」のような大規模ネットワークを持つシステムでは通信性能の最適化も重要になります。共同研究グループは、スーパーコンピュータ上で大規模なグラフを高速に解析できるソフトウェアの開発を進めており、これまでの成果として下記(1)~(6)の先進的なソフトウェア技術を高度に組み合わせることにより、今後予想される実データの大規模化および複雑化に対応可能な世界最高レベルの性能を持つグラフ探索ソフトウェアの開発に成功しています注1)。
(1)複数のノード間におけるグラフデータの効率的な分割および圧縮
(2)冗長なグラフ探索を削減するアルゴリズム
(3)BFSの結果に影響を与えずに不要な頂点を削除する前処理
(4)スーパーコンピュータの大規模ネットワークにおける通信性能の最適化
(5)探索アルゴリズムの動作を制御するパラメータの自動チューニング
(6)乱数による性能変動を緩和するシード値探索
「Graph500」のBFS部門における第1位獲得は、「富岳」が科学技術計算でよく用いられる規則的な計算だけでなく、不規則な計算が大半を占めるグラフ解析においても高い性能を発揮することを実証したものであり、幅広い分野のアプリケーションに対応できる「富岳」の優れた汎用性を示すものです。また、ハードウェアの性能を最大限に活用できるソフトウェアを開発した共同研究グループの技術力の高さを示すものでもあります。現在も共同研究グループでは前処理を通じた後続の計算の負荷低減やデータの圧縮の検討を継続しており、今回の測定で得たデータを基に性能改善を加速させていきます。
注1)
本研究では以下の成果(アルゴリズムやプログラム)を活用しています。
1: 科学技術振興機構(JST)戦略的創造研究推進事業CREST「ポストペタスケール高性能計算に資するシステムソフトウェア技術の創出(研究総括:佐藤三久)」における研究課題「ポストペタスケールシステムにおける超大規模グラフ最適化基盤(研究代表者:藤澤克樹、拠点代表者:鈴村豊太郎)」
2: 科学技術振興機構(JST)戦略的創造研究推進事業CREST「ビッグデータ統合利活用のための次世代基盤技術の創出・体系化(研究総括:喜連川優)」における研究課題「EBD:次世代の年ヨッタバイト処理に向けたエクストリームビッグデータの基盤技術(研究代表者:松岡聡)」
3. 日本学術振興会
科学研究費助成事業「自動性能チューニング機能を持つ高性能グラフライブラリの開発(研究代表者:中尾昌広、研究分担者:藤澤克樹、児玉祐悦)」
4: 大規模グラフ解析プログラムの GitHubレポジトリ
参考文献
1. Junya Arai, Masahiro Nakao, Yuto Inoue, Kanto Teranishi, Koji Ueno, Keiichiro Yamamura, Mitsuhisa Sato, and Katsuki Fujisawa, "Doubling Graph Traversal Efficiency to 198 TeraTEPS on the Supercomputer Fugaku," in SC24: International Conference for High Performance Computing, Networking, Storage and Analysis, November 2024.
2. Masahiro Nakao, Koji Ueno, Katsuki Fujisawa, Yuetsu Kodama, and Mitsuhisa, Sato, "Performance of the Supercomputer Fugaku for Breadth-First Search in Graph500 Benchmark," in High Performance Computing: 36th International Conference, ISC High Performance 2021, June 2021, pp. 372-390.
3. Koji Ueno, Toyotaro Suzumura, Naoya Maruyama, Katsuki Fujisawa, Satoshi Matsuoka, "Efficient Breadth-First Search on Massively Parallel and Distributed-Memory Machines," Data Science and Engineering, vol. 2, no. 1, pp. 22-35, March 2017.
4. Koji Ueno, Toyotaro Suzumura, Naoya Maruyama, Katsuki Fujisawa, Satoshi Matsuoka. "Extreme Scale Breadth-First Search on Supercomputers". in 2016 IEEE International Conference on Big Data (Big Data), December 2016, pp. 1040-1047.
補足説明
- [用語1]
- スーパーコンピュータ「富岳(ふがく)」:スーパーコンピュータ「京」の後継機。2020年代に、社会的・科学的課題の解決で日本の成長に貢献し、世界をリードする成果を生み出すことを目的とし、電力性能、計算性能、ユーザーの利便性・使い勝手の良さ、画期的な成果創出、ビッグデータやAIの加速機能の総合力において世界最高レベルのスーパーコンピュータとして2021年3月に共用を開始した。
現在「富岳」は日本が目指すSociety 5.0を実現するために不可欠なHPCインフラとして活用されている。 - [用語2]
- TeraTEPS(テラテップス):TEPSはTraversed Edges Per Secondの略であり、「Graph500」ベンチマークの実行速度を表すスコア。「Graph500」ベンチマークでは与えられたグラフの頂点とそれをつなぐ枝を処理する。「Graph500」におけるコンピュータの速度は1秒間当たりに処理した枝の数として定義されている。TeraTEPSのTeraは10の12乗を表し、TeraTEPSは1秒当たりに処理した枝の数を10の12乗で割った値である。TeraTEPS値の計算には、64試行における調和平均が使用されている。
- [用語3]
- ノード:スーパーコンピュータにおけるオペレーティングシステムが動作できる最小の計算資源の単位。「富岳」の場合は、1つのCPU(中央演算装置)と32 GiB(ギビバイト)のメモリから構成される。
- [用語4]
- Society 5.0:狩猟社会(Society 1.0)、農耕社会(Society 2.0)、工業社会(Society 3.0)、情報社会(Society 4.0)に続く、新たな社会を指すもので、第5期科学技術基本計画において日本が目指すべき未来社会の姿として初めて提唱された。IoT、ロボット、AI(人工知能)、ビッグデータといった社会の在り方に影響を及ぼす新たな技術をあらゆる産業や社会生活に取り入れ、経済発展と社会的課題の解決を両立していく新たな社会の実現を目指す。
- [用語5]
- 持続可能な開発目標(SDGs):2015年9月の国連サミットで採択された「持続可能な開発のための2030アジェンダ」にて記載された2016年から2030年までの国際目標。持続可能な世界を実現するための17のゴールと169のターゲットで構成され、発展途上国のみならず、先進国自身が取り組むユニバーサル(普遍的)なものであり、日本も積極的に取り組んでいる。(外務省ホームページから一部改変して転載)
関連ページ
取材申込み
理化学研究所 神戸事業所 計算科学研究推進室 アウトリーチグループ
- r-ccs-koho@ml.riken.jp
理化学研究所 広報室 報道担当
- Tel
- 050-3495-0247
- ex-press@ml.riken.jp
株式会社フィックスターズ 広報担当
- Tel
- 03-6420-0751
- press@fixstars.com
日本電信電話株式会社 サービスイノベーション総合研究所 企画部広報担当
- nttrd-pr@ml.ntt.com
富士通株式会社 富士通コンタクトライン(総合窓口)
- Tel
- 0120-933-200
東京科学大学 総務企画部 広報課
- TEL
- 03-5734-2975
- FAX
- 03-5734-3661
- media@ml.tmd.ac.jp