-ビッグデータの処理で重要となるグラフ解析で最高の評価-
理化学研究所(理研)、九州大学、株式会社フィックスターズ、富士通株式会社による共同研究グループ※は、スーパーコンピュータ「富岳」[1]を用いた測定結果で、大規模グラフ解析に関するスーパーコンピュータの国際的な性能ランキングである「Graph500」のBFS(Breadth-First Search:幅優先探索)部門において、世界第1位を7期連続で獲得しました。
理化学研究所(理研)、九州大学、株式会社フィックスターズ、富士通株式会社による共同研究グループ※は、スーパーコンピュータ「富岳」[1]を用いた測定結果で、大規模グラフ解析に関するスーパーコンピュータの国際的な性能ランキングである「Graph500」のBFS(Breadth-First Search:幅優先探索)部門において、世界第1位を7期連続で獲得しました。
このランキングは、現在ドイツ ハンブルクのコングレス・センター・ハンブルクおよびオンラインで開催中のHPC(ハイパフォーマンス・コンピューティング:高性能計算技術)に関する国際会議「ISC2023」に合わせて、Graph500 Committeeから5月22日(日本時間5月23日)に発表されます。
大規模グラフ解析の性能は、大規模かつ複雑なデータ処理が求められるビッグデータの解析における重要な指標です。
スーパーコンピュータ「富岳」
※共同研究グループ
理化学研究所 計算科学研究センター プログラミング環境研究チーム
チームリーダー 佐藤三久(サトウ・ミツヒサ)
上級技師 児玉祐悦(コダマ・ユウエツ)
技師 中尾昌広(ナカオ・マサヒロ)
九州大学 マス・フォア・インダストリ研究所
教授 藤澤克樹(フジサワ・カツキ)
株式会社フィックスターズ
エグゼクティブエンジニア 上野晃司(ウエノ・コウジ)
1.「富岳」測定結果
共同研究グループは、「富岳」の152,064ノード [2] (全体の約95.7%)を用いて、約4.4兆個の頂点と70.4兆個の枝から構成される超大規模グラフに対する幅優先探索問題を平均0.51秒で解きました。
「Graph500」のスコアは、137,096GTEPS(ギガテップス) [3] で前回(2022年11月時点)の性能を約33%(1ノード単位では約39%)向上させました。
<関連リンク>
Graph500ランキング
https://graph500.org
2.Graph500について
実社会における複雑な現象は、大規模なグラフ(頂点と枝によりデータ間の関連性を示したもの)として表現される場合が多いため、コンピュータによる高速なグラフ解析が必要とされています。例えば、ソーシャル・ネットワーキング・サービス(SNS)などでは、「誰と誰がつながっているか」といった関連性のあるデータを解析する際にグラフ解析が用いられます。さらにSociety 5.0[4]に向けた取り組みにおいて、IoT(Internet of Things)などの技術で取得された大量のデータをグラフに変換して計算機で高速処理することにより、新しい価値を産み出す新規ビジネスの開拓が推進されています。これらは新しい産業の創出と廃棄物排出の削減の両立を目的としており、「持続可能な開発目標(SDGs)[5]」のうち特に9(産業・技術革新・社会基盤)および11(持続可能なまちづくり)の推進に大きく寄与することが期待されています。このような多種多様な応用力を持つグラフ解析の性能を競うのが「Graph500」です。
「Graph500」には、BFS(Breadth-First Search:幅優先探索)部門とSSSP(Single-Source Shortest Path:単一始点最短路)部門があり、2010年に始まり(SSSP部門は2017年11月から)、そのランキングは年に2回更新されます。BFS部門では頂点間の枝の長さが同じグラフを扱うのに対し、SSSP部門では頂点間の枝の長さが異なるグラフを扱い、単位時間(1秒)あたりの処理数でランキングします。
「Graph500」では大規模グラフを扱うため、グラフのデータを複数台のノードに分散して配置する必要があり、「富岳」のような大規模ネットワークを持つシステムでは通信性能の最適化も重要になります。共同研究グループは、スーパーコンピュータ上で大規模なグラフを高速に解析できるソフトウェアの開発を進めており、これまでの成果として下記(1)~(4)の先進的なソフトウェア技術を高度に組み合わせることにより、今後予想される実データの大規模化および複雑化に対応可能な世界最高レベルの性能を持つグラフ探索ソフトウェアの開発に成功しています注1)。
(1)複数のノード間におけるグラフデータの効率的な分割方法
(2)冗長なグラフ探索を削減するアルゴリズム
(3)スーパーコンピュータの大規模ネットワークにおける通信性能の最適化
(4)アルゴリズムの最適なパラメータを実行時に自動探索する機構
「Graph500」のBFS部門における第1位獲得は、「富岳」が科学技術計算でよく用いられる規則的な計算だけでなく、不規則な計算が大半を占めるグラフ解析においても高い性能を発揮することを実証したものであり、幅広い分野のアプリケーションに対応できる「富岳」の優れた汎用性を示すものです。また、ハードウェアの性能を最大限に活用できるソフトウェアを開発した共同研究グループの技術力の高さを示すものでもあります。今後、共同研究グループは、さらなる通信性能の最適化に加えて、冗長な探索の削減や各ノードにおけるメモリ使用量の均一化などに取り組む予定です。
<関連リンク>
理研 計算科学研究センター
https://www.r-ccs.riken.jp/jp/
注1)
本研究では以下の成果(アルゴリズムやプログラム)を活用しています。
1: 科学技術振興機構(JST)戦略的創造研究推進事業CREST「ポストペタスケール高性能計算に資するシステムソフトウェア技術の創出(研究総括:佐藤三久)」における研究課題「ポストペタスケールシステムにおける超大規模グラフ最適化基盤(研究代表者:藤澤克樹、拠点代表者:鈴村豊太郎)」
2: 科学技術振興機構(JST)戦略的創造研究推進事業CREST「ビッグデータ統合利活用のための次世代基盤技術の創出・体系化(研究総括:喜連川優)」における研究課題「EBD:次世代の年ヨッタバイト処理に向けたエクストリームビッグデータの基盤技術(研究代表者:松岡聡)」
3. 日本学術振興会
科学研究費助成事業「自動性能チューニング機能を持つ高性能グラフライブラリの開発(研究代表者:中尾昌広、研究分担者:藤澤克樹、児玉祐悦)」
4: 大規模グラフ解析プログラムの GitHubレポジトリ
https://github.com/suzumura/graph500/
参考文献
1.Masahiro Nakao, Koji Ueno, Katsuki Fujisawa, Yuetsu Kodama, and Mitsuhisa Sato. “Performance of the Supercomputer Fugaku for Breadth-First Search in Graph500 Benchmark”. ISC High Performance, June 2021, pp. 372-390. https://doi.org/10.1007/978-3-030-78713-4_20
2.Koji Ueno, Toyotaro Suzumura, Naoya Maruyama, Katsuki Fujisawa, Satoshi Matsuoka, ”Efficient Breadth-First Search on Massively Parallel and Distributed Memory Machines”, Data Science and Engineering, Springer, March 2017, Volume 2, Issue 1, pp 22-35, 2017.
3.Koji Ueno, Toyotaro Suzumura, Naoya Maruyama, Katsuki Fujisawa, Satoshi Matsuoka , "Extreme scale breadth-first search on supercomputers". 2016 IEEE International Conference on Big Data (Big Data): 1040-1047. 2016.
3.補足説明
[1] スーパーコンピュータ「富岳(ふがく)」
スーパーコンピュータ「京」の後継機。2020年代に、社会的・科学的課題の解決で日本の成長に貢献し、世界をリードする成果を生み出すことを目的とし、電力性能、計算性能、ユーザーの利便性・使い勝手の良さ、画期的な成果創出、ビッグデータやAIの加速機能の総合力において世界最高レベルのスーパーコンピュータとして2021年3月に共用を開始した。
現在「富岳」は日本が目指すSociety 5.0を実現するために不可欠なHPCインフラとして活用されている。
[2] ノード
スーパーコンピュータにおけるオペレーティングシステムが動作できる最小の計算資源の単位。「富岳」の場合は、一つのCPU(中央演算装置)と32GiB(ギビバイト)のメモリから構成される。
[3] GTEPS(ギガテップス)
TEPSはTraversed Edges Per Secondの略であり、「Graph500」ベンチマークの実行速度を表すスコア。「Graph500」ベンチマークでは与えられたグラフの頂点とそれをつなぐ枝を処理する。「Graph500」におけるコンピュータの速度は1秒間当たりに処理した枝の数として定義されている。GTEPSのGは10の9乗を表し、GTEPSは1秒当たりに処理した枝の数を10の9乗で割った値である。GTEPS値の計算には、64試行における調和平均が使用されている。
[4] Society 5.0
狩猟社会(Society 1.0)、農耕社会(Society 2.0)、工業社会(Society 3.0)、情報社会(Society 4.0)に続く、新たな社会を指すもので、第5期科学技術基本計画において日本が目指すべき未来社会の姿として初めて提唱された。IoT、ロボット、AI(人工知能)、ビッグデータといった社会の在り方に影響を及ぼす新たな技術をあらゆる産業や社会生活に取り入れ、経済発展と社会的課題の解決を両立していく新たな社会の実現を目指す。
[5] 持続可能な開発目標(SDGs)
2015年9月の国連サミットで採択された「持続可能な開発のための2030アジェンダ」にて記載された2016年から2030年までの国際目標。持続可能な世界を実現するための17のゴールと169のターゲットで構成され、発展途上国のみならず、先進国自身が取り組むユニバーサル(普遍的)なものであり、日本も積極的に取り組んでいる。(外務省ホームページから一部改変して転載)
理化学研究所(理研)、九州大学、株式会社フィックスターズ、富士通株式会社による共同研究グループ※は、スーパーコンピュータ「富岳」[1]を用いた測定結果で、大規模グラフ解析に関するスーパーコンピュータの国際的な性能ランキングである「Graph500」のBFS(Breadth-First Search:幅優先探索)部門において、世界第1位を7期連続で獲得しました。
理化学研究所(理研)、九州大学、株式会社フィックスターズ、富士通株式会社による共同研究グループ※は、スーパーコンピュータ「富岳」[1]を用いた測定結果で、大規模グラフ解析に関するスーパーコンピュータの国際的な性能ランキングである「Graph500」のBFS(Breadth-First Search:幅優先探索)部門において、世界第1位を7期連続で獲得しました。
このランキングは、現在ドイツ ハンブルクのコングレス・センター・ハンブルクおよびオンラインで開催中のHPC(ハイパフォーマンス・コンピューティング:高性能計算技術)に関する国際会議「ISC2023」に合わせて、Graph500 Committeeから5月22日(日本時間5月23日)に発表されます。
大規模グラフ解析の性能は、大規模かつ複雑なデータ処理が求められるビッグデータの解析における重要な指標です。
スーパーコンピュータ「富岳」
※共同研究グループ
理化学研究所 計算科学研究センター プログラミング環境研究チーム
チームリーダー 佐藤三久(サトウ・ミツヒサ)
上級技師 児玉祐悦(コダマ・ユウエツ)
技師 中尾昌広(ナカオ・マサヒロ)
九州大学 マス・フォア・インダストリ研究所
教授 藤澤克樹(フジサワ・カツキ)
株式会社フィックスターズ
エグゼクティブエンジニア 上野晃司(ウエノ・コウジ)
1.「富岳」測定結果
共同研究グループは、「富岳」の152,064ノード [2] (全体の約95.7%)を用いて、約4.4兆個の頂点と70.4兆個の枝から構成される超大規模グラフに対する幅優先探索問題を平均0.51秒で解きました。
「Graph500」のスコアは、137,096GTEPS(ギガテップス) [3] で前回(2022年11月時点)の性能を約33%(1ノード単位では約39%)向上させました。
<関連リンク>
Graph500ランキング
https://graph500.org
2.Graph500について
実社会における複雑な現象は、大規模なグラフ(頂点と枝によりデータ間の関連性を示したもの)として表現される場合が多いため、コンピュータによる高速なグラフ解析が必要とされています。例えば、ソーシャル・ネットワーキング・サービス(SNS)などでは、「誰と誰がつながっているか」といった関連性のあるデータを解析する際にグラフ解析が用いられます。さらにSociety 5.0[4]に向けた取り組みにおいて、IoT(Internet of Things)などの技術で取得された大量のデータをグラフに変換して計算機で高速処理することにより、新しい価値を産み出す新規ビジネスの開拓が推進されています。これらは新しい産業の創出と廃棄物排出の削減の両立を目的としており、「持続可能な開発目標(SDGs)[5]」のうち特に9(産業・技術革新・社会基盤)および11(持続可能なまちづくり)の推進に大きく寄与することが期待されています。このような多種多様な応用力を持つグラフ解析の性能を競うのが「Graph500」です。
「Graph500」には、BFS(Breadth-First Search:幅優先探索)部門とSSSP(Single-Source Shortest Path:単一始点最短路)部門があり、2010年に始まり(SSSP部門は2017年11月から)、そのランキングは年に2回更新されます。BFS部門では頂点間の枝の長さが同じグラフを扱うのに対し、SSSP部門では頂点間の枝の長さが異なるグラフを扱い、単位時間(1秒)あたりの処理数でランキングします。
「Graph500」では大規模グラフを扱うため、グラフのデータを複数台のノードに分散して配置する必要があり、「富岳」のような大規模ネットワークを持つシステムでは通信性能の最適化も重要になります。共同研究グループは、スーパーコンピュータ上で大規模なグラフを高速に解析できるソフトウェアの開発を進めており、これまでの成果として下記(1)~(4)の先進的なソフトウェア技術を高度に組み合わせることにより、今後予想される実データの大規模化および複雑化に対応可能な世界最高レベルの性能を持つグラフ探索ソフトウェアの開発に成功しています注1)。
(1)複数のノード間におけるグラフデータの効率的な分割方法
(2)冗長なグラフ探索を削減するアルゴリズム
(3)スーパーコンピュータの大規模ネットワークにおける通信性能の最適化
(4)アルゴリズムの最適なパラメータを実行時に自動探索する機構
「Graph500」のBFS部門における第1位獲得は、「富岳」が科学技術計算でよく用いられる規則的な計算だけでなく、不規則な計算が大半を占めるグラフ解析においても高い性能を発揮することを実証したものであり、幅広い分野のアプリケーションに対応できる「富岳」の優れた汎用性を示すものです。また、ハードウェアの性能を最大限に活用できるソフトウェアを開発した共同研究グループの技術力の高さを示すものでもあります。今後、共同研究グループは、さらなる通信性能の最適化に加えて、冗長な探索の削減や各ノードにおけるメモリ使用量の均一化などに取り組む予定です。
<関連リンク>
理研 計算科学研究センター
https://www.r-ccs.riken.jp/jp/
注1)
本研究では以下の成果(アルゴリズムやプログラム)を活用しています。
1: 科学技術振興機構(JST)戦略的創造研究推進事業CREST「ポストペタスケール高性能計算に資するシステムソフトウェア技術の創出(研究総括:佐藤三久)」における研究課題「ポストペタスケールシステムにおける超大規模グラフ最適化基盤(研究代表者:藤澤克樹、拠点代表者:鈴村豊太郎)」
2: 科学技術振興機構(JST)戦略的創造研究推進事業CREST「ビッグデータ統合利活用のための次世代基盤技術の創出・体系化(研究総括:喜連川優)」における研究課題「EBD:次世代の年ヨッタバイト処理に向けたエクストリームビッグデータの基盤技術(研究代表者:松岡聡)」
3. 日本学術振興会
科学研究費助成事業「自動性能チューニング機能を持つ高性能グラフライブラリの開発(研究代表者:中尾昌広、研究分担者:藤澤克樹、児玉祐悦)」
4: 大規模グラフ解析プログラムの GitHubレポジトリ
https://github.com/suzumura/graph500/
参考文献
1.Masahiro Nakao, Koji Ueno, Katsuki Fujisawa, Yuetsu Kodama, and Mitsuhisa Sato. “Performance of the Supercomputer Fugaku for Breadth-First Search in Graph500 Benchmark”. ISC High Performance, June 2021, pp. 372-390. https://doi.org/10.1007/978-3-030-78713-4_20
2.Koji Ueno, Toyotaro Suzumura, Naoya Maruyama, Katsuki Fujisawa, Satoshi Matsuoka, ”Efficient Breadth-First Search on Massively Parallel and Distributed Memory Machines”, Data Science and Engineering, Springer, March 2017, Volume 2, Issue 1, pp 22-35, 2017.
3.Koji Ueno, Toyotaro Suzumura, Naoya Maruyama, Katsuki Fujisawa, Satoshi Matsuoka , "Extreme scale breadth-first search on supercomputers". 2016 IEEE International Conference on Big Data (Big Data): 1040-1047. 2016.
3.補足説明
[1] スーパーコンピュータ「富岳(ふがく)」
スーパーコンピュータ「京」の後継機。2020年代に、社会的・科学的課題の解決で日本の成長に貢献し、世界をリードする成果を生み出すことを目的とし、電力性能、計算性能、ユーザーの利便性・使い勝手の良さ、画期的な成果創出、ビッグデータやAIの加速機能の総合力において世界最高レベルのスーパーコンピュータとして2021年3月に共用を開始した。
現在「富岳」は日本が目指すSociety 5.0を実現するために不可欠なHPCインフラとして活用されている。
[2] ノード
スーパーコンピュータにおけるオペレーティングシステムが動作できる最小の計算資源の単位。「富岳」の場合は、一つのCPU(中央演算装置)と32GiB(ギビバイト)のメモリから構成される。
[3] GTEPS(ギガテップス)
TEPSはTraversed Edges Per Secondの略であり、「Graph500」ベンチマークの実行速度を表すスコア。「Graph500」ベンチマークでは与えられたグラフの頂点とそれをつなぐ枝を処理する。「Graph500」におけるコンピュータの速度は1秒間当たりに処理した枝の数として定義されている。GTEPSのGは10の9乗を表し、GTEPSは1秒当たりに処理した枝の数を10の9乗で割った値である。GTEPS値の計算には、64試行における調和平均が使用されている。
[4] Society 5.0
狩猟社会(Society 1.0)、農耕社会(Society 2.0)、工業社会(Society 3.0)、情報社会(Society 4.0)に続く、新たな社会を指すもので、第5期科学技術基本計画において日本が目指すべき未来社会の姿として初めて提唱された。IoT、ロボット、AI(人工知能)、ビッグデータといった社会の在り方に影響を及ぼす新たな技術をあらゆる産業や社会生活に取り入れ、経済発展と社会的課題の解決を両立していく新たな社会の実現を目指す。
[5] 持続可能な開発目標(SDGs)
2015年9月の国連サミットで採択された「持続可能な開発のための2030アジェンダ」にて記載された2016年から2030年までの国際目標。持続可能な世界を実現するための17のゴールと169のターゲットで構成され、発展途上国のみならず、先進国自身が取り組むユニバーサル(普遍的)なものであり、日本も積極的に取り組んでいる。(外務省ホームページから一部改変して転載)
関連銘柄
銘柄 | 株価 | 前日比 |
---|---|---|
3687
|
1,423.0
(11/06)
|
-13.0
(-0.90%)
|
関連銘柄の最新ニュース
-
「データセンター」が12位、需要旺盛で企業収益に強力な追い風吹く<... 10/29 12:21
-
「生成AI」が4位、エヌビディア最高値圏まい進で再脚光<注目テーマ> 10/22 12:21
-
週間ランキング【値下がり率】 (10月4日) 10/05 08:30
-
週間ランキング【業種別 騰落率】 (10月4日) 10/05 08:30
-
2024年「ノーベル賞」発表目前、受賞候補者と関連銘柄を総ざらい ... 10/02 19:30
新着ニュース
新着ニュース一覧-
今日 02:47
-
今日 02:30
-
-
今日 02:14