OVERVIEWシステム概要

学際大規模計算機システム

スーパーコンピュータ
研究クラウド
クラウドストレージ
大判プリンタ

学際大規模計算機システム(システム全体)の概要

概要

北海道大学情報基盤センターは、スーパーコンピュータシステムとクラウドシステムから構成される「学際大規模計算機システム」を更新し、FUJITSU Server PRIMERGYシリーズを中核とする新学際大規模計算機システムを導入しました。新システムは2025年4月より稼働し、7月より本格運用を開始する予定です。本システムは、北海道大学をはじめとする全国の大学・研究所における計算科学、計算機科学、データ科学、AI科学関連の研究開発に活用されるとともに、革新的ハイパフォーマンス・コンピューティング・インフラ(HPCI)*1、学際大規模情報基盤共同利用・共同研究拠点(JHPCN)*2の公募型共同研究へ資源を提供し、大学など学術関係の研究者に加えて、企業など民間を含む全国の研究者を支援します。さらに計算科学、計算機科学、データ科学、AI科学に関わる教育や人材育成にも活用し、各分野の発展への貢献が期待されます。本システムの導入により、北海道大学情報基盤センターは、なお一層の社会貢献に寄与してまいります。

システムの詳細

スーパーコンピュータシステムは、旧システムに対して2.27倍となる9 ペタフロップス*3の理論演算性能を有する演算システムである“Grand Chariot 2”と、16.95 ペタバイト*4の物理容量を有するストレージシステムを高性能なインフィニバンド*5ネットワークで結合したシステムとなっています。演算システムは、Intel社製第5世代Xeonプロセッサを搭載した504台の計算ノードで構成され、そのうちの24台のノードはNVIDIA社製GPU*6コンピューティングカードH100をノード当たり4台搭載します。一方ストレージシステムは、記憶媒体がフラッシュメモリー(SSD)のみで構成されたオールフラッシュストレージとなります。本システムでは、旧システムと同様に占有コースと共用コースの2種類のコースを提供し、共用コースの一部をHPCI、JHPCN、当センターが実施する共同研究プログラムのための計算資源として提供します。また本システムでは、演算性能を増強し、旧システムの利用者を含むより多くの研究者の研究活動をサポートするとともに、新たに導入したGPUノード群により、AI・機械学習分野におけるニーズにも対応します。

研究クラウドシステムは、ディスアグリゲートコンピューティング技術のPRIMERGY CDIを採用し、Intel社製第5世代Xeonプロセッサを搭載したPRIMERGYサーバと、NVIDIA社製GPU H100およびNVMe SSDをPCIeファブリック経由で柔軟に接続し、管理します。ソフトウェアではSUSE Rancher Primeを採用し、従来の仮想化環境からKubernetesによるコンテナ環境に移行します。また本クラウドシステムでは、上記の基盤技術をもとにJupyter環境による対話的な計算サービス、および共有・占有Kubernetesクラスタによるアプリケーション導入環境を提供します。

さらに、北見工業大学に遠隔アーカイブシステムを設置し、重要なデータについては定期的に遠隔システムのテープアーカイブ装置へバックアップをすることで、災害時における研究データの安全性にも留意したシステムとなっています。

用語解説

*1 HPCI (High Performance Computing Infrastructure): 理化学研究所計算科学研究センターのスーパーコンピュータ「富岳」を中核とした全国の大学・研究機関に設置されたスーパーコンピュータやストレージを高速ネットワーク(SINET6)で結び、多様なユーザニーズに応える革新的な共用計算環境基盤(https://www.hpci-office.jp)。

*2 JHPCN (Joint Usage/Research Center for Interdisciplinary Large-scale Information
Infrastructures): 北海道大学、東北大学、東京大学、東京科学大学、名古屋大学、京都大学、大阪大学、九州大学のスーパーコンピュータを持つ8つの施設を構成拠点とし、東京大学情報基盤センターがその中核拠点として機能する「ネットワーク型」共同利用・共同研究拠点。大学の研究施設を全国の研究者の利用に供する拠点として、文部科学大臣の認定を受けている(https://jhpcn-kyoten.itc.u-tokyo.ac.jp/ja/)。

*3 ペタフロップス:PFLOPS(Peta Floating-point Operations Per Second)。コンピュータの処理性能を測る単位で、1秒間に10の15乗(1,000,000,000,000,000)回の計算(浮動小数点演算)ができる能力を表す。

*4 ペタバイト:PB(Peta Bytes)。コンピュータストレージの容量を示す単位で、10の15乗(1,000,000,000,000,000)バイトを表す。

*5 インフィニバンド:InfiniBand。計算ノード間を高速に接続するネットワーク技術。

*6 GPU:Graphics Processing Unit の略。グラフィック処理のための専用の計算処理装置として開発され、現在は大規模計算処理や、AI(人工知能)・機械学習関連の計算処理にも活用されている。