学際大規模計算機システム - 北海道大学ハイパフォーマンスインタークラウド - 北海道大学情報基盤センター

北海道大学
障害・メンテナンス情報
学際大規模計算機システム >

障害・メンテナンス情報

スーパーコンピュータの緊急保守を行うため、以下の期間、スーパーコンピュータシステム(ログインノード含む)とアプリケーションサーバのサービスを停止します。

10月18日(月) 9:00 ~ 17:00(予定)

上記の期間、スーパーコンピュータシステム及びアプリケーションサーバへのログインはできません。
また、10月18日午前9時までに終了しないと見込まれるジョブについては、上記の保守終了まで、ジョブの実行が保留(Queuedの状態)となります。(保守終了後、順次、ジョブは実行されます。)

利用者の皆様にはご不便をおかけして大変申し訳ありませんが、何卒ご理解の程よろしくお願いいたします。

保守実施のため、下記の通りサービスを停止します。利用者の皆様にはご迷惑をお掛けしますが、ご理解とご協力をお願いします。

○仮想、物理、GPU、インタークラウドパッケージ
・サービス停止: 2022/2/18(金)
・サービス再開: 2022/2/21(月)
(停止いただく時間および起動可能な時間は調整中のため,追ってお伝えいたします)

保守実施に伴い,以下の点にご注意ください。
・サーバの停止および起動は利用者様にて実施してください。
・関連するサービス(Openstackへのログイン,SSL-VPNサービス等)は利用できません。
・利用者管理ポータルは停止しませんが,申請伴う作業はサービス再開後になるためお時間を要します。 

[8/13 更新]仮想、物理、GPUサーバ、移行用サーバの停止日程が確定致しました。

北海道大学電気設備点検(全学停電)およびシステムメンテナンスのため、下記の通りサービスを停止します。利用者の皆様にはご迷惑をお掛けしますが、ご理解とご協力をお願いします。

○スーパーコンピュータサービス
・サービス停止: 9/3(金)18:00 ~ 9/8(水)13:00(予定)
・上記の間、スパコンのログインノードおよびアプリケーションサーバへ接続ができません。
(スパコンのファイルシステムも含む)
・サービス停止までに終了しないジョブは保留され、サービス再開後に順次実行されます。
・ライセンス認証が必要なアプリケーションソフトも上記の間、ご利用できません。

○仮想、物理、GPU、インタークラウドパッケージ
9月6日追記:不具合発生のため保守が長引いており、再開の目途が立っておりません。お急ぎのところ大変申し訳ございませんが、復旧まで暫くお待ちくださいますようお願いいたします。
9月6日17時追記:9/7(火)中までかかる見込みです。
9月7日追記:復旧が終わり、最後の作業を行っております。10:30再開の見込みです。

・サービス停止: 9/3(金)17:00 ~ 9/6(月)13:00(予定)9/7(火)10:20 再開済
・9/3 (金) 17時までにサーバを利用者様にて停止ください。
・サーバ起動作業についても利用者様にて実施願います。
・サービス停止時刻までにシャットダウンされていないサーバにつきましては、強制シャットダウン処理を実施いたします。これに起因してトラブル等が発生しましても一切の責を負いかねますのでご了承ください。

○移行用サーバ
・サービス停止: 9/3(金)17:00 ~ 9/6(月)13:00(予定)09:00 再開済
・移行用サーバの停止/起動作業は本センター側にて実施致します。サービス再開後はサーバの動作確認をお願い致します。

○クラウドストレージ
・サービス停止: 9/2(木)17:00 ~ 9/6(月)13:00(予定)09:00 再開済

現在、スーパーコンピュータシステムにおいて以下の現象に関する問い合わせを複数頂いております。

・pjdel コマンドでジョブをキャンセルすると、ジョブは停止しているが pjstat コマンドで表示されるリストに残り続ける場合がある
・ジョブ終了または停止後、利用者宛に「Reason: Node down.」のエラーメールが送付される場合がある

これらの現象は、ジョブ終了後に行われるシステム側の処理に時間を要してしまうことが原因で発生しております。
本現象の原因の詳細については、現在調査中です。

なお、「Reason: Node down.」のエラーが発生した場合、共有ノードでの演算時間(トークン)の消費は行われません。
終了したジョブの演算時間(トークン)は、pjstat コマンドに -H オプションをつけることで確認できます。

本現象に関してご不明点等ございましたら、HPCシステム運用担当( unyo@iic.hokudai.ac.jp )までご連絡ください。

利用者の皆様には大変ご迷惑をおかけしており申し訳ございません。

9/16 追記:
原因究明および対策を行いましたが、上記のような不具合が生じた場合には、恐れ入りますがHPCシステム運用担当までご連絡ください。よろしくお願いいたします。

以下のスケジュールで、スーパーコンピュータシステムのログインノードおよびアプリケーションサーバの定期保守を予定しています。
保守の間、ログインノードおよびアプリケーションサーバへの接続に失敗する、もしくは、接続中のセッションが切れることがありますので、ご了承ください。
なお、スーパーコンピュータにおける投入済み、もしくは実行中のバッチジョブへの影響はありません。

日時:2021年6月21日,8月16日,10月18日,12月20日,2022年2月21日,各09:00 – 12:00.

※10月18日は緊急保守を行います。
詳細はこちらをご覧ください。

2021年度のサービスを開始するに当たり、スパコンにおける、コンパイラを含む下記のソフトウェア等のデフォルトのバージョンを変更しました。
「module」コマンドにより、デフォルトのバージョンの確認や旧バージョンへの切り替えが可能です。

・Intelコンパイラ
2019u5(2019.5.281) → 2020u4(2020.3.304)

・ArmDDT
20.0.2 → 20.2.1

・AVS/Express Developer
8.4 → 8.5

・COMSOL Multiphysics
5.5 → 5.6

・FieldView
19 → 20

・MATLAB
R2019b → R2020b

・PointWise
18.3r1 → 18.4r2

2021年度のサービスを開始するに当たり、Exceed onDemandのバージョンアップを致しました。
このバージョン変更に伴い、Exceed onDemandを2020年度より継続利用される場合は再インストールが必要となります。
お手数をお掛けいたしますが、利用者ポータルより最新バージョンをダウンロードいただき、再インストールをお願いいたします。

※Windows版に関しては、インストール後にパッチの適用を忘れずに行ってください。パッチの適用は管理者権限で行う必要があります。

4/26 メンテナンスは終了しました

本学の上流側ネットワークにあたる学術情報ネットワーク(SINET5)のメンテナンス作業に伴い、下記の通り学内ー学外間のネットワーク通信が停止いたします(停止の影響は下記時間の原則10分間程度です)。

  •  停止範囲:全学ネットワーク(学内ー学外間の通信のみ)
  •  停止期間:2021年4月26日(月) AM 0:00 ~ AM 1:30(深夜)
  •  詳細:こちらのリンク先をご覧ください
        (北大は「北海道1」に該当します)

これにより、学内および学外からのスパコンログインノードへのログイン、クラウドシステム(各種サーバ、及びクラウドストレージ等)、利用者管理ポータルへの接続ができません。

※ 接続を伴わないプログラムの実行(スパコンにおける投入済み、もしくは実行中のバッチジョブ等)への影響はありません。
※ クラウドシステムを利用し公開しているホームページ等の閲覧はできません。
※ 作業の進捗状況により停止時間が変更となる場合があります。

また、スケジュールが変更となった場合は当ページでご案内いたします。

ご利用の皆様におかれましてはご不便おかけしますが、ご理解くださいますようお願いいたします。

サーバメンテナンスのため,以下の時間帯において
断続的に接続できない場合があります。

■ 保守作業時間: 2021年3月30日(火) 8:00 ~ 9:00
【日時変更】2021年3月18日(木) 13:00 ~ 15:00

■ 対象サービス等
・情報基盤センターホームページ
 https://www.iic.hokudai.ac.jp
・学際大規模計算機システムホームページ
 https://www.hucc.hokudai.ac.jp
・クラウドストレージ(Nextcloud)
 https://melon.hucc.hokudai.ac.jp
・OpenStack管理コンソール
 https://openstack.hucc.hokudai.ac.jp
・SSL-VPNサーバ
 https://vpn.hucc.hokudai.ac.jp:2554
・【対象追加】利用者管理ポータル
 https://igate3.hucc.hokudai.ac.jp/


※スパコンサービスは年度末のメンテナンス中になります 。

ご迷惑おかけしますがよろしくお願いいたします。

年度末の処理・メンテナンス等のため、以下の期間、各種サービスを休止します。

  • ●スーパーコンピュータシステム:
    • スーパーコンピュータシステム、アプリケーションサーバは年度末処理・メンテナンス等のため、2021年3月29日(月)15:00にサービスを停止します。サービスの再開は、2021年4月2日(金)14:00を予定しています。
    • 上記のサービス停止期間は、下記のシステムが利用できませんのでご了承ください。
    • ・スーパーコンピュータシステムへのアクセス
      ・アプリケーションサーバへのアクセス
      ・ダウンロード版MathematicaおよびAVS/Expressの利用
    • 上記のサービス停止までに終了しないジョブは実行されません。また、サービス停止時にジョブキューに残っているジョブは全て消去されます。
    • 2020年度の演算時間(トークン)は2021年度には引き継がれません。
    • 現在、ご利用いただいている利用者番号(スパコンのログインアカウント)を2021年度も継続してご利用いただくためには継続申請が必要です。2021年度への継続申請は2月中旬より開始する予定です。なお、継続申請が行われないアカウントのデータに関しては、2021年4月1日以降、アクセスすることができません。継続申請を行われない場合には、上記のサービス停止までに、必要なデータのバックアップ等を行うようにお願いします。
  • ●利用者ポータル:
    • 停止期間:2021年3月29日(月)15:00 ~ 2021年4月2日(金)14:00
北海道大学情報基盤センター
広報・刊行物