学際大規模計算機システム - 北海道大学ハイパフォーマンスインタークラウド - 北海道大学情報基盤センター

北海道大学
障害・メンテナンス情報
学際大規模計算機システム >

障害・メンテナンス情報

年度末の処理・メンテナンス等のため、以下の期間、各種サービスを休止します。

  • ●スーパーコンピュータシステム:
    • スーパーコンピュータシステム、アプリケーションサーバは年度末処理・メンテナンス等のため、2021年3月29日(月)15:00にサービスを停止します。サービスの再開は、2021年4月2日(金)14:00を予定しています。
    • 上記のサービス停止期間は、下記のシステムが利用できませんのでご了承ください。
    • ・スーパーコンピュータシステムへのアクセス
      ・アプリケーションサーバへのアクセス
      ・ダウンロード版MathematicaおよびAVS/Expressの利用
    • 上記のサービス停止までに終了しないジョブは実行されません。また、サービス停止時にジョブキューに残っているジョブは全て消去されます。
    • 2020年度の演算時間(トークン)は2021年度には引き継がれません。
    • 現在、ご利用いただいている利用者番号(スパコンのログインアカウント)を2021年度も継続してご利用いただくためには継続申請が必要です。2021年度への継続申請は2月中旬より開始する予定です。なお、継続申請が行われないアカウントのデータに関しては、2021年4月1日以降、アクセスすることができません。継続申請を行われない場合には、上記のサービス停止までに、必要なデータのバックアップ等を行うようにお願いします。
  • ●利用者ポータル:
    • 停止期間:2021年3月29日(月)15:00 ~ 2021年4月2日(金)14:00

インタークラウドシステムの管理系機器に障害が発生したため、以下の時間帯に緊急保守を行います。

 ■ 保守作業時間: 2021年2月2日(火) 17時~18時30分

サーバの動作や通信には影響ございません。作業中も通常通りご利用いただけます。
ただし、作業中はMCP(Openstack)管理画面およびAPIからの操作ができませんのでご注意ください。

ご迷惑おかけしますがよろしくお願いいたします。

18:05 作業は終了しました。

※作業は終了しました。

本学ネットワーク機器の更新により、下記の時間帯において学際大規模計算機システムへの接続が不可となります。

2/7(日) 2:00 ~ 8:00
2/21(日) 2:00 ~ 8:00

これにより、学内および学外からのスパコンログインノードへのログイン、クラウドシステム(各種サーバ、及びクラウドストレージ等)、利用者管理ポータルへの接続ができません。

※ 接続を伴わないプログラムの実行(スパコンにおける投入済み、もしくは実行中のバッチジョブ等)への影響はありません。
※ クラウドシステムを利用し公開しているホームページ等の閲覧もできません。
※ 作業の進捗状況により停止時間が変更となる場合があります。
また、スケジュールが変更となった場合は当ページでご案内いたします。

ご利用の皆様におかれましてはご不便おかけしますが、ご理解くださいますようお願いいたします。

本学ネットワーク機器の更新により、下記の時間帯において学外から学際大規模計算機システムへの接続が不可となります。
学内からの接続には影響ありません。

12/28(月) 12:15 ~ 13:00
※数分程度の停止が数回発生します。

これにより、学外からスパコン等のログインノードへのログイン、クラウドシステム(各種サーバ、及びクラウドストレージ等)、利用者管理ポータルへの接続ができません。

※ 接続を伴わないプログラムの実行(スパコンにおける投入済み、もしくは実行中のバッチジョブ等)への影響はありません。
※ クラウドシステムを利用し公開しているホームページ等の閲覧もできません。
※ 作業の進捗状況により停止時間が変更となる場合があります。
また、スケジュールが変更となった場合は当ページでご案内いたします。

ご利用の皆様におかれましてはご不便おかけしますが、ご理解くださいますようお願いいたします。

12/28 13:00 更新作業は終わりました。

現在、スパコンのログインノード(grand、polaire)およびアプリケーションサーバ(app)にて、コマンドが入力できない不具合を確認しており、原因の調査および復旧作業を行っております。
利用者の皆様には大変ご迷惑をおかけしており申し訳ございません。

(2020年12月2日 9:30 追記)
復旧し、正常にご利用できる状態となっております。
この度は大変ご迷惑をお掛けして申し訳ありませんでした。

本学ネットワーク機器の更新により,下記の時間帯において学際大規模計算機システムへの接続が不可となります。

12/6(日) 7:00 ~ 9:00

これにより、スパコン等のログインノードへのログイン、クラウドシステム(各種サーバ、及びクラウドストレージ等)、利用者管理ポータルへの接続ができません。

※ 接続を伴わないプログラムの実行(スパコンにおける投入済み、もしくは実行中のバッチジョブ等)への影響はありません。
※ クラウドシステムを利用し公開しているホームページ等の閲覧もできません。
※ 作業の進捗状況により停止時間が変更となる場合があります。
また、スケジュールが変更となった場合は当ページでご案内いたします。

ご利用の皆様におかれましてはご不便おかけしますが、ご理解くださいますようお願いいたします。

11/9(月)19:00頃の落雷による瞬低により,スパコンの計算ノードが 多数ダウンしました。 現在復旧作業を行っておりますが,新規ジョブの受付を一時停止いたします。

ジョブの受付が再開できた際には,追って当ページでアナウンスいたします。

スパコンご利用の皆様におかれましては大変ご迷惑をおかけしますが, ご理解くださいますようお願いいたします。

(2020年11月10日 13:45 追記)
復旧し、正常にご利用できる状態となっております。
当該時間帯に実行されていたジョブに関しては、障害の影響により異常終了している可能性がございます。
お手数をお掛けして申し訳ありませんが、ご確認の上、再投入をお願いいたします。
なお、本障害により異常終了したジョブに関しては、演算時間(トークン)の消費は行われません。
この度は大変ご迷惑をお掛けして申し訳ありませんでした。

全学停電中にクラウドストレージ(Nextcloud)のバージョンアップを実施します。
利用者の方に作業頂くことはございません。
バージョンアップ後に見た目が少し変わる部分がありますが、従来のデータと機能は引き継がれます。

10月30日追記
アップデート後のバージョン(18.0.8)において、ゴミ箱の挙動に関するバグが発見されました。 本来は、ゴミ箱へ移動したファイルをすぐ削除することはないのですが、本バグにより移動直後にゴミ箱から完全削除されて復元できないことがございます。

つきましては、以下の期間に修正作業を行います。作業中はサービスを一時停止させて頂きますので、あらかじめご了承ください。

※ 作業期間:11月4日(水)午前9:00-10:00 (サービス停止を伴います)

修正後は、ゴミ箱へ移動したファイルがすぐに削除されることはなくなります。
なお、Nextcloudはディスク容量が少なくなるとゴミ箱のファイルのうち30日を経過したものから自動削除するようになっておりますので、ゴミ箱に必要なファイルを常時保存することのないよう、お願いいたします。

11月4日 午前9:30に上記修正作業を完了しました。

北海道大学電気設備点検(全学停電)およびシステムメンテナンスのため、下記の通りサービスを停止します。利用者の皆様にはご迷惑をお掛けしますが、ご理解とご協力をお願いします。

○スーパーコンピュータサービス
・サービス停止: 9/11(金)18:00 ~ 9/15(火)13:00(予定)
・上記の間、スパコンのログインノードおよびアプリケーションサーバへ接続ができません(スパコンのファイルシステムも含む)。
・サービス停止までに終了しないジョブは保留され、サービス再開後に順次実行されます。
・ライセンス認証が必要なアプリケーションソフトも上記の間、ご利用できません。

○クラウドシステム
仮想、物理、GPU、インタークラウドパッケージ、クラウドストレージ
・サービス停止: 9/10(木)15:00 ~ 9/14(月)13:00(予定)

(2020/09/14 13:15 追記)
OpenStackおよびクラウドストレージ(Nextcloud)にて、一部アクセスできない現象を確認しており、現在調査中です。
ご利用の皆様にはご迷惑をおかけし、大変申し訳ございません。
(2020/09/14 15:50 追記)
アクセスできない不具合は解消いたしました。
ご迷惑をおかけいたしました。

移行用サーバ
・サービス停止: 9/12(土)15:00 ~ 9/14(月) 9:00(予定)

※クラウドシステムのうち、仮想、物理、GPU、インタークラウドパッケージ 利用者様におかれましては9/10(木)15:00までに停止くださいますようお願い致します。サービス停止時刻までにシャットダウンされていないサーバにつきましては、強制シャットダウン処理を実施いたします。これに起因してトラブル等が発生しましても一切の責を負いかねますのでご了承ください。

※移行用サーバの停止及び起動はセンター側で実施いたします。

現在、Grand Chariot におけるリソースグループ ea、sa、ma に投入したジョブが実行されない不具合を確認しており、原因の調査および復旧作業を行っております。
利用者の皆様には大変ご迷惑をおかけしており申し訳ございません。

(6/18 12:00追記)
復旧し、 全リソースグループでジョブが流れるようになりました。
この度は大変ご迷惑をおかけいたしました。

北海道大学情報基盤センター
広報・刊行物