2023.10.26[終了] スーパーコンピュータシステム保守のお知らせ(10/30 12:00~18:00)
スーパーコンピュータのハードウェア保守を以下の期間に実施いたします。
10/30(月) 12:00 ~ 18:00
上記期間に投入されたジョブ及び実行待ちのジョブは、メンテナンスが終わるまで実行されずQUEUED状態となります。
なお、スーパーコンピュータへのログインや、実行中のジョブに関しては影響ありません。
※ 作業の進捗状況によりメンテナンス終了時間は前後する可能性があります。
ご利用の皆様におかれましてはご不便おかけしますが、ご理解くださいますようお願いいたします。
[2023/10/30 14:00]
保守は終了いたしました。
2023.07.21[終了] 7/21 クラウドストレージ(Nextcloud)緊急メンテナンスのお知らせ
クラウドストレージ(Nextcloud)を構成するソフトウェアの一部に影響度の大きなセキュリティ上の脆弱性が発見されたため、本日緊急メンテナンスを実施致します。
メンテナンス期間はNextcloudへアクセスできませんのでご注意ください。
■ メンテナンス期間
本日 2023年7月21日(金) 13:00-15:00
利用者の皆様にはご不便をおかけして大変申し訳ありませんが、何卒ご理解の程よろしくお願いいたします。
メンテナンスは14:30に終了しました
2023.07.20[終了] 北海道大学電気設備点検(全学停電)によるサービス停止
北海道大学電気設備点検(全学停電)およびシステムメンテナンスのため、下記の通りサービスを停止します。
利用者の皆様にはご迷惑をお掛けしますが、ご理解とご協力をお願いします。
○スーパーコンピュータサービス
・サービス停止: 9/1(金)17:00 ~ 9/5(火)13:00(予定)再開済み
・上記の間、スパコンのログインノードおよびアプリケーションサーバへ接続ができません。
(スパコンのファイルシステムも含む)
・サービス停止までに終了しないジョブは保留され、サービス再開後に順次実行されます。
・ライセンス認証が必要なアプリケーションソフトも上記の間、ご利用できません。
○仮想、物理、GPU、インタークラウドパッケージ
・サービス停止: 9/1(金)17:00 ~ 9/4(月)13:00(予定)再開済み
・9/1 (金) 17時までにサーバを利用者様にて停止ください。
・サーバ起動作業についても利用者様にて実施願います。
・サービス停止時刻までにシャットダウンされていないサーバにつきましては、強制シャットダウン処理を実施いたします。これに起因してトラブル等が発生しましても一切の責を負いかねますのでご了承ください。
○クラウドストレージ
・サービス停止: 8/31(木)17:00 ~ 9/4(月)9:00(予定)再開済み
○利用者ポータル
・サービス停止: 8/31(木)17:00 ~ 9/5(火)13:00(予定)再開済み
2023.04.11[終了] スーパーコンピュータworkストレージの障害について
2023/4/8(土)10:15頃から13:30頃の間、スパコンのworkストレージにアクセス障害が発生しておりました。
この影響により、ファイルアクセスの失敗、実行中のジョブが異常終了する、ジョブの実行結果が正常に出力されないといった事象が発生した場合がございます。
同時間帯にジョブを実行されていた利用者様におかれましては、お手数をお掛けいたしますが、ご確認をお願いいたします。
本件に関しましてご不明点等ございましたら、
情報基盤センター:hsay[at]iic.hokudai.ac.jp
までお問い合わせください。
この度はご迷惑をおかけして申し訳ございません。
2023.04.03intelコンパイラのデフォルトバージョン変更について
2023年度のサービスを開始するにあたり、intelコンパイラのデフォルトバージョンを以下のように変更しました。
2020.4.304 → 2022.3.1
これにより、intel/2022.1.2 以下のバージョンでコンパイルしたモジュールを実行する際、エラーが発生する可能性がございます。
intel/2022.1.2 以下のバージョンでコンパイラしたモジュールを実行する場合は、ジョブスクリプト内で module switch コマンドにて、intelコンパイラをコンパイルしたバージョンに切り替えてください。
なお、2023年3月2日に実施した、intelコンパイラの脆弱性に関するメンテナンスにより、intel/2022.1.2 以下のバージョンにおいて、C/C++コンパイラ(icc、icx、icpc、icpx、dpcpp、dpcpp-cl)が利用できなくなりました。
C/C++コンパイラを利用される場合は、デフォルトバージョンである intel/2022.3.1 をご利用ください。
※intel oneAPI(intel/2022.3.1)のKNL対応終了により、サブシステムBのコンパイルオプション「-xMIC-AVX512」は利用できなくなりました。
2023.02.28[終了] Intelコンパイラのアップデートに伴う緊急メンテナンスについて
当センターのスーパーコンピュータにインストールしているIntelコンパイラにおいて、
脆弱性があることが発表されました。
Intel oneAPI Toolkit software Advisory
https://www.intel.com/content/www/us/en/security-center/advisory/intel-sa-00773.html
以下の内容にて、スーパーコンピュータのIntelコンパイラに関してアップデートに伴う緊急メンテナンスを実施いたします。
日時:3月2日(木) 9:00~10:00
内容:
intel/2022.1.2 以下のバージョンにおいて、C/C++コンパイラ(icc、icx、icpc、icpx、dpcpp、dpcpp-cl)が利用できなくなります。
なお、コンパイル済みのプログラムの実行に影響が出ないよう、Intelコンパイラ及びライブラリのデフォルトバージョンは intel/2020.4.304 のままとします。
・C/C++コンパイラを利用される場合は、Intelコンパイラのバージョンを intel/2022.3.1 に切り替える必要があります。
切り替えは以下のコマンドで行うことができます。
module switch intel/2022.3.1
・新しいコンパイラ(intel/2022.3.1)でコンパイルしたプログラムを実行する場合、ジョブスクリプト内でも module switch コマンドでバージョンを切り替える必要があります。
・デフォルトバージョンは変更しないため、intel/2022.1.2 以下ですでにコンパイル済みのプログラムを計算ノードで実行することは可能です。
ただし、intel/2022.1.2 以下のバージョンで C/C++ のコンパイルはできなくなりますので、バージョンを切り替えて再コンパイルされることを推奨します。
・緊急メンテナンス中、ログインやジョブの実行は問題無く行うことができますが、タイミングによってはコンパイルに失敗する可能性があります。
・アプリケーションソフトウェアに関しては、利用頻度の高いものから順次、intel/2022.3.1 バージョンで利用可能にしていきます。
・アプリケーションサーバのIntelコンパイラに関しても対応を行います。
利用者の皆様にはご不便をお掛けいたしますが、何卒よろしくお願いいたします。
本件に関しましてご不明点等ございましたら、
情報基盤センター:hsay[at]iic.hokudai.ac.jp
までお問い合わせください。
2023.02.10[終了] スパコンサービス、利用者ポータル休止予定(2022年度末)
年度末の処理・メンテナンス等のため、以下の期間、各種サービスを休止します。
●スーパーコンピュータシステム:
スーパーコンピュータシステム、アプリケーションサーバは年度末処理・メンテナンス等のため、2023年3月28日(火)15:00にサービスを停止します。
サービスの再開は、2023年4月3日(月)14:00を予定しています。
上記のサービス停止期間は、下記のシステムが利用できませんのでご了承ください。
・スーパーコンピュータシステムへのアクセス
・アプリケーションサーバへのアクセス
・ダウンロード版MathematicaおよびAVS/Expressの利用
上記のサービス停止までに終了しないジョブは実行されません。また、サービス停止時にジョブキューに残っているジョブは全て消去されます。
2022年度の演算時間(トークン)は2023年度には引き継がれません。
現在、ご利用いただいている利用者番号(スパコンのログインアカウント)を2023年度も継続してご利用いただくためには継続申請が必要です。2023年度への継続申請は2月中旬より開始する予定です。なお、継続申請が行われないアカウントのデータに関しては、2023年4月1日以降、アクセスすることができません。継続申請を行われない場合には、上記のサービス停止までに、必要なデータのバックアップ等を行うようにお願いします。
●利用者ポータル:
停止期間:2023年3月28日(火)15:00 ~ 2023年4月3日(月)14:00
2023.01.06PyTorchに不正プログラム混入のおそれ
AI学習フレームワークのPyTorchにおいて、悪意あるプログラムが混入し、場合によっては自動的にインストールされている可能性があるとして、以下の通り注意喚起が出ています。
機械学習フレームワーク「PyTorch」に不正プログラム混入のおそれ
– Security NEXT
https://www.security-next.com/142623
Compromised PyTorch-nightly dependency chain between December 25th and December 30th, 2022.
https://pytorch.org/blog/compromised-nightly-dependency/
年末の12/25-12/30にかけてPyTorchのナイトリービルドをインストールしていた場合には、不正なプログラムが存在しないか念のため確認するようお願いいたします。
2022.12.22Grandの共用ノードにおけるジョブ同時実行制限数の変更について
Grand Chariotの混雑緩和のため、本日より共用ノードにおけるジョブ同時実行制限数について
以下のように変更を行いました。
ジョブ同時実行制限数
〇変更前
sa,ma,la,ha:40
〇変更後
sa,ma,la,ha:2
どうぞよろしくお願いいたします。
2022.12.20[終了] 学際大規模計算機システムにおけるネットワーク緊急保守のお知らせ
以下の日程で緊急保守を行います。
保守の間、クラウドのSSL-VPN接続に失敗する、または、接続中のセッションが断続的に切れることがありますので、ご了承ください。
なお、学際大規模計算機システム(スパコン、クラウド等)は停止しません。
日時:令和4年12月20日(火)12:00~13:00(予定)
[メンテナンスは終わりました]