ペタバイト級データサイエンス統合クラウドストレージの導入について

情報基盤センターでは、平成26年4月からペタバイト級データサイエンス統合クラウドストレージサービスを開始しています。本システムは、総物理容量約2PBの大容量クラウドストレージと500コアのサーバによるクラウドシステムで構成され、HPCI(革新的ハイパフォーマンス・コンピューティング・インフラ)とJHPCN(学際大規模情報基盤共同利用・共同研究拠点)に資源提供することを目的としており 、主に当該課題採択者に提供しています。

システムの概要を以下に示します。


システム概要
1.クラウド統合ストレージシステム
 

クラウド統合ストレージシステムはWOS7000,GridScaler NAS,GS-WOS Bridgeの構成で総物理容量1.96PBです。

ストレージは以下の3種類の用途に分けられます。
 

1)Amazon S3互換のオブジェクトストレージ,WebDAVストレージ
Amazon S3互換のオブジェクトストレージとして、また、WebDAVによるクラウドストレージとしての利用が可能です。
本ストレージはHPCIとJHPCNの課題採択者の他、本センターの一般利用者も利用できます。WebDAVストレージは専用のクライアント(Windows, Mac OS, iOS(近日予定), Android)も提供しています。
 

2)Gfarmストレージ
データサイエンスクラウドシステムの仮想サーバと連携し、gfarmストレージとして利用できます。
 

3)仮想サーバの追加ストレージ
データサイエンスクラウドシステムの仮想サーバと連携し、NFSストレージとして利用できます。
 

2.データサイエンスクラウドシステム
 

データサイエンスクラウドシステムは、HA8000/RS210で25台のノード構成になります。1ノードはインテルXeon E5-2670v2 (2.5GHz 10コア)×2CPU,主記憶容量は80GB,ディスク容量は2.4TBです。
XenServer6.2とCloudstack4.2.1により仮想サーバを構築、設定できます。仮想サーバのOSはCentOS6.4です。主なソフトウェアとして、Apache Hadoop、Mahout、Rなどビッグデータの処理に必要なパッケージを提供しています。
仮想サーバのイメージ作成は予め用意されたパッケージを選択し、利用者自身で自由にシステムを構築できます。Webサービス APIによる仮想サーバの構築、設定、運用も可能です。

この他、HA8000/RS210を占有して利用するサービスも提供しています。OSはCentOS6.4です。(OSの入れ替えはできません。)