バイオ系研究室のサーバー導入~タイリングアレイ編~
今日は具体的な事例として、SNPアレイ(illumina社のGoldenGate・Infiniumなど)や
マイクロアレイ(Affymetrix社のチップなど遺伝子発現)を行う研究室の
サーバー導入についてご紹介いたします。
両者を総称した「タイリングアレイ」での実験では、
以下の点に注意が必要です。
- ファイルサイズの大きなスキャンデータ(画像データ)の保存
- スキャンデータから得られた、生の測定データの保存
- 生データを補正(ノーマライズ)した実データのデータベース化
- NCBIなどの公共データベース(アノテーション、リファレンス)
- 実データの解析
- 検索・閲覧のためのインターフェース
- セキュリティとバックアップ
以上のことから、以下の構成を推奨したいとおもいます。
【構成】
CPU: Xeon 5500番台(2.4GHz~)
メモリ: 8GB~
HDD(内蔵): 1TB x 2台(RAID 1)→データベース、ファイルストレージ
HDD(外付け): 1.5TB x 4台(RAID 1+0)。ネットワーク接続。→スキャンデータ保存、バックアップ
OS: 無し(フリーのLinuxであるCentOSやUbuntuを自前でインストール)
UPS: 1200~
形状: タワー型サーバー
【メーカー】
HP: ラインアップ一覧、オススメ機種 “ML330 G6”
オンライン見積非対応。60万円~(推測)。
Dell: ラインアップ一覧、オススメ機種 “PowerEdge T410”
オンライン見積で上記構成だと50万円~60万円。
外付けHDD:TeraStation ラインアップ一覧、オススメ機種 “TS-X6.0TL/R5″(定価 \178,500)
【コメント】
- Dellに問い合わせたところ、HDDの最大容量は1TBで、この容量だとRAID 1+0構成ができない。
- 750GBだと4台でRAID 1+0構成が可能。(未確認情報だが、1.8TBの壁がある?)
- TeraStationでは、1.5TB x 4台のRAID 1+0構成でOK(実効容量 3.0TB)。
- SNPにしても遺伝子発現にしても、解析に必要なデータベースや解析ソフトをどうするかが最大の問題です。→高価だが専用ソフトを購入する or 自前で構築する
- 個人的には、専用ソフトは「かゆいところに手が届かない」というか、不必要に高機能なわりに、調べたいことが調べられないことが多かったので、自前で構築がオススメです。現在はオープンソースやフリーの解析ツールが揃っています。
【注釈】
「ホットスワップ」と「ホットプラグ」は同じ意味で、稼働中のまま機器(HDDなど)を抜き差しできることです。