バイオ系研究室のサーバー導入~タイリングアレイ編~

今日は具体的な事例として、SNPアレイ(illumina社のGoldenGate・Infiniumなど)や
マイクロアレイ(Affymetrix社のチップなど遺伝子発現)を行う研究室の
サーバー導入についてご紹介いたします。

両者を総称した「タイリングアレイ」での実験では、
以下の点に注意が必要です。

  • ファイルサイズの大きなスキャンデータ(画像データ)の保存
  • スキャンデータから得られた、生の測定データの保存
  • 生データを補正(ノーマライズ)した実データのデータベース化
  • NCBIなどの公共データベース(アノテーション、リファレンス)
  • 実データの解析
  • 検索・閲覧のためのインターフェース
  • セキュリティとバックアップ

以上のことから、以下の構成を推奨したいとおもいます。

【構成】
CPU: Xeon 5500番台(2.4GHz~)
メモリ: 8GB~
HDD(内蔵): 1TB x 2台(RAID 1)→データベース、ファイルストレージ
HDD(外付け): 1.5TB x 4台(RAID 1+0)。ネットワーク接続。→スキャンデータ保存、バックアップ
OS: 無し(フリーのLinuxであるCentOSやUbuntuを自前でインストール)
UPS: 1200~
形状: タワー型サーバー

【メーカー】
HP: ラインアップ一覧、オススメ機種 “ML330 G6”
オンライン見積非対応。60万円~(推測)。

Dell: ラインアップ一覧、オススメ機種 “PowerEdge T410”
オンライン見積で上記構成だと50万円~60万円。

外付けHDD:TeraStation ラインアップ一覧、オススメ機種 “TS-X6.0TL/R5″(定価 \178,500)

【コメント】

  • Dellに問い合わせたところ、HDDの最大容量は1TBで、この容量だとRAID 1+0構成ができない。
  • 750GBだと4台でRAID 1+0構成が可能。(未確認情報だが、1.8TBの壁がある?)
  • TeraStationでは、1.5TB x 4台のRAID 1+0構成でOK(実効容量 3.0TB)。
  • SNPにしても遺伝子発現にしても、解析に必要なデータベースや解析ソフトをどうするかが最大の問題です。→高価だが専用ソフトを購入する or 自前で構築する
  • 個人的には、専用ソフトは「かゆいところに手が届かない」というか、不必要に高機能なわりに、調べたいことが調べられないことが多かったので、自前で構築がオススメです。現在はオープンソースやフリーの解析ツールが揃っています。

【注釈】
「ホットスワップ」と「ホットプラグ」は同じ意味で、稼働中のまま機器(HDDなど)を抜き差しできることです。

コメント

タイトルとURLをコピーしました