バイオ系研究室のサーバー導入~OS・DB編~
昨日までの4日間連続で、「バイオ系研究室のサーバー導入」(松・竹・梅・タイリングアレイ編)と題しまして、
目的ごとにどのような構成のハードウェアを購入したら良いかオススメしてきましたが、
今回はソフトウェア面、特にOSとデータベースについてご紹介したいとおもいます。
企業が提供するホームページや、NCBIなどの公共性の高いホームページでは
システムの堅牢性や安定性を伴ったノンストップでの運用が求められますが、
研究室内のサーバーでは高い堅牢性や安定性よりも、むしろコスト面が最重要課題だとおもいます。
そこで、OSではフリーのLinuxである「CentOS」と「Ubuntu」につきまして、
思いつく特徴を述べます。(詳細はネット上を検索すれば山ほど情報は得られます)
【CentOS 5.3 64bit】 公式サイト
個人的には一番利用しているOS。
Red Hat Enterprise Linux(RHEL)がベースであるため、信頼性が高い。
パッケージ管理システム「yum」により、アプリケーションの追加や削除が容易。
(バイオインフォマティクス系のアプリケーションも)
広く普及しているRedHat系なので、Web上にドキュメントが豊富。
ISOファイルをダウンロードし、CD-RやDVD-Rに焼いて利用。
【Ubuntu】 公式サイト
最近注目されているOS。Debian系。
RedHat系とはコマンドなどの「作法」が異なるので、個人的には利用していない。
パッケージ管理システム「apt」により、アプリケーションの追加や削除が容易。
Debianと並んで、Web上にドキュメントが豊富。
デスクトップとしての利用に優れている印象。
次に、オープンソースのデータベースシステムです。
【PostgreSQL】 公式サイト
個人的に一番利用しているデータベースシステム(RDBMS)。
安定版のバージョン8.3.xを利用中。
機能が豊富で、大規模DBに対応。
(ただし、現在はMySQLも機能豊富かつ大規模DBに対応している)
以前から利用しているので、操作に慣れている。
【MySQL】 公式サイト
UCSC Genome Browserを始め、公開データベースに対応している場合が多いため、利用頻度は高い。
最近のバージョンでは、MySQLもPostgreSQLも大差はない。
ただし、Windows版ではMySQLのIndex動作がPostgreSQLと比べて
極端に遅い事例があり、個人的にはPostgreSQLの利用をすすめる。
次回はプログラム言語等を紹介したいとおもいます。