Linux環境への Cassandra のインストール¶
ここでは Linux環境への Cassandra のインストール方法を説明します。
項目
ファイルの展開¶
Apache Cassandra の取得 でダウンロードした、<apache-cassandra-1.1.12-bin.tar.gz>ファイルを任意のパスに展開します。コラム
本書では、例として次のディレクトリを指定します。
「/usr/local/cassandra」
コラム
/usr/local/apache-cassandra-1.1.12として展開されたものを/usr/local/cassandraにシンボリックリンクしておくと、バージョンアップの際などにアクセスが容易になります。# ln -s /usr/local/apache-cassandra-1.1.12 /usr/local/cassandra
各種設定¶
ファイルディスクリプタ数の変更¶
OSの設定により、運用中にIOException, FileNotFoundException 等が発生し、 Cassandra が正常に動作しなくなる場合があります。原因は、 Cassandra のプロセスが利用(オープン)できるファイル数の上限がOSにより制限されている上限を超える為に発生します。つまり、/etc/system/limits.conf または/etc/security/limits.confで設定されるOSのファイルディスクリプタ数を環境に合わせた以下の数を追加することにより、回避することができますので、適切な値に変更してください。* soft nofile 32768 * hard nofile 32768 root soft nofile 32768 root hard nofile 32768※ ユーザ及び値はサンプルです、環境に合わせて適切な値を設定してください。
コラム
ファイルディスクリプタの現在の設定値は、
ulimit -nで確認できます。
メモリの設定¶
Linux環境の場合、</usr/local/cassandra/conf/cassandra-env.sh>により起動時に「Xmx」:最大ヒープサイズは、
- 搭載メモリ量が、2048MB以下の場合、搭載メモリの半分
- 搭載メモリ量が、2049MB以上、4099MB以下の場合、1024MB
- 搭載メモリ量が、4100MB以上、32768MB以下の場合、搭載メモリ量の1/4
- 搭載メモリ量が、32769MB以上の場合、搭載メモリ量の8196MB
に自動設定されます。任意に設定したい場合は、 </usr/local/cassandra/conf/cassandra-env.sh>の#MAX_HEAP_SIZE="4G" #HEAP_NEWSIZE="800M"のコメントアウトを外し、任意の値を設定してください。
注意
MAX_HEAP_SIZEに設定する値は「512M」以上にしてください。「512M」より小さい値を設定した場合、正常に動作しない恐れがあります。Cassandraとしては1GB以上に設定することを推奨されています。HEAP_NEWSIZEはMAX_HEAP_SIZEの設定値に応じて適切な値を設定してください。
環境変数に JDKをインストールしたホームディレクトリを追加します。¶
Cassandra を実行するユーザの環境変数に、次のように設定します。
変数 JAVA_HOME 値 JDK をインストールしたホームディレクトリ
Cassandra の設定¶
</usr/local/cassandra/conf/cassandra.yaml>ファイルをエディタで開きます。
データの保存場所の指定¶
- データの保存場所を指定します。
「data_file_directories」プロパティに任意のパスを指定します。指定したディレクトリが無い場合、起動時に自動で作成されます。data_file_directories: - /var/lib/cassandra/data
CommitLogの保存場所の指定¶
- コミットログの保存場所を指定します。
「commitlog_directory」プロパティに任意のパスを指定します。指定したディレクトリが無い場合、起動時に自動で作成されます。# commit log commitlog_directory: /var/lib/cassandra/commit_log/1.1.12
キャッシュデータの保存場所の指定¶
- キャッシュデータの保存場所を指定します。
「saved_caches_directory」プロパティに任意のパスを指定します。指定したディレクトリが無い場合、起動時に自動で作成されます。# saved caches saved_caches_directory: /var/lib/cassandra/saved_caches/1.1.12コラム
- Cassandraをバージョンアップする際には、旧バージョンのデータを新バージョンのデータとして引き継いで利用します。
- バージョンアップについての詳細は、Cassandra のバージョンアップ をご覧ください。
他の Cassandra との通信用アドレスの指定¶
- 他の Cassandra との通信用アドレスの指定します。
Cassandraでは、JavaのInetAddress.getLocalHost()で取得されたIPアドレスで、他のCassandraとの通信を受け付けますが、複数のアドレスがある場合、明示的に通信に利用するIPアドレスを指定する必要があります。listen_address: 192.168.xxx.xxx(任意のIPアドレス) rpc_address: 192.168.xxx.xxx(任意のIPアドレス)1台のみで運用する場合は、127.0.0.1(localhost)のままで問題ありません。
設定上の注意¶
OSとJDKバージョンの組み合わせにより、JVMパラメータのXssが不足し、Cassandraの起動に失敗する場合があります。以下の組み合わせにおいて発生することを確認しています。
- OS: Linux系OS
- JDK: Oracle JDK 1.7u40 , Oracle JDK 1.7u45
回避方法
上記の事象は、${cassandra}/conf/cassandra-env.shに設定されているXssの値を変更することで回避可能です。
Cassandraのバージョンが、1.1.4の場合
if [ "`uname`" = "Linux" ] ; then # reduce the per-thread stack size to minimize the impact of Thrift # thread-per-client. (Best practice is for client connections to # be pooled anyway.) Only do so on Linux where it is known to be # supported. if startswith "$JVM_VERSION" '1.7.' then # JVM_OPTS="$JVM_OPTS -Xss160k" JVM_OPTS="$JVM_OPTS -Xss228k" else JVM_OPTS="$JVM_OPTS -Xss128k" fi fiCassandraのバージョンが、1.1.12の場合
if [ "`uname`" = "Linux" ] ; then # reduce the per-thread stack size to minimize the impact of Thrift # thread-per-client. (Best practice is for client connections to # be pooled anyway.) Only do so on Linux where it is known to be # supported. # u34 and greater need 180k # JVM_OPTS="$JVM_OPTS -Xss180k" JVM_OPTS="$JVM_OPTS -Xss228k" fi