Apache Solr ( IM-ContentsSearch for Accel Platform を利用する場合)¶
IM-ContentsSearch for Accel Platform で利用する Apache Solr の設定を行います。
設定ファイルと内容¶
IM-ContentsSearch for Accel Platform を利用するためには、Apache Solr との接続設定および、テキスト抽出設定を行う必要があります。
- Solrサーバ接続設定(solr-config.xml)
- テキスト抽出設定(solr-extractor-config.xml)
設定ファイルの内容と設定方法¶
Solrサーバ接続設定(solr-config.xml)¶
設定内容
次の内容に関する設定情報を保持します。
- Solrサーバグループ名(通常は テナント idを設定)
- Apache Solr の全文検索用 Web Application Server のURLとポート番号
- Apache Solr のindex用 Web Application Server のURLとポート番号
設定方法
次は標準で用意されているsolr-config.xmlの一部です。
<group name="default"> <searcher> <method>POST</method> <distribution-policy>FIRST</distribution-policy> <servers> <url>http://localhost:8983/solr/default</url> </servers> </searcher> <indexer> <distribution-policy>IDHASH</distribution-policy> <servers> <url>http://localhost:8983/solr/default</url> </servers> </indexer> <extractor ref="im_default" /> </group>
Solrサーバグループ名の設定
<group>のnameにSolrサーバグループ名を設定します。新規に intra-mart Accel Platform を構築する場合は、初期値の “default” のままで問題ありません。intra-mart Web Platform から移行した場合には「system-constants-config.xml」の<system-constant key=”tenant-id”>に設定する値を指定して下さい。注意
<group>/<searcher> or <indexer>/<servers>/<url>で記述されているdefaultは Apache Solr core名であり、 Solrサーバグループ名とは別ものですので変更しないでください。
Apache Solr の全文検索用 Web Application Server のURLとポート番号の設定
<group>/<searcher>/<servers>/<url>に Apache Solr 全文検索用 Web Application Server のURLとポート番号を設定します。
Apache Solr のindex用 Web Application Server のURLとポート番号の設定
<group>/<indexer>/<servers>/<url>に Apache Solr index用 Web Application Server のURLとポート番号を設定します。
テキスト抽出設定(solr-extractor-config.xml)¶
設定内容
次の内容に関する設定情報を保持します。
- 共通パラメータの設定
- テキスト抽出対象ファイルの設定
- テキスト抽出方法の設定
設定方法
次は標準で用意されているsolr-extractor-config.xmlの一部です。
<extractor name="im_default"> <default> <min-size>0</min-size> <max-size>100M</max-size> <properties> <!-- temporary directory sample for Linux --> <property name="tmpDir" type="string">/tmp</property> <!-- temporary directory sample for Windows --> <!-- <property name="tmpDir" type="string">C:\temp</property> --> </properties> </default> <mapping> <!-- Entry for text files --> <entry type="text/plain" extension="txt" max-size="1M" class="jp.co.nttdata.intra_mart.contentssearch.text.extraction.extractor.PlainTextExtractor" /> ... </mapping> </ectractor>
共通パラメータの設定
一時ディスク領域 properties/property[@name=”tmpDir”] については、必ず設定してください。intra-mart Accel Platform を実行するユーザがアクセス可能なディスク領域を指定する必要があります。テキスト抽出対象ファイルの設定
必要に応じ、任意の値に変更してください。テキスト抽出方法の設定
必要に応じ、任意の値に変更してください。