intra-mart Accel Platform / セットアップガイド

第9版 2014-02-14

«  Apache Cassandra ( IMBox を利用する場合)   ::   コンテンツ   ::   IM-Workflow用設定ファイル (シーケンスオブジェクト採番機能を利用する場合)  »

Apache Solr ( IM-ContentsSearch for Accel Platform を利用する場合)

IM-ContentsSearch for Accel Platform で利用する Apache Solr の設定を行います。

設定ファイルと内容

IM-ContentsSearch for Accel Platform を利用するためには、Apache Solr との接続設定および、テキスト抽出設定を行う必要があります。

  • Solrサーバ接続設定(solr-config.xml)
  • テキスト抽出設定(solr-extractor-config.xml)

設定ファイルの内容と設定方法

Solrサーバ接続設定(solr-config.xml)

  • 設定内容

    次の内容に関する設定情報を保持します。

    • Solrサーバグループ名(通常は テナント idを設定)
    • Apache Solr の全文検索用 Web Application Server のURLとポート番号
    • Apache Solr のindex用 Web Application Server のURLとポート番号
  • 設定方法

    次は標準で用意されているsolr-config.xmlの一部です。

    <group name="default">
       <searcher>
          <method>POST</method>
          <distribution-policy>FIRST</distribution-policy>
          <servers>
             <url>http://localhost:8983/solr/default</url>
          </servers>
       </searcher>
       <indexer>
          <distribution-policy>IDHASH</distribution-policy>
          <servers>
             <url>http://localhost:8983/solr/default</url>
          </servers>
       </indexer>
       <extractor ref="im_default" />
    </group>
    
    • Solrサーバグループ名の設定

      <group>のnameにSolrサーバグループ名を設定します。
      新規に intra-mart Accel Platform を構築する場合は、初期値の “default” のままで問題ありません。
      intra-mart Web Platform から移行した場合には「system-constants-config.xml」の<system-constant key=”tenant-id”>に設定する値を指定して下さい。

      注意

      <group>/<searcher> or <indexer>/<servers>/<url>で記述されているdefaultは Apache Solr core名であり、 Solrサーバグループ名とは別ものですので変更しないでください。

    • Apache Solr の全文検索用 Web Application Server のURLとポート番号の設定

      <group>/<searcher>/<servers>/<url>に Apache Solr 全文検索用 Web Application Server のURLとポート番号を設定します。

    • Apache Solr のindex用 Web Application Server のURLとポート番号の設定

      <group>/<indexer>/<servers>/<url>に Apache Solr index用 Web Application Server のURLとポート番号を設定します。

コラム

「Apache Solr のセットアップ」については、次のリンクを参照してください。

テキスト抽出設定(solr-extractor-config.xml)

  • 設定内容

    次の内容に関する設定情報を保持します。

    • 共通パラメータの設定
    • テキスト抽出対象ファイルの設定
    • テキスト抽出方法の設定
  • 設定方法

    次は標準で用意されているsolr-extractor-config.xmlの一部です。

    <extractor name="im_default">
      <default>
        <min-size>0</min-size>
        <max-size>100M</max-size>
        <properties>
          <!-- temporary directory sample for Linux -->
          <property name="tmpDir" type="string">/tmp</property>
          <!-- temporary directory sample for Windows -->
          <!--
          <property name="tmpDir" type="string">C:\temp</property>
          -->
        </properties>
      </default>
    
      <mapping>
        <!-- Entry for text files -->
        <entry type="text/plain" extension="txt" max-size="1M" class="jp.co.nttdata.intra_mart.contentssearch.text.extraction.extractor.PlainTextExtractor" />
        ...
      </mapping>
    </ectractor>
    
    • 共通パラメータの設定

      一時ディスク領域 properties/property[@name=”tmpDir”] については、必ず設定してください。
      intra-mart Accel Platform を実行するユーザがアクセス可能なディスク領域を指定する必要があります。
    • テキスト抽出対象ファイルの設定

      必要に応じ、任意の値に変更してください。
    • テキスト抽出方法の設定

      必要に応じ、任意の値に変更してください。

«  Apache Cassandra ( IMBox を利用する場合)   ::   コンテンツ   ::   IM-Workflow用設定ファイル (シーケンスオブジェクト採番機能を利用する場合)  »