5.3.3.5. IM-ContentsSearch

IM-ContentsSearch for Accel Platform で利用する Apache Solr の設定を行います。

5.3.3.5.1. IM-ContentsSearch の機能

intra-mart Accel Platform で全文検索機能を実現するためのモジュールです。
全文検索機能を利用するためには「Apache Solr」サーバを構築する必要があります。
検索対象を追加するには検索対象追加モジュールを追加する必要があります。

コラム

  • Apache Solr のセットアップについては、「 Solr管理者ガイド 」を参照してください。

  • 追加した検索対象のコンテンツを全文検索機能で検索できるようにするためには、検索対象追加モジュールの機能に含まれているジョブをジョブスケジューラ機能で実行する必要があります。
    IM-ContentsSearch のジョブ・ジョブネットについては「 ジョブ・ジョブネットリファレンス 」を参照してください。

5.3.3.5.2. IM-ContentsSearch モジュールの利用

IM-ContentsSearch モジュールを利用する場合は、IM-Juggling で IM-ContentsSearch モジュールを選択してください。
IM-Juggling のプロジェクト作成時の初期設定では、IM-ContentsSearch モジュールは選択済みになっています。
Overview of IM-ContentsSearch Module Select

5.3.3.5.3. IM-ContentsSearch 検索対象追加モジュールの利用

検索対象追加モジュールを変更する場合、IM-ContentsSearch > IM-ContentsSearch 検索対象追加機能 のモジュールのツリー配下のモジュールを変更してください。
Overview of IM-ContentsSearch Add Module Select

5.3.3.5.4. Solrサーバ接続設定(solr-config.xml)

設定内容

Solrサーバへの接続設定情報を保持するファイルです。

注意

solr-config.xmlの設定値は、intra-mart Accel Platform 2014 Spring(Granada)から使用用途が変更されました。
設定方法

以下は標準で用意されているsolr-config.xmlの一部です。

<group name="default">
   <searcher>
      <method>POST</method>
      <distribution-policy>FIRST</distribution-policy>
      <servers>
         <url>http://localhost:8983/solr/default</url>
      </servers>
   </searcher>
   <indexer>
      <distribution-policy>IDHASH</distribution-policy>
      <servers>
         <url>http://localhost:8983/solr/default</url>
      </servers>
   </indexer>
   <extractor ref="im_default" />
</group>
設定項目
solr-config.xmlの要素
タグ 説明 必須 設定値 デフォルト値 複数設定
<group>
Solrサーバグループ名を設定します。
<group>のnameにSolrサーバグループ名を設定します。
初期値の “default” のままで問題ありません。
Solrサーバグループの設定 なし
<searcher>
IM-ContentsSearchが検索時に接続するSolrサーバを設定します。
検索用Solrサーバの設定 なし ×
<method>
IM-ContentsSearchが検索時にSolrサーバへ送るリクエストのメソッドを設定します。
通常はPOSTから変更する必要はありません。
× 検索時に使用するリクエストメソッドの設定 POST ×
<distribution-policy>
IM-ContentsSearchが検索リクエストを送るSolrサーバを選択するポリシーを設定します。
検索用と索引作成用で利用可能なポリシーが異なります。
× 検索用Solrサーバの選択ポリシー設定 FIRST ×
<servers>
IM-ContentsSearchが検索時に接続するSolrサーバ一覧を設定します。
Solrサーバ設定は配下のurlタグで行います。
検索用Solrサーバ一覧の設定 なし ×
<url>
IM-ContentsSearchが検索時に接続するSolrサーバのURLを設定します。
Solrサーバを構築しているホストのアドレス、および、ポート番号を指定してください。
URL内の「default」は Apache Solr core名であり、Solrサーバグループ名とは別の設定値であるため、変更しないでください。

参考: 各Web Application Serverのデフォルトのポート番号
Resin 8080
Tomcat 8080
Jetty 8983
検索用SolrサーバのURLの設定 なし
<indexer>
IM-ContentsSearchが索引作成時に接続するSolrサーバを設定します。
索引作成用Solrサーバの設定 なし
<distribution-policy>
索引作成用サーバを選択するポリシーを設定します。
検索用と索引作成用で利用可能なポリシーが異なります。
× 索引作成用Solrサーバの選択ポリシー設定 IDHASH ×
<servers>
IM-ContentsSearchが索引作成時に接続するSolrサーバ一覧を設定します。
Solrサーバ設定は配下のurlタグで行います。
索引作成用Solrサーバ一覧の設定 なし ×
<url>
IM-ContentsSearchが索引作成時に接続するSolrサーバのURLを設定します。
defaultは Apache Solr core名であり、Solrサーバグループ名とは別の設定値であるため、変更しないでください。
索引作成用SolrサーバのURLの設定 なし
<extractor>
IM-ContentsSearchが索引作成時にテキスト抽出するファイルの設定グループを指定します。
ref属性にsolr-extractor-config.xmlに定義されたテキスト抽出設定グループIDを指定します。
テキスト抽出設定グループの指定 なし ×

5.3.3.5.4.1. intra-mart Accel Platform 2014 Spring(Granada)からの変更点

intra-mart Accel Platform 2014 Spring(Granada)以降のバージョンをご利用の場合、solr-configの設定値は以下のように使用用途が変更されました。
  • 初回テナント環境セットアップ時、または、Solr接続設定が1件も登録されていない場合のテナント環境セットアップ時に登録されるSolr接続設定
  • Solr接続設定新規作成画面の初期値

コラム

<group>のnameが”default”である設定のみ使用されます。

5.3.3.5.5. テキスト抽出設定(solr-extractor-config.xml)

設定内容

以下の内容に関する設定情報を保持するファイルです。

  • 共通パラメータの設定
  • テキスト抽出対象ファイルの設定
  • テキスト抽出方法の設定
設定方法

以下は標準で用意されているsolr-extractor-config.xmlの一部です。

<extractor name="im_default">
  <default>
    <min-size>0</min-size>
    <max-size>100M</max-size>
    <properties>
      <!-- temporary directory sample for Linux -->
      <property name="tmpDir" type="string">/tmp</property>
      <!-- temporary directory sample for Windows -->
      <!--
      <property name="tmpDir" type="string">C:\temp</property>
      -->
    </properties>
  </default>

  <mapping>
    <!-- Entry for text files -->
    <entry type="text/plain" extension="txt" max-size="1M" class="jp.co.nttdata.intra_mart.contentssearch.text.extraction.extractor.PlainTextExtractor" />
    ...
  </mapping>
</ectractor>
設定項目
solr-extractor-config.xmlに設定する項目を記載します。
一部の要素のみ記載しているため、詳細は 設定ファイルリファレンス テキスト抽出設定 を参照してください。
solr-extractor-config.xmlの要素(一部)
タグ 説明 必須 設定値 デフォルト値 複数設定
<extractor>
一つのテキスト抽出設定グループを表します。
name属性にはテキスト抽出設定グループの名称を指定します。
テキスト抽出設定グループ なし
<min-size>
テキスト抽出対象ファイルサイズ最小値の既定値を設定します。
× テキスト抽出対象ファイルサイズ最小値の既定値 0 (制限なし) ×
<min-size>
テキスト抽出対象ファイルサイズ最大値の既定値を設定します。
× テキスト抽出対象ファイルサイズ最大値の既定値 0 (制限なし) ×
<property>
プロパティの既定値を設定します。
× プロパティ既定値の設定 なし

注意

一時ディスク領域 (propertyタグのname属性”tmpDir”) は必ず設定してください。
指定するディレクトリは、 intra-mart Accel Platform の実行ユーザからアクセス可能である必要があります。