用語集¶
IM-ContentsSearch にて利用する用語について説明します。
- ACI
- Authority Control Id の略称
- Apache Lucene
- Lucene
- Apache Solr
- Solr
- 権限を操作するためのIDです。
- Crawler
- クローラ を参照
- Extractor
- Extractor
- N-gram
文字列をN文字ずつ切り出し、その結果を単語(トークン)として扱う解析方法です。標準では2文字ずつ切り出す bi-gram が設定されています。但し、連続した1バイト文字は1つの単語として扱われます。解析の詳細な挙動は、 Apache Solr の設定によって変化します。- Whitespace
空白を区切り文字として単語(トークン)に分解する解析方法です。主に英語など、単語間をスペースで区切る言語の解析方法として用います。解析の詳細な挙動は、 Apache Solr の設定によって変化します。- インデックス
- インデックス
- エクストラクタ
- エクストラクタ
- クエリ
- クエリ
- クローラ
- インデックスを作成するための...
- コンテンツ
- コンテンツ
- スコア
- スコア
- スニペット
- スニペット
- ハイライティング
- ハイライティング
- ハイライト
- ハイライト
- ファセット
- ファセット
- 動的ファセット
- 動的ファセット
- 形態素解析
文字列を形態素解析処理により単語(トークン)に分解する解析方法です。辞書の定義によって解析結果を変更することが可能です。解析の詳細な挙動は、 Apache Solr の設定によって変化します。- 検索結果テンプレート
- 検索結果テンプレート