JAVA基础：lucene中对不同的域使用不同的分析器

会计考友 · 发表于 2012-8-4 12:37:27

在lucene使用过程中，如不美观要对统一IndexWriter平分歧Document，分歧Field中使用分歧的analyzer，我们该若何实现呢？　　经由过程对《lucene in action》的阅读，发现是可以解决这一问题的。lucene可以正对折个IndexWriter对象或者每一个document对象或者特定Field使用分歧的剖析器。
　　Analyzer analyzer = new StandardAnalyzer();
　　IndexWriter writer = new IndexWriter(direcotry, analyzer, true); //
　　Document doc = new Document();
　　doc.add(new Field("title", "this is title", Field.Store.COMPRESS,Field.Index.TOKENIZED,Field.TermVector.WITH_POSITIONS_OFFSETS));
　　doc.add(new Field("content", "this is content", Field.Store.COMPRESS,Field.Index.TOKENIZED,Field.TermVector.WITH_POSITIONS_OFFSETS));
　　writer.addDocument(doc); //这是年夜部门情形下使用的一个体例
　　其实还有此吐矣闽体例，原型如下：
　　lucene自带文档写道
　　addDocument(Document doc, Analyzer analyzer) Adds a document to this index, using the provided analyzer instead of the value of getAnalyzer().
　　所以我们还可以写成这样：
　　writer.addDocument(doc, analyzer); // 这里的analyzer是指此吐矣闽你指定的analyzer，分歧于膳缦沔的StandardAnalyzer
　　那么若何针对特定Field使用分歧剖析器呢，lucene包琅缦沔有个PerFieldAnalyzerWrapper类，解决了这一问题，这是lucene的文档琅缦沔的一段话：
　　lucene自带文档写道
　　Example usage:
　　PerFieldAnalyzerWrapper aWrapper = new PerFieldAnalyzerWrapper(new StandardAnalyzer());
　　aWrapper.addAnalyzer("firstname", new KeywordAnalyzer()); aWrapper.addAnalyzer("lastname", new KeywordAnalyzer());
　　In this example, StandardAnalyzer will be used for all fields except "firstname" and "lastname", for which KeywordAnalyzer will be used.
　　A PerFieldAnalyzerWrapper can be used like any other analyzer, for both indexing and query parsing. PreFieldAnalyzerWrapper类的机关函数中需要一个默认的分谓ㄔ祺为参数。为了给分歧的Field指定分歧的analyzer，就需要挪用该类的addAnalyzer()体例。膳缦沔的E文相信巨匠都能看懂的，就不需要我来翻译了，我的英语很差，焦心啊，呵呵。
　　也就是说巨匠页堪蝉始化剖析器的时辰用这一句:
　　Analyzer analyzer = new StandardAnalyzer();
　　此刻可以改用
　　PerFieldAnalyzerWrapper analyzer = new PerFieldAnalyzerWrapper(new StandardAnalyzer());
　　然后如不美观需要特定域的剖析器就挪用addAnalyzer体例
　　analyzer.addAnalyzer("fieldname", new KeywordAnalyzer());
　　对了，最后说一下，PerFieldAnalyzerWrapper类也是在org.apache.lucene.analysis包下面的，只需要 import org.apache.lucene.analysis.PerFieldAnalyzerWrapper;

		自动登录	找回密码
密码			立即注册

[基础知识] JAVA基础：lucene中对不同的域使用不同的分析器