

spimi算法实现的倒排索引的构建,并且对倒排索引进行了Gamma编码压缩,对词典进行了单一字符串压缩,分别写入了二进制的倒排索引文件和词典文件。源码可以在这里下载。http://download.csdn.net/detail/longmenwaideyu/8348061这其实是我刚刚上交了的现代信息检索的作业。spimi算法 内存式单遍扫描索引构建算法SPIMI(Single-pass in-memory indexing)基本思想如下 关键思想1: 对每个块都产生一个独立的词典--不需要在块之间进行term-termID的映射 关键思想2: 对倒排记录表不排序,...