2015/1/10 9:1:37翻牌: 7573临幸: 3
    spimi算法实现的倒排索引的构建,并且对倒排索引进行了Gamma编码压缩,对词典进行了单一字符串压缩,分别写入了二进制的倒排索引文件和词典文件。源码可以在这里下载。http://download.csdn.net/detail/longmenwaideyu/8348061这其实是我刚刚上交了的现代信息检索的作业。spimi算法    内存式单遍扫描索引构建算法SPIMI(Single-pass in-memory indexing)基本思想如下    关键思想1: 对每个块都产生一个独立的词典--不需要在块之间进行term-termID的映射    关键思想2: 对倒排记录表不排序,...