中国开发网: 论坛: 程序员情感CBD: 贴子 254058
sonfly: 这样建索引有点大了吧,你分析整个文章呢,文章中的句子都要分词吧
这样建索引有点大了吧,你分析整个文章呢,文章中的句子都要分词吧


   可以按字做索引


  中  在文章A的位置 在文章B的位置 在文章C的位置
  国  在文章A的位置 在文章B的位置 在文章C的位置
  开  在文章A的位置 在文章B的位置 在文章C的位置
  发
  网




    在查 中国开发网的时候 先找出各个字的位置, 再找有共同文章的ID,这样就找到文章了。


  这样中国有10000多个个汉字, 其它就是数字, 点的空间小一点吧。


  只是这样想没有实现过

相关信息:


欢迎光临本社区,您还没有登录,不能发贴子。请在 这里登录