逆行最长法模拟中文分词
主题:从主题表获取了20条主题
叙词:叙词表中存储的叙词(一种规范的检索词,用以提高检全率和检准率)
停用词:停用词表中存储的停用词(主题中无法搜索出意义的词,例如副词、连词、介词,他们出现的几率也较高等)
切词:由于中文的词语之间没有空格划分,那么要让机器理解语意,那么只能通过算法将语句中的词语给切分出来匹配