这好像是机器学习的范畴.比如两个文本Ma,Mi所对应的特征项所组成的向量为V(Ma),V(Mi).
这里的特征项指的是,文本中有意义的短语,词语之类的.
上面这个公式就是计算两个向量的夹角的余弦.如果余弦值为1,代表夹角为0,两者相似度最高.若余弦值为-1,代表两者相似度最低.
具体解释见这里.
这好像是机器学习的范畴.比如两个文本Ma,Mi所对应的特征项所组成的向量为V(Ma),V(Mi).
这里的特征项指的是,文本中有意义的短语,词语之类的.
上面这个公式就是计算两个向量的夹角的余弦.如果余弦值为1,代表夹角为0,两者相似度最高.若余弦值为-1,代表两者相似度最低.
具体解释见这里.