使用词向量和余弦相似度进行文本查重Word2vec是一种用于自然语言处理的算法,它可以将文本中的单词表示为高维向量,这些向量可以被用来计算单词之间的相似度。而余弦相似度是一种用于计算向量之间相似度的度量方法,本文使用word2vec和余弦相似度结合的方法来进行文本的查重。发布于 2023-06-24deep-learning