반응형 CosineSimilarity1 코사인 유사도 (Cosine Similarity) 문서를 유사도를 기준으로 분류 혹은 그룹핑을 할 때 유용하게 사용할 수 있는 코사인 거리(Cosine Distance) 입니다. 코사인 유사도(Cosine Similarity)는 특징 벡터 X, Y 에 대해서 벡터의 곱(X*Y)을 두 벡터의 L2 norm (즉, 유클리드 거리) 의 곱으로 나눈 값입니다. 벡터의 곱(X*Y) ------------------- 벡터의 L2 norm (즉, 유클리드 거리) Cosine Similarity (d1, d2) = Dot product(d1, d2) / ||d1|| * ||d2|| Dot product (d1,d2) = d1[0] * d2[0] + d1[1] * d2[1] * … * d1[n] * d2[n] ||d1|| = square root(d1[0]2 + d1.. 2020. 12. 1. 이전 1 다음 반응형