分享

总结:机器学习之Jaccard相似度

 瓜爷耶 2022-07-30 发布于湖北

 一、介绍

Jaccard相似系数 用于比较有限样本集之间的相似性和差异性。

定义:给定两个集合A和B, jaccard 系数定义为A与B交集的大小与并集大小的比值 ,jaccard值越大说明相似度越高。

up-fb7f2cb29e472de4a11179c146e66e1ac70.png

得出的 Jaccard相似系数值在0到1之间。

当A和B都为空时,jaccard(A,B)=1;

与Jaccard 系数相关的指标叫做Jaccard 距离,用于描述集合之间的不相似度。Jaccard 距离越大,样本相似度越低。公式定义如下:
up-b9c81d17003a77f72b3c0855b8bc59c2975.png

二、

参考:

常见文本相似度计算方法简介 

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多