分享

hash算法MD5

 头号码甲 2022-12-03 发布于北京

import hashlib

hash算法其实就是给指定字符串一个唯一身份标识

data = 'python38'

创建hash对象

md5 = hashlib.md5()

向hash对象中添加需要做hash运算的字符串

md5.update(data.encode())

获取字符串的hash值

res = md5.hexdigest()

hash 值可以用来校验从网站下载的文件是否被动过手脚,官网会给处一个文件的hash值

hash 还可以用来做url地址的去重,保存更多的url,布隆过滤器更牛逼(保存大数据)的去重:url集合去重,url-hash去重,url布隆过滤器去重;simhash进行海量文本去重,编辑距离

print(res)

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多