地球知识年鉴 IP属地:辽宁

认证科学领域优质作者

文章 关注 粉丝 访问 贡献
 
共 11 篇文章
显示摘要每页显示  条
算法推荐系统的用户数据的内容数据都是大规模的数据,而商用级别的应用又要求较高的数据读取速度和可靠的数据安全性能,因此需要使用高性能的分布式存储系统进行数据的存储和管理。分布式存储系统采用可扩展的系统结构将数据分散存储在网络中多台独立设备上,利用多台存储服务器分担存储负荷,利用位置服务器定位存储信息实现数据读取,它在可...
“半结构化数据”介于结构化数据和非结构化数据之间,其数据具有一定的结构,即可以使用标签或其他类型的标记方式识别出来半结构化数据中的特定元素,但是数据本身并不具备严格的结构,因此缺乏结构严谨的数据模型。而非结构化用户画像中,每个用户的标签数目各不相同,并且通过一个用户会具有成百上千个标签,对于千万或亿级用户的系统而言,...
【算法新闻】新媒体背景下内容生产的采写。横向维度,是指事物的外部,发掘与该事物关联的更多的同类事物,或者发掘与该事物相互影响的事物,寻找事物间的先关性。内容生产者不是传统意义上的媒体工作者,往往不具备新闻内容生产的原创资格,所有经过确认和引用的相关内容必须要著名原本的出处、原始的作者,所有引用的原话要用换字体、加重加...
【算法新闻】内容预处理和内容安全一、数据预处理。从人工标记的风险内容中提取元事件或元模型,针对系统中的新内容,尝试识别新内容是否符合元事件或元模型的特点,并标记相关内容。如果经过人工审核发现申诉内容系误判为违法违规等情况,则可以由人工审核方进行内容标记的更改,将相关内容标记为合法内容,并引入候选内容数据库。在算法推荐...
【算法新闻】大数据与算法推荐系统一、推荐系统的数据依赖。用户行为分析 是指系统获取用户使用行为的有关键数据并进行统计、分析,从中发现用户使用习惯的规律,并将这些规律用于改进只能推荐算法。对于一些电商平台或付费类的内容推荐平台,由于涉及用户的支付行为,因此需要分析用户在何种心理情境下容易发生消费行为,识别出影响用户消费的...
协同过滤算法基本思路是,通过分析用户的历史行为(如购买行为、内容浏览行为、阅读行为等),建立用户的兴趣模型,随后再依据用户的兴趣特征给用户作出产品或内容的推荐。基于用户的协同过滤,依据用户的相似度给用户推荐项目,其中对用户相似度的衡量来自用户喜欢过的项目集合的重合程度,是依据项目的相似度,给项目查找潜在的用户,其中对...
【算法新闻】内容的建模和分析——以文本型内容为例。2. 文本型内容的建模和分析。在文本建模中,一种对文本的抽象方法就是建立向量空间模型,使用多维向量来表述词和文本。使用计算机算法对文本内容进行聚类和主题词的挖掘时,生成的类别,主题和关键词具有一定的相关性,但是由于某些类别可解释性不强,因此不能明确指出这些类别的具体语义,...
构建用户画像的核心工作是给用户“打标签”,其中,“标签”是通过分析用户信息得来的高度精炼的特征标识。具体地,对于新注册使用系统用户,可以使用其基本信息标签(年龄、性别、手机类型、网络特征、地理位置)查找系统已有用户中与新用户相似度较高的用户,把用户归类为这些用户所属的类别中,从而使用相应的用户类别的内容推荐规则进行有...
【算法新闻】算法分发系统概览。推荐系统的推荐领域并不局限于推荐数字化的内容,而是根据用户的信息需求、兴趣等,将用户感兴趣的信息、商品等推荐给用户,在算法推荐系统出现之前,用户为了解决信息过载的问题,可以使用搜索引擎,通过指定一定的查询关键词,由搜索引擎返回相关文档和网页,与搜索引擎相比,推荐系统通过研究用户的兴趣偏好...
【算法新闻】算法分发的基本流程对内容生产的驱动型改变。基于内容的推荐即根据用户历史项目进行文本信息特征抽取,过滤,生成规模型,向用户推荐与历史项目内容相似的信息。关联规则推荐即基于用户历史数据挖掘用户数据背后的关联,以分析用户的潜在需求,向用户推荐其感兴趣的信息。基于该算法的信息推荐流程主要分为两个步骤:①根据当前用...
帮助 | 留言交流 | 联系我们 | 服务条款 | 下载网文摘手 | 下载手机客户端
北京六智信息技术股份有限公司 Copyright© 2005-2024 360doc.com , All Rights Reserved
京ICP证090625号 京ICP备05038915号 京网文[2016]6433-853号 京公网安备11010502030377号
返回
顶部