1. 算法分发的基本原理 分发是整个资讯传播中生态中直接接触终端用户的最后一环节。最理想化的传播图景是分发平台上涵盖着所有用户需要的所有新闻内容、资讯和广告,同时也通过各种方式了解到用户所有的已知需求和潜在需求;平台实现所推送的每条信息都有用,每条资讯都被喜欢,都想知道,都应该知道,即不匮乏,也不冗余,新闻资讯的质量也正好符合本人的接收品位。 (1)协同滤过推荐 它包括两种主要的推荐技术——基于记忆协同过滤和基于模型协同过滤。前者假设如果两个用户对产品有相似的喜好,那么他们现在对产品仍有相似的喜好;后者假设如果某个用户过去喜欢某种产品,那么该用户现在仍喜欢与此产品相似的产品。 (2)基于内容的推荐 基于内容的推荐即根据用户历史项目进行文本信息特征抽取,过滤,生成规模型,向用户推荐与历史项目内容相似的信息。它的优点之一就是解决了协同过滤中数据稀少时无法准确判断分发问题。 (3)关联规则推荐 关联规则推荐即基于用户历史数据挖掘用户数据背后的关联,以分析用户的潜在需求,向用户推荐其感兴趣的信息。基于该算法的信息推荐流程主要分为两个步骤:①根据当前用户阅读过的感兴趣的内容,通过规则推导出用户还没有阅读过的可能感兴趣的内容;②根据规则的支持度,对这些内容排序展现给用户。 2. 算法分发的现实操作流程 平台首先要对这些新闻内容进行消重,把内容相似的东西消除掉。 目前算法平台所使用的消重方法,有根据内容消重、根据标题消重、根据预览图片消重和根据相似组织消重买这些工作已经全部可以由机器来完成,机器会自动根据对相似内容辨认,把完全重复的内容消除掉。 消重后进入新闻内容的审核流程。及其主要对新闻内容进行初步审核,把不符合法律法规、社会道德规范,从新闻专业角度来衡量属于严重违规的内容剔除。而人工审核会着重看标题、正文、是否将广告包装成了推广的信息等等。 新闻内容顺利通过重重审核的话,就会正式进入“大池子”等待推送分发。这一步由推荐引擎来完成。推荐引擎通过智能识别,把新闻内容推荐给不同用户。 这一步骤下的推荐包含三个类别,分别是启动、扩大和限制。 第一步启动。在这个类别中又分为全新用户的偏好启动和老用户的偏好启动。对于老用户,第一步,要把这个用户订阅账号的更新内容第一时间向他推荐。这一步推送的精准度很高。 第二步,要看这位用户的既往浏览数据,这一步的信息颗粒度是很粗的。此外,机器要从更加纵深的角度去收集这个用户的兴趣点。 其次是用系统框定一定数量用户。 扩大推荐是指对于某个点击率、阅读时长都明显高于平均水平的新闻内容,系统会将它自动筛选出来,并向更多的人进行推荐。但在扩大推荐的过程中,系统也会依据用户的反馈进行调整。 限制推荐是指某个点击率、阅读时长都明显低于平均水平的新闻内容,会被系统自动筛选出来,添加标注。这样的内容会被缩小推荐范围。 需要注意的是,作出扩大推荐或限制推荐的决定,也是会讲过人工复审,因为有时候评论是来自价值观判断而不是针对新闻内容质量本身,这样的评论就会被人工筛选出来,降权处理,不作为判断的主要依据。 |
|