分享

2017网易号运营白皮书

 惜戀 2017-05-02

二、内容相关

2.1审核规范和细则

为了让内容更加优质,可读性更强,网易号致力打造出更加健康的内容生态,每一篇文章都需要通过审核。

2.1.1 标题问题

标题出现以下几种情况都会影响推荐,请各位作者慎重。

  • 标题含错别字;
  • 标题不完整/不通顺;
  • 标题含特殊符号;例如:?、?、?、□、?、★、㊣、?、?、~\(≧≦)/~等等
  • 标题全部英文/外文、含繁体字;
  • 标题与内文无关,用词过于夸张,涉嫌标题党吸引流量;
  • 标题涉嫌恶俗;恶俗标题指含有辱骂性质的口头语,如他妈的(tm)、卧槽(我擦/我操/我艹)、傻逼(B)、尼玛、二逼(B)、日了狗、老子、劳资等。
  • 色情低俗/反动违法标题; 色情低俗涉及词汇参考下图

2.1.2 正文问题

(1)正文格式
  • 全文繁体字、全文英文
  • 全文/大段乱码、未分段或无标点
  • 内容不完整或重复(文字/图片)
  • 特殊符号特别多,大段乱码
(2)广告
  • 硬广告 文章含有营销购买信息,且广告的对象为单一的某产品或品牌
  • 铺垫式广告 前面写一大段内容,后面推出某个产品或品牌。
  • 自我营销 账号发自家产品软文或广告
(3)低质抄袭
  • 以图片为主体/图文夹杂的文章,3张以下(不含3张),内容不完整/不丰富;
  • 以文字为主体的文章,内容不完整/不丰富,一段内容/五行以下(不含五行);
  • 全文内容以文字截图组成或者以一张长截图(图解内容除外)
(4)推广

这里的推广包括:二维码推广、电话号码(热线、公益、事业单位、政府机关除外)、网盘链接、广告图、购物链接等。

(5)严重广告行为

以下文末广告行为是网易号0容忍的:

  • 推广文字中含有原油/期货/现货投资交易/沥青/贵金属/黄金白银铜/天然气等词汇的堆砌;
  • 非财经账号,含有财经类推广和联系方式;
  • 推广里含有关注肾健康、男人困扰、男人问题、增大、增粗、延时、变硬、时间短、不举等关键词;
  • 文章正文/文末以文字或者图片形式推广治疗颈椎腰椎病、治疗关节炎、治疗多囊、治疗盆腔炎、根治胃炎、治疗肝病申请肝病补助、风湿痛风三高疾病、白癜风、鼻炎、不孕不育等、便秘、荨麻疹、缩阴、痛经、咽炎,脚气、灰指甲、耳鼻喉疾病、痔疮等;
  • 文章正文/文末推广教授做微商如何引流、微商加好友、微商如何赚钱等且含有大水印图片推广信息;
  • 在正常文章中夹杂玩微盘赚钱\关注“xx”微信或者公众号赚钱、聚力钱锦、XX粥广告、XX膏广告、XX狗粮(馋比乐狗粮等)、懒推宝(lantuibao)、玖紧(久紧)安全套;或文中文末推广买卖流量类;
  • 文章正文/文末/插图水印推 推广佛牌fopai/推广中带有收购、出手、鉴定、交易、买卖关键词/留有个人联系方式;
  • 文章正文/文末/插图水印推广胎儿性别、基因检测/生男生女偏方推广;
  • 文中/文末以文字或者图片形式推广丰胸/治疗脱发、生发/推荐(护肤、祛痘、祛斑、减肥)方法方案/推荐(护肤、祛痘、祛斑、减肥)老师专家顾问个人微信号的;
  • 文末文字/图片含有推广创业导师、销售经验、销售技巧、直销等推广信息的;
  • 文章正文/文末/插图水印有推广非正规渠道办证/麻将扑克作弊技巧/抢红包作弊软件(红包外挂)/买卖收腹衣等推广信息的;

2.2内容推荐

网易号作者创作的文章,传输到推荐系统后,就进入到随时待命的状态,被机器推荐分发给用户。推荐系统如何将文章,智能地推荐到各个感兴趣的用户面前呢?打个比方,我们把一篇文章比喻为一个包裹,推荐系统就是一个高效的快递员,快递员之所以能将包裹准确地送到用户手中,就是因为他知道用户的住址,并通过精确识别包裹上的地址,送到用户的手中。

2.2.1 推荐系统如何识别文章的“地址”呢?

一篇文章,包含了标题、正文、来源等多种信息,这些信息都是文章的重要组成部分。人看到一篇文章,标题是第一印象,读完文章以后,会通过大脑抽象、归纳、解析后,得到的最有价值、最有代表性的信息,形成对这篇文章的记忆和认知。

推荐系统正是通过深度学习人的大脑认知,对文章进行特征的识别,判断文章是什么分类、属于什么领域,提取出该文章最有价值的信息是什么、最吸引人的是什么。也许你已经猜到了,这就是一篇文章的类别、关键词或者标签,这些信息就构成了文章最基本的“地址”。

2.2.2 机器是怎么识别这些“地址信息”呢?

首先是充分利用标题中的有效信息。俗话说“题好文一半”,标题既是一篇文章的包装纸,吸引用户点击打开观看里面的内容,又是一篇文章重要信息的提炼展示。机器会充分提取标题中的实体词,用于文章的分类、关键词等特征提取。所以在创作时,既要注意保证标题的吸引力,又要注意不能有太多的不符合常规用法的词。例如村通网、厉害了我的哥等词,对于机器来说,可能存在一定的识别困难,导致它不能从标题中提取有用信息。

尽可能地在标题中使用有意义的实体词,减少语气助词、虚词、数词等,能够让机器更好地理解文章。例如同样一篇讲述明星时尚的文章,“范冰冰杨幂蒋欣也有画错妆的时候,有点惊悚!”这个标题就比“你见过他们画错妆的样子吗?有点惊悚!”体现出了更多文章中的代表性信息,能够让机器更精确得识别文章特征,获得更多的推荐机会。

其次是文章正文中词的频率和性质。一篇文章在机器识别过程中,会被解析成字、词等粒度的语料,系统根据这些字、词的频率和性质,判断文章的特征。与我们人的经验认知一样,一般而言,我们判断一篇娱乐类文章是关于电影新片的报道,往往从字里行间中出现频率较高的明星名字、电影片名、电影专业术语得出结论的,例如周星驰、朱茵、大话西游、翻拍等词。机器也会从文章出现的高频词中,识别这些词并进行判断。

另外,语气助词、虚词、介词等,尽管出现频率较高,但由于这种词在各类文章中都经常出现,机器对这些词会进行特殊处理,不作为文章的关键词。机器提取出关键词后,会将这些词用分类模型等进行分析,选取命中分类词库比例最大的,作为文章的分类标签。例如一篇文章,提取出的关键词是周星驰、朱茵、大话西游、翻拍,那么该文章很有可能同时被打上娱乐、电影、经典电影等类别或标签。

2.2.3哪些用户会接收到你的文章呢?

文章有自己的特征,用户也有自己的特征。推荐系统要做到把文章推荐给对它感兴趣的用户,不仅要识别文章的特征,也要对用户有全方位、动态化的认知,只有这样,才能充分了解用户的阅读兴趣。而用户的特征和阅读兴趣,就是机器从大量的数据中分析出来的。

这些数据包括什么呢?

  1. 用户的基本信息
    • 性别、年龄、职业、地理位置等
    • 机型、品牌、账号(包括第三方登录账号)等;
  2. 用户直接表明兴趣的行为
    • 关注的栏目
    • 订阅的网易号
    • 搜索的话题
    • 用户主动反馈的不感兴趣类别、关键词等
  3. 智能分析计算得到的用户兴趣偏好
    • 阅读/分享/收藏过的文章分类、关键词等
    • 相似用户的喜好

机器从这些数据中分析用户的兴趣偏好,数据积累得越多,机器对用户的判断准确性越高。也就是说,一个用户产品使用时间越长、点击等行为越丰富,机器越能建立全面立体的用户兴趣模型。

与文章的特征一样,用户的兴趣偏好也有类别、关键词等标签。一个用户既可能有周星驰、吴孟达、梁家辉、iPhone、马云、阿里巴巴等关键词的阅读兴趣,也可能有电影、港台电影、手机、互联网、科技等分类标签兴趣。没有两个用户的标签是完全一样的。

推荐系统的个性化推荐,可以简单理解为这样一个实现过程:当我们识别到某个用户有周星驰、港台电影的兴趣时,我们会在文章中寻找带周星驰或者港台电影标签特征的文章,将这些文章与用户进行智能匹配,实现个性化推荐。

2.2.4其他影响推荐的因素

很容易想到,如果根据上述原理,单纯依赖于文章的分类、关键词标签和用户的分类、关键词标签匹配进行推荐,那么每天在网易号有数万篇文章被生产,其中相同的分类、关键词标签的文章肯定不少,这些文章难道最终都被推荐给相同的用户、拥有相同的推荐量吗?

当然不是!

我们希望优质的、受欢迎的内容能够被更多用户看到,对于不优质、不受用户欢迎的内容,则尽可能避免推荐资源浪费。因此,在文章生产后,机器会有一个初始投放的过程。在初始投放时,我们将文章推荐给与这篇文章特征最匹配的用户,这些用户由于对文章所在分类、领域等关注度高、感兴趣,他们对文章的质量判断相对而言也具有较好的可信度。这些用户的行为数据反馈,包括点击率、分享数、收藏数、阅读进度、读完率等,对后续的推荐起了非常重要的作用,数据表现越好,被认为文章越受用户欢迎,越有机会获得更多的曝光。

此外,文章还会具有一定的时效性。一篇文章的时效性有24小时、48小时、72小时、一周等。文章的时效性也会影响到推荐的周期和顺序。举个例子,一篇文章刚进入推荐系统时,系统会通过类别、关键词等找最感兴趣的用户1000个,如果这批用户被推荐这篇文章后,点击率很高,系统会认为这篇文章很受用户的欢迎,它将会把文章推荐给更多用户,如果下一轮被推荐的用户仍然表现为对文章很感兴趣、点击率高,那么文章会被再次扩大推荐范围,获得更多的推荐量。 以此类推,只要文章在每一轮扩大推荐保持较好的数据表现,推荐量就会不断扩大,直到过了文章的时效性。

从上述机制,不难发现,想要获得高的推荐量,就必须创作一篇受用户欢迎的文章,来拉动各项数据指标。

1、好的标题和配图,提升点击率。直接的方法就是创作出吸引人的好标题,设置与文章主旨相符的、引人入胜的好配图。当然,吸引人的标题不能过度创作,变成夸张的标题党,系统对于识别出是标题党的文章,是会打压推荐量的。

2、文章引人入胜,提高用户阅读时长和读完率。这就要求作者的正文,图文并茂,具有较高的可读性,吸引读者读完文章、较长时间停留在正文阅读页。如果标题很吸引人,用户点击进来发现正文写的不好,会马上跳出页面,这样,用户阅读时间过短,系统会识别为虚假点击,影响文章的数据表现。

3、观点实用、独到,提高用户的收藏数、分享数、跟贴数。很多用户有分享、收藏的行为,如果文章质量佳、实用性强,用户会自发地收藏或者转发;而文章观点独特、吸引用户跟贴,更能提升文章的数据表现。

4、内容合规,避免被用户举报投诉、负面评论。我们设置了虚假新闻、低质量、低俗等投诉选项,如果用户投诉达到一定数量,文章将会被系统识别打压;用户评论中如果出现一定数量的负面评论,也会影响文章的推荐量扩大。

5、保持账号的优质性。我们对账号也会进行质量评级,如果该账号一贯以来,发表的文章产量稳定、质量好、受用户欢迎,那么我们将会在推荐量上给予其下一篇文章的鼓励。当然账号的质量评级是动态进行监控的,如果发现账号最近的文章质量下降了,我们也会取消其原有的质量评定和推荐量激励。

2.2.5文章的数据表现为什么不好?

作者最关心的、同时也是最能影响文章在推荐系统的后续效果的,就是推荐量、点击率这两个数据。有些作者可能对文章的推荐量、点击率表现不好存在疑虑。在这里对这两个数据简单进行解读。

(1)推荐量低

相似文章过多,被去重;同话题文章过多,内容供过于求。很多作者擅长抓住热点加以发挥创作,这样能够吸引主流用户,但由于很多作者都有这个倾向,导致一部分文章集中在某一个话题或者领域,甚至相似度过高,被系统去重。这个很好理解,100篇同话题文章,对应10000个用户,和10篇同话题文章,对应10000个用户,每篇文章的用户获得的推荐量肯定是不一样的。

感兴趣或者潜在用户人数少。推荐系统的机制就是将文章推荐给感兴趣的用户。如果文章涉及的话题、事件过于冷门、晦涩难懂,鲜有用户问津,那么系统能为文章找到的感兴趣用户或者潜在感兴趣用户较少,导致推荐量低。

时效性短。一些文章发布后,受内容或者话题时效性影响,时效性非常短,会影响到推荐量。

内容存在审核和投诉等合规性风险。如果文章不符合审核管控规定,会被审核员认为不可推荐;如果文章过了审核,但推荐过程中被用户投诉或者负面反馈过多,也会被系统下撤停止推荐,影响推荐量。

(2)点击率低

标题吸引力不足。标题对用户无吸引力,文章的点击率自然就不高。

配图不够吸引人。资讯阅读往往是碎片化时间进行,视图表现对吸引用户点击至关重要,如果图片平淡无奇或者图文不符,用户自然失去点击的动力。

文章特征不明显,识别成本高。如果作者发表的文章跟该账号之前的文章类别差别很大,比如一个财经类的账号,发表了一篇体育类文章,对于系统来说,增加了分类的识别成本;如果作者本身发表的文章涉猎广泛,文章的标题和正文能命中类别词库的词也很少,系统提取关键词、识别分类的成本也会很高。这些都会影响推荐效率,从而影响点击率。这就希望作者尽可能地在自己擅长的垂直领域进行专业化创作,保证高水平的点击率。

2.3视频相关

2.3.1网易号视频发布规范

1.视频标题字数限制

① 为确保网友阅读体验,网易号作者上传的视频的标题字数应保证在11字到27字之间。

② 请尽量使用中文标题,标题中外文字符或特殊符号过多时,将会影响视频正常发布。

③ 视频标题过于夸张耸动,与视频内容不符,将影响视频分发至网易新闻客户端头条等相应位置,并影响账号星级。

视频规则
2.视频标签及视频分类添加规则

为确保视频能够准确分发给目标用户,需要根据视频内容,为视频添加标签并选择合适的视频分类。

视频标签添加规则:

  • ① 视频标签为必填,最少应添加3个,最多可添加5个
  • ② 每个标签需控制在10个字以内,输入超过10个字时自动截断
  • ③ 输入标签后按回车,即成功生成一个标签,可点“X”删除;
  • ④ 标签应以实体名字为主,如周杰伦、空巢老人、深圳、泰坦尼克号、奥运会、唐朝等。现象级动词次之,如诈骗、穷游、出轨、离婚、刮擦等。避免使用形容词、语气词等。
视频规则

视频分类添加规则:

  • ① 根据视频内容,为视频选择恰当的分类。共有2级分类,一级分类必填,二级分类选填(分类越详细越有利于推荐)。
  • ② 视频分类选项可搜索,支持模糊搜索。
视频规则

2.3.2网易号视频推荐标准

审核包括机器审核和人工审核,网易号视频是先审后发机制,所有上传的视频都会经过编辑人工审核,把关视频内容然后按照标题、关键词、兴趣点、分类等派单给机器进行个性化分发。机审和人审会对视频进行过滤,根据视频具体情况,决定是否推荐到信息流。

1.如视频未通过审核,视频不会得到推荐。

视频只有通过审核后,才会进入推荐系统。因不符合平台规范,没有通过审核的视频,将被管理员审核下线处理。

2.视频下发范围

所有审核通过的视频都能出现在网易新闻客户端,并推送给相关用户,符合下发要求的视频,将在网易新闻头条板块以及网易新闻视频板块下发。原创和优质内容,能获得平台更多推荐。

3.哪些视频不会被推荐?
  • ① 标题错误
    • 标题不符合基本的语言规范。标题含有错别字、不完整、多字、不通顺,会被退回修改。
    • 标题含特殊符号。出现如:?、?、?、□、?、★、㊣、?、?、~(≧≦)/~等符号,需要退回修改。
    • 标题全部为英文/外文或含有繁体字。
  • ② 标题内容问题
    • 标题含特殊/敏感信息,会被退回修改。
    • 标题涉嫌不雅甚至恶俗。如他妈的(tm)、卧槽(我擦/我操/我艹)、傻逼(B)、尼玛、二逼(B)、日了狗、撸管等,视频直接不予推荐。
  • ③ 视频内容问题
    • 视频内容低质、低俗,无看点、图片叠加的视频等直接不予推荐;
    • 视频不完整或重复,视频缺失或有多个重复的片段,影响整体观看体验,直接不予推荐;
    • 视频内容为旧闻,以视频具体发表时间为准,发布网络上5天前存在的内容,且非长时效内容,将其判断为旧闻,直接不予推荐;
  • ④包含推广信息
    • 视频中含有二维码、电话号码、网址链接、非单纯夹杂微信号、QQ等信息等营销性质的推广,直接不予推荐;
    • 硬广、软广、恶意推广类广告信息

2.3.3视频原创

1.什么样的作品算原创?
  • 由创作者个人或团队自制的作品,且拥有持续创作的能力,并对该内容拥有合法版权。
  • 二次创作程度高、具有独特个性,品牌知名度的账号;
  • 获得创作者授权使用视频内容,拿到授权书或企业盖章的同意书,拥有发行传播权。如:火星文化、新片场等代理公司。
2.什么样的作品不能「声明原创」?
  • 抄袭、下载他人及网络上的视频后重新上传的内容。
  • 二次创作程度低的视频作品。二次创作程度低是指在现有视频图像素材基础上,进行简单的剪辑或加入简单的片头片尾、字幕、音乐等。如:剪辑热播电视剧片段、对非原创视频进行简单添加字幕、配音等内容,均不能声明原创。
  • 制作简易的作品。「简易」的标准为:短时间内可以批量生产、内容不具备不可替代性。
  • 无看点、无价值的视频拍摄。如内容空洞、缺乏策划,随手录制的内容等。
  • 整合网络素材,添加简单的解说或口播(或使用配音软件)复述视频里的内容,且无个人观点、无明显风格的视频作品。目前多见于娱乐、以及一些社会新闻的视频。
  • 多人合力制作的视频作品,以其中某个人的名义发出,不能声明原创。该个人获得了正规授权的情况除外。如某演员出演了某个电视剧,以演员本人名义发布该电视剧片段,非授权情况下,不能声明原创。
  • 未获授权而发布的视频,不能声明原创。如未经授权发布的演唱会、舞台剧、音乐节录制视频等。
  • 衡量游戏解说类视频的原创情况,需考察解说内容和解说时长。解说内容需要包含一定有价值信息,解说内容如为游戏过程中的对话、语气词、客观描述等, 不能声明原创。解说时长过短的游戏解说视频,也不能声明原创。
  • 毫无意义的录屏、上传直播流等均不能作为原创。

2.3.4如何开通视频原创功能

  1. 登录网易媒体开放平台后,可以通过后台界面左侧菜单的「账号设置」-「账号特权」-「原创资质」申请。(如「申请」按钮显示为灰色,不可点击,则意味着该账号暂时不符合)
  2. 收到申请后,我们将在5个工作日内审核其账号资质和内容质量,并为符合优质原创账号标准的网易号开通「原创」功能。
  3. 如果未通过审核,账号将在30个工作日后可再次提交申请。在此之前,请继续创作增加内容原创度!

2.3.5 原创功能开通资格

  • 具备优质内容原创能力的自媒体;
  • 网易号在星级体系中升级为二星及以上的账号;
  • 在发布内容中,原创比例超过50%;

2.3.6 违规使用处罚

  • 开通「原创」功能的网易号,一旦有抄袭盗用他人视频行为,将直接取消「原创」功能。
  • 给非原创内容打上「原创」标识三次及以上的,经编辑核实,将取消「原创」功能。
  • 被取消过「原创」功能的账号,再也无法开通此功能。
  • 取消分成。           

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多