抖音首次公开推荐算法原理

3 月 30 日消息,抖音总裁韩尚佑今日宣布,“抖音安全与信任中心”网站上线。网站首次公开抖音推荐算法原理,介绍其推荐算法如何预估用户行为概率,并通过多目标建模等方式实现更优质、丰富的内容推荐,而算法需由平台治理体系对其进行约束和规范。

抖音首次公开推荐算法原理

据IT之家了解,网站也披露了抖音平台治理的审核流程,阐述平台如何应对谣言、网暴等违规内容带来的挑战。

同时,抖音还介绍了自家的“Wide&Deep”和“双塔召回”两种模型。

Wide&Deep 模型的主要思路正如其名,是由单层的 Wide 部分和多层的 Deep 部分组成的混合模型。其中,Wide 部分的主要作用是让模型具有较强的“记忆能力”(memorization),“记忆能力”可以被理解为模型直接学习并利用历史数据中物品或者特征的“共现频率”的能力;Deep 部分的主要作用是让模型具有“泛化能力”(generalization),“泛化能力”可以被理解为模型传递特征的相关性,以及发掘稀疏甚至从未出现过的稀有特征与最终标签相关性的能力。

Wide&Deep 模型的这一结构特征,可以解决协同过滤算法的短板。协同过滤算法优点突出,但是其局限性也很明显,就是泛化能力差,推荐的结果头部效应比较明显。也就是容易造成信息单一问题。

抖音首次公开推荐算法原理
抖音首次公开推荐算法原理

一条视频从海量信息中被选中,推送给用户,一般要经过进入内容池、召回、排序三个环节。用户发布的新视频首先要经过初步评估进入内容池,然后进入召回环节,其作用是从海量的内容池中,初步快速粗筛出一大批用户可能感兴趣的内容。

举例来说,召回环节需要用到召回模型,抖音最常用的召回模型是“双塔召回模型”(Two-Tower Retrieval Model)。双塔召回模型把用户和内容都转化为数学空间里的一个个点,就像是给用户和内容贴上了独特的“数字标签”,这个过程叫做向量化表征学习。其大概过程如下:

  • (1)分别将用户特征、内容特征进行数学转化(如展示小猫的视频为 0,展示小狗的视频为 1,短视频为 0,长视频为 1,那么一个展示小猫的长视频即(0,1),其实际长度取决于特征有多少维度,用户特征同理);
  • (2)将转化后的数学特征输入到用户塔、内容塔两个深度学习模型中,经过训练,各自形成一组新的数字集合,这叫做用户表征和内容表征。在这一步,原本各自代表一个现实特征的数字不再具备任何实际语义,两个模型会把用户特征和内容特征都转化为没有现实意义的数字代码 —— 因此,算法不用理解现实语义,只需处理纯粹的数学符号;
  • (3)将两组形式为纯粹的数字集合的用户表征和内容表征,放入同一个向量空间中,每一组数字集合便在向量空间中拥有了一组专属的向量值,好比一组独有的“数字指纹”;
  • (4)将训练过的所有内容表征的向量值和当前用户表征的向量值的距离进行对比,距离越接近代表用户越喜欢。当你的“数字指纹”和某个视频的“数字指纹”在坐标系里刚好比较“匹配”(距离近),算法就会推荐它。
抖音首次公开推荐算法原理
抖音首次公开推荐算法原理

今年 1 月,抖音集团宣布拟推出 10 项措施,推动平台工作透明化,创建安全与信任的平台环境,打造更良好的网络生态,其中包括推进算法透明化推进平台治理透明化

1.推进算法透明化。2025 年,抖音将建设安全与信任中心网站和线下公示展厅,面向社会全面深入地公开抖音的算法基础运作原理、运营机制,也将对外公布各类热点榜单的计算原理和机制,提高透明度。

2.推进平台治理透明化。抖音将持续加大治理工作的技术研究、产品人力、资金投入。在抖音安全与信任中心,我们将面向社会全面公开抖音的社区规范、审核标准、审核机制;并将定期公开平台治理的各类典型违规案件和现象,明确对各类问题的治理态度,接受公众监督。

主题测试文章,只做测试使用。发布者:小屋,转转请注明出处:http://www.rumenwu.com/site/4438.html

(0)
小屋的头像小屋
上一篇 2025年3月28日 下午9:56
下一篇 2025年3月30日 下午8:19

相关推荐

  • 网站被百度和google封了,怎么办?

    先要确定你的网站已经被百度或google封了(也有人叫K了),通过日志可以获得该信息。菜鸟通过这里学习下怎么看日志。我的站怎么就不被收录呀? 日志中的HTTP状态码都代表什么? 网站被百度和google封了,怎么办? 谷歌从来都不会人工来检查或删除某一个网站,整个建立索引和排名的过程都用自动化的程序进行。如果涉及中国法律相关的内容,百度或许会采取相应办法吧。…

    建站入门 2018年2月11日
    93700
  • 404页面该怎么做?

    404页面的目的是:告诉浏览者其所请求的页面不存在或链接错误,同时引导用户使用网站其他页面而不是关闭窗口离开。 很多开源系统如CMS系统、Blog系统等不提供404页面或提供的404页面并未达到SEO的要求,这让网站的权威性大打折扣。 404页面该达到怎么样的效果才符合SEO要求? 搜索引擎通过HTTP状态码来识别网页的状态。当搜索引擎获得了一个错误链接时,…

    建站入门 2018年1月23日
    90000
  • 百度为什么不收录我的站点?

    搜索引擎为什么不收录我的站点? 搜索引擎进行网站索引和排名过程是完全程序自动化的,所以: 1、搜索引擎不会因为一些细小的网站错误而直接删除你的站点,如:某个页面出现乱码。 2、搜索引擎不会因为主观问题而删除你的站点,如:网页上出现对百度不友好的言词。 3、你的情况绝不是特例,其他的网站也会出现你这个情况。 4、只要符合搜索引擎的索引条件,一般情况下是会被收录…

    建站入门 2018年3月2日
    1.1K00
  • WordPress响应式主题添加视频手机端不显示问题解决办法

    随着移动互联网的发展,现在手机端的流量占比越来越大,响应式主题由于兼容PC和移动端以及部署方便等优点也被广大站长使用接受,不过由于电脑和手机系统兼容性的问题,很多用户遇到视频播放的问题:在网站添加的视频在电脑上可以正常播放,一到手机上就无法显示。 问题原因 电脑上一般都会安装flash控件,视频大多也是使用flash播放器来播放的,而手机端目前网页播放视频都…

    建站入门 2018年10月16日
    1.2K00
  • 怎么看关键词优化得好不好?

    一般情况下,我们看一个站点关键词优化得怎么样,主要通过以下几点: 1、站点的规模,以及由此决定的关键词定位。 2、关键词在站点的分布情况。 3、关键词扩展的挖掘和利用。 4、首页、目录页、内容页的标题标签是否书写规范。 5、Description Tag-描述标签、关键词标签、ALT-代替属性 等是否合理利用。 6、关键词密度以及关键词在网页上的位置。 7、…

    建站入门 2018年3月13日
    1.3K00

发表回复

登录后才能评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信