抖音首次公开推荐算法原理

3 月 30 日消息,抖音总裁韩尚佑今日宣布,“抖音安全与信任中心”网站上线。网站首次公开抖音推荐算法原理,介绍其推荐算法如何预估用户行为概率,并通过多目标建模等方式实现更优质、丰富的内容推荐,而算法需由平台治理体系对其进行约束和规范。

抖音首次公开推荐算法原理

据IT之家了解,网站也披露了抖音平台治理的审核流程,阐述平台如何应对谣言、网暴等违规内容带来的挑战。

同时,抖音还介绍了自家的“Wide&Deep”和“双塔召回”两种模型。

Wide&Deep 模型的主要思路正如其名,是由单层的 Wide 部分和多层的 Deep 部分组成的混合模型。其中,Wide 部分的主要作用是让模型具有较强的“记忆能力”(memorization),“记忆能力”可以被理解为模型直接学习并利用历史数据中物品或者特征的“共现频率”的能力;Deep 部分的主要作用是让模型具有“泛化能力”(generalization),“泛化能力”可以被理解为模型传递特征的相关性,以及发掘稀疏甚至从未出现过的稀有特征与最终标签相关性的能力。

Wide&Deep 模型的这一结构特征,可以解决协同过滤算法的短板。协同过滤算法优点突出,但是其局限性也很明显,就是泛化能力差,推荐的结果头部效应比较明显。也就是容易造成信息单一问题。

抖音首次公开推荐算法原理
抖音首次公开推荐算法原理

一条视频从海量信息中被选中,推送给用户,一般要经过进入内容池、召回、排序三个环节。用户发布的新视频首先要经过初步评估进入内容池,然后进入召回环节,其作用是从海量的内容池中,初步快速粗筛出一大批用户可能感兴趣的内容。

举例来说,召回环节需要用到召回模型,抖音最常用的召回模型是“双塔召回模型”(Two-Tower Retrieval Model)。双塔召回模型把用户和内容都转化为数学空间里的一个个点,就像是给用户和内容贴上了独特的“数字标签”,这个过程叫做向量化表征学习。其大概过程如下:

  • (1)分别将用户特征、内容特征进行数学转化(如展示小猫的视频为 0,展示小狗的视频为 1,短视频为 0,长视频为 1,那么一个展示小猫的长视频即(0,1),其实际长度取决于特征有多少维度,用户特征同理);
  • (2)将转化后的数学特征输入到用户塔、内容塔两个深度学习模型中,经过训练,各自形成一组新的数字集合,这叫做用户表征和内容表征。在这一步,原本各自代表一个现实特征的数字不再具备任何实际语义,两个模型会把用户特征和内容特征都转化为没有现实意义的数字代码 —— 因此,算法不用理解现实语义,只需处理纯粹的数学符号;
  • (3)将两组形式为纯粹的数字集合的用户表征和内容表征,放入同一个向量空间中,每一组数字集合便在向量空间中拥有了一组专属的向量值,好比一组独有的“数字指纹”;
  • (4)将训练过的所有内容表征的向量值和当前用户表征的向量值的距离进行对比,距离越接近代表用户越喜欢。当你的“数字指纹”和某个视频的“数字指纹”在坐标系里刚好比较“匹配”(距离近),算法就会推荐它。
抖音首次公开推荐算法原理
抖音首次公开推荐算法原理

今年 1 月,抖音集团宣布拟推出 10 项措施,推动平台工作透明化,创建安全与信任的平台环境,打造更良好的网络生态,其中包括推进算法透明化推进平台治理透明化

1.推进算法透明化。2025 年,抖音将建设安全与信任中心网站和线下公示展厅,面向社会全面深入地公开抖音的算法基础运作原理、运营机制,也将对外公布各类热点榜单的计算原理和机制,提高透明度。

2.推进平台治理透明化。抖音将持续加大治理工作的技术研究、产品人力、资金投入。在抖音安全与信任中心,我们将面向社会全面公开抖音的社区规范、审核标准、审核机制;并将定期公开平台治理的各类典型违规案件和现象,明确对各类问题的治理态度,接受公众监督。

主题测试文章,只做测试使用。发布者:小屋,转转请注明出处:http://www.rumenwu.com/site/4438.html

(0)
小屋的头像小屋
上一篇 2025年3月28日 下午9:56
下一篇 2025年3月30日 下午8:19

相关推荐

  • 网站降权后该如何查找分析降权原因?

    对于网站排名来说,对其影响最大的是网站内容和外链了,很多时候网站排名之所以下降就是因为网站内容和外链的原因,有可能之前我们做优化的时候对这个很上心,每天都是原创、高质量的外链,但是随着时间的推移慢慢的质量就下降了,从而导致排名下降,这时候站长们应该明白自己要做哪些事情了! 如今,随着搜索引擎的算法不断更新,SEO人员的压力也越来越大,不单排名收录提升难度增加…

    建站入门 2020年12月21日
    88800
  • SEO需要掌握哪些基本SEO技巧?

    导航请确保你的网站导航都是以html的形式链接。所有页面之间应该有广泛的互联,如果无法实现这一点,可以考虑建立一个网站地图。 首页网站的首页(home或index页等)应该采用文本的形式,而不是flash等。这个文本里面要包含你的目标关键字或目标短语。 标签<title> < /title>这是标题标签,这里面应当包含你最重要的目标关…

    建站入门 2018年1月21日
    1.1K00
  • 解读反向链接与外链的区别?

    对于SEO初学者而言,经常容易混淆反向链接与外部链接,大家并不清楚二者之间的区别,这对于SEO优化而言,却有着完全不同的概念,比如:增加反链与增加外链,严格意义上讲,这是两码事。 那么,反向链接与外链的区别有哪些? 简单举例,比如:X与Y这两个页面,如果SEO人员在Y的页面上,利用超链接指向了X页面,那么我们可以明确的指出Y页面的URL,就是X页面的反向链接…

    建站入门 2018年8月29日
    1.3K00
  • 首页改版方法总结:服务市场首页改版项目

    首页改版一般由以下几种原因引起 业务策略变化 品牌升级 年久失修,体验变差 换了老板,嘿嘿 首页改版一般想要达到的目标 业务策略变化引起的内容变化,从而为用户提供更加丰富、更加精准的内容和服务 品牌升级引起的内容变化,从而在原有用户的体感上新增品牌增益的内容 年久失修导致用户流失严重,通过内容和服务的变化提升用户的留存和转化 感受: 换个品牌LOGO,改个页…

    2018年4月1日
    1.2K00
  • 百度APP移动搜索落地页体验白皮书5.0

    1.导言 2.面向对象 3.名词解释 4.落地页体验规范   4.1. 信息获取规范 4.1.1 加载速度   4.2.页面浏览规范 4.2.1 排版布局   4.2.2 字号间距   4.2.3 pc站移动适配   4.2.4 页面机型适配   4.2.5 落地页广告标准   4.3. 交互操作规范   4.3.1 滑动顺畅   4.3.2 功能友好   …

    建站入门 2020年3月25日
    1.1K00

发表回复

登录后才能评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信