在大众眼中,算法往往带着一层神秘面纱。然而,在4月15日的抖音开放日活动中,这一技术壁垒被悄然打破,抖音首次向公众揭开了其算法原理的面纱。
抖音的算法工程师刘畅在活动上解释道:“推荐算法的本质,其实是用数学方法高效地匹配信息。”他进一步举例,抖音每天会收到数以亿计的内容投稿,而每位用户一天内通常只会浏览几百个内容。为了精准地将用户感兴趣的内容推送到他们眼前,算法扮演了至关重要的角色。
尽管算法在信息处理上展现出极高的效率,但其本身也存在一定的局限性。刘畅指出,为了弥补这些不足,需要平台治理体系为算法设置合理的“护栏”。业内专家也强调,构建一个健康的网络生态,需要企业、行业乃至全社会的共同努力。
关于算法如何了解用户的喜好,刘畅给出了生动的解释:“推荐算法并不需要理解每一个内容的含义。”例如,算法并不懂得“晚霞很美”这一情感表达,但它能够捕捉到人类在看到晚霞视频时停留时间较长,并愿意分享给好友的行为模式。
推荐算法实质上是一个高效的信息过滤系统,其核心在于学习用户的行为反馈数据,预测用户下一步可能的行为,从而决定推荐哪些内容。与传统的“打标签”方式不同,抖音这类每天处理海量内容的平台,已经无法依赖人工为每条内容打标签,而是更多地依赖于用户的“信号”来进行推荐。
刘畅还介绍了算法的早期策略——“协同过滤”。如果两个用户都喜欢美食和健身视频,当其中一个用户点击了一个新的视频时,另一个用户也很可能被推荐这个视频。这种策略不需要了解内容的具体内容,只需要知道哪些用户的兴趣相似。
随着技术的发展,更先进的“神经网络”算法已经成为推荐领域的主流。抖音目前采用的“双塔模型”和“Wide&Deep”等算法模型,都是基于神经网络构建的。这些模型能够从用户的已知兴趣中推测出可能的兴趣点,从而实现更精准的推荐。
算法不仅关注用户点击的每一个内容,还将用户的每一个微动作转化为兴趣点,绘制出一张不断变化的行为画像。然而,这也带来了新的问题。抖音生态运营经理陈丹丹指出:“算法只能预估用户行为,无法完全理解语义,因此在传播海量信息的过程中难免存在缺陷。”
为了应对这些问题,抖音建立了一套“人工参与+机器学习”的治理机制。所有在平台上发布的内容都会经过评估,流量越高的内容评估次数越多,标准也更严格。通过初审、复审以及三审等环节,抖音确保内容既符合规范又具有原创性和优质性。
陈丹丹还解释了视频审核的流程并非单一的线性过程。在审核流程的任何一个环节,一旦出现风险信号,如用户反馈或异常流量等,内容就会进入研判治理节点,被识别处置的内容将停止分发和推荐。
面对网络暴力、谣言以及AI生成式内容等新挑战,抖音也采取了一系列措施。针对网络暴力现象,抖音成立了专门的治理团队,通过主动识别潜在受害者并推送预警、设置防网暴专区以及重点打击施暴者等方式进行治理。同时,抖音还启动了AIGC治理专项,引导创作者更规范地使用AI工具进行内容创作。
在多方共同努力下,算法正在变得更加透明和可控。然而,陈丹丹也坦言,治理存在天然的滞后性,需要不断优化、升级和迭代。抖音将继续坚定推进各项举措,从机制层面实现算法的向上和向善,让科技进步真正服务于美好生活。