腾讯广告算法大赛冠军方案拆解:200万奖金背后的全模态生成式推荐革命
日期:2025-12-23 15:32:41 / 人气:2

2025年腾讯广告算法大赛落下帷幕,冠军团队Echoch与亚军leejt的技术方案,不仅展现了年轻AI人才的硬核实力,更揭示了广告推荐从“判别式”向“生成式”跃迁的关键路径。在工业界尚未完全攻克的“全模态生成式推荐”领域,这些方案给出了可落地的创新解法。
一、广告推荐的困局:判别式方法的“天花板”与生成式的破局
传统广告推荐依赖判别式方法:通过统计用户特征(如年龄、性别、历史点击)与广告标签的匹配度,用“漏斗式”级联模型层层筛选。但这种方法面临三大瓶颈:
• 特征挖掘触顶:手工特征与统计维度的扩展已难提升效果;
• 世界知识缺失:无法理解用户深层意图(如“点广告是随便看看还是准备购买”);
• 级联误差累积:拆分目标(点击→转化)导致信息损耗。
生成式方法的崛起,正是为了突破这些限制。它不急于“打分”,而是通过用户全模态行为序列(文本、图像、交互),直接预测“此时此刻最可能的下一步行为”。例如,Google TIGER、Meta HSTU已尝试用生成式模型替代级联组件,快手OneRec、腾讯GPR则探索端到端生成式框架——HSTU甚至首次在推荐领域验证了“缩放定律”(模型越大,效果越好)。
二、冠军Echoch:让推荐系统“读懂”用户“此时此刻”的状态
由华中科技大学、北大、中科大组成的Echoch团队,针对“全模态生成式推荐”的核心挑战(动态词表、冷启动、多目标优化),提出了四大创新方案:
1. 时间感知:三级会话体系+周期编码+时间差分桶
用户行为的“时间感”是推荐的关键。例如,同一“点击”在早高峰可能是“随便看看”,在晚8点可能是“准备下单”。Echoch通过三重设计捕捉这种差异:
• 三级会话体系:将用户行为划分为“即时浏览”“持续兴趣”“回流复访”三类会话,明确当前行为阶段的意图;
• 周期编码:识别用户活跃的时间规律(如工作日午休、周末晚间),匹配对应时段的内容偏好;
• 时间差分桶:区分行为“新鲜度”(如5分钟前 vs 3天前),动态调整历史行为的参考权重。
三者叠加,让推荐系统在“用户作息周期”“兴趣变化节奏”“行为时效性”三个维度精准把控,避免“过时推荐”或“过度轰炸”。
2. 多目标优化:同一模型,两套策略
复赛要求同时预测“点击”与“转化”,但两者的目标权重差异巨大(点击易、转化难)。Echoch的解决方案是让模型“智能切换策略”:通过引入任务标识符(Task ID),模型在生成推荐时自动调整注意力——预测点击时侧重“吸引力”,预测转化时侧重“实用性”。这一设计避免了“一套画像硬撑两目标”的矛盾,线上得分显著提升。
3. 冷启动破局:语义ID的随机性注入
传统聚类生成的语义ID会导致“马太效应”:热门广告占据优质编码,冷门广告被边缘化。Echoch在编码最后一层引入随机扰动,使码表使用更均匀。结果显示,长尾广告的训练关注度提升190倍,曝光分布的基尼系数从0.53降至接近0,彻底激活了冷门广告的潜力。
4. 训推加速:Muon优化器省显存、提速度
生成式模型的大尺寸特性对算力要求极高。Echoch采用Muon优化器替代AdamW,通过牛顿-舒尔茨迭代将梯度矩阵正交化,省去了二阶动量的显存开销(实测显存锐减45%),同时收敛速度提升40%。这一优化让团队在不降低模型规模的前提下,完成了高效训练。
三、亚军leejt:“Scaling is All You Need”的工程实践
中山大学团队leejt的方案,围绕“大数据+大模型”的 scaling 逻辑展开,核心目标是“在有限算力下训出更大更有效的模型”。
1. 词表压缩:从“千万级”到“可控级”
广告推荐的词表规模可达千万甚至上亿(每个广告对应一个token),直接存储嵌入向量会导致显存爆炸。leejt通过两步压缩:
• 低频广告映射:将交互频次极低的广告映射到共享词表,减少冗余;
• ID哈希编码:用哈希函数将原始广告ID压缩为更紧凑的表示,显存占用降低70%。
2. 多模态处理:去噪+离散化
面对高维、噪声重的多模态特征(如商品图片、描述文本),leejt没有直接“堆特征”,而是:
• 用SVD降维去噪,保留核心信息;
• 通过RQ-KMeans将连续向量离散为语义ID(SID),转化为模型易处理的离散表示;
• 舍弃缺失率高、验证效果差的模态(如低质量图像),避免“垃圾进,垃圾出”。
3. 异构时序图:用关系网络补全稀疏数据
用户行为序列常包含跨天、跨兴趣阶段的噪声(如昨天看鞋、今天看手机,模型可能误判为“鞋→手机”的关联)。leejt构建“用户-广告-语义”异构时序图,通过节点间的关联关系(如相似用户、同类广告)“借信号”,用群体行为弥补个体数据稀疏。例如,一个新广告可通过相似广告的历史转化数据,快速学习推荐策略。
4. 极致工程优化:GPU利用率拉满100%
为了在有限算力下扩展模型(从4层512维到8层2048维),leejt团队优化了全流程:
• 混合精度训练+梯度检查点,减少显存占用;
• torch.compile图编译,加速模型计算;
• 数据预处理嵌入Dataloader,实现“加载-计算”并行。
最终,每步训练时间从3.5秒压缩至0.8秒,GPU利用率100%,验证了“模型越大,效果越好”的scaling定律。
四、从实验室到产业:生成式推荐的落地与未来
腾讯广告算法大赛的价值,不仅在于选拔人才,更在于推动技术落地。据腾讯副总裁蒋杰透露,腾讯内部已在召回、粗排阶段试点生成式模型,效果已体现在营收数据中。未来,腾讯广告将推进三大方向:
• 数据多模态化:整合文本、图像、视频等多维度信息;
• 系统Agent化:用智能体动态生成个性化推荐策略;
• 数据开源:开放大赛脱敏数据,推动社区共同探索。
更远的想象是即时生成广告:不再从候选池检索,而是根据用户实时兴趣、场景、情绪,生成定制化文案、图片甚至视频——真正实现“千人千面”。
结语:年轻一代的“技术理想”照进现实
Echoch与leejt的方案,既有对问题本质的深刻洞察(如时间感知、冷启动),也有扎实的工程能力(如词表压缩、训推加速)。他们的实践证明:生成式推荐不是“空中楼阁”,而是能解决工业界真实痛点的技术方向。
正如蒋杰所言:“这届年轻人的方案与工业界几乎没有代差。”当技术理想与产业需求碰撞,广告推荐的下一场革命,或许已经在路上。
作者:盛煌娱乐
新闻资讯 News
- 业绩下滑的老板们,用AI监控员工12-23
- 精英的背叛:如何扼杀一个国家的...12-23
- 伊藤离场后,468和大融城的“新婚...12-23
- 腾讯广告算法大赛冠军方案拆解:...12-23

