腾讯广告算法大赛冠军方案拆解:200万奖金背后的全模态生成式推荐革命

日期:2025-12-23 15:32:41 / 人气:2



2025年腾讯广告算法大赛落下帷幕,冠军团队Echoch与亚军leejt的技术方案,不仅展现了年轻AI人才的硬核实力,更揭示了广告推荐从“判别式”向“生成式”跃迁的关键路径。在工业界尚未完全攻克的“全模态生成式推荐”领域,这些方案给出了可落地的创新解法。

一、广告推荐的困局:判别式方法的“天花板”与生成式的破局

传统广告推荐依赖判别式方法:通过统计用户特征(如年龄、性别、历史点击)与广告标签的匹配度,用“漏斗式”级联模型层层筛选。但这种方法面临三大瓶颈:  
• 特征挖掘触顶:手工特征与统计维度的扩展已难提升效果;  

• 世界知识缺失:无法理解用户深层意图(如“点广告是随便看看还是准备购买”);  

• 级联误差累积:拆分目标(点击→转化)导致信息损耗。  

生成式方法的崛起,正是为了突破这些限制。它不急于“打分”,而是通过用户全模态行为序列(文本、图像、交互),直接预测“此时此刻最可能的下一步行为”。例如,Google TIGER、Meta HSTU已尝试用生成式模型替代级联组件,快手OneRec、腾讯GPR则探索端到端生成式框架——HSTU甚至首次在推荐领域验证了“缩放定律”(模型越大,效果越好)。

二、冠军Echoch:让推荐系统“读懂”用户“此时此刻”的状态

由华中科技大学、北大、中科大组成的Echoch团队,针对“全模态生成式推荐”的核心挑战(动态词表、冷启动、多目标优化),提出了四大创新方案:

1. 时间感知:三级会话体系+周期编码+时间差分桶

用户行为的“时间感”是推荐的关键。例如,同一“点击”在早高峰可能是“随便看看”,在晚8点可能是“准备下单”。Echoch通过三重设计捕捉这种差异:  
• 三级会话体系:将用户行为划分为“即时浏览”“持续兴趣”“回流复访”三类会话,明确当前行为阶段的意图;  

• 周期编码:识别用户活跃的时间规律(如工作日午休、周末晚间),匹配对应时段的内容偏好;  

• 时间差分桶:区分行为“新鲜度”(如5分钟前 vs 3天前),动态调整历史行为的参考权重。  

三者叠加,让推荐系统在“用户作息周期”“兴趣变化节奏”“行为时效性”三个维度精准把控,避免“过时推荐”或“过度轰炸”。

2. 多目标优化:同一模型,两套策略

复赛要求同时预测“点击”与“转化”,但两者的目标权重差异巨大(点击易、转化难)。Echoch的解决方案是让模型“智能切换策略”:通过引入任务标识符(Task ID),模型在生成推荐时自动调整注意力——预测点击时侧重“吸引力”,预测转化时侧重“实用性”。这一设计避免了“一套画像硬撑两目标”的矛盾,线上得分显著提升。

3. 冷启动破局:语义ID的随机性注入

传统聚类生成的语义ID会导致“马太效应”:热门广告占据优质编码,冷门广告被边缘化。Echoch在编码最后一层引入随机扰动,使码表使用更均匀。结果显示,长尾广告的训练关注度提升190倍,曝光分布的基尼系数从0.53降至接近0,彻底激活了冷门广告的潜力。

4. 训推加速:Muon优化器省显存、提速度

生成式模型的大尺寸特性对算力要求极高。Echoch采用Muon优化器替代AdamW,通过牛顿-舒尔茨迭代将梯度矩阵正交化,省去了二阶动量的显存开销(实测显存锐减45%),同时收敛速度提升40%。这一优化让团队在不降低模型规模的前提下,完成了高效训练。

三、亚军leejt:“Scaling is All You Need”的工程实践

中山大学团队leejt的方案,围绕“大数据+大模型”的 scaling 逻辑展开,核心目标是“在有限算力下训出更大更有效的模型”。

1. 词表压缩:从“千万级”到“可控级”

广告推荐的词表规模可达千万甚至上亿(每个广告对应一个token),直接存储嵌入向量会导致显存爆炸。leejt通过两步压缩:  
• 低频广告映射:将交互频次极低的广告映射到共享词表,减少冗余;  

• ID哈希编码:用哈希函数将原始广告ID压缩为更紧凑的表示,显存占用降低70%。  

2. 多模态处理:去噪+离散化

面对高维、噪声重的多模态特征(如商品图片、描述文本),leejt没有直接“堆特征”,而是:  
• 用SVD降维去噪,保留核心信息;  

• 通过RQ-KMeans将连续向量离散为语义ID(SID),转化为模型易处理的离散表示;  

• 舍弃缺失率高、验证效果差的模态(如低质量图像),避免“垃圾进,垃圾出”。  

3. 异构时序图:用关系网络补全稀疏数据

用户行为序列常包含跨天、跨兴趣阶段的噪声(如昨天看鞋、今天看手机,模型可能误判为“鞋→手机”的关联)。leejt构建“用户-广告-语义”异构时序图,通过节点间的关联关系(如相似用户、同类广告)“借信号”,用群体行为弥补个体数据稀疏。例如,一个新广告可通过相似广告的历史转化数据,快速学习推荐策略。

4. 极致工程优化:GPU利用率拉满100%

为了在有限算力下扩展模型(从4层512维到8层2048维),leejt团队优化了全流程:  
• 混合精度训练+梯度检查点,减少显存占用;  

• torch.compile图编译,加速模型计算;  

• 数据预处理嵌入Dataloader,实现“加载-计算”并行。  

最终,每步训练时间从3.5秒压缩至0.8秒,GPU利用率100%,验证了“模型越大,效果越好”的scaling定律。

四、从实验室到产业:生成式推荐的落地与未来

腾讯广告算法大赛的价值,不仅在于选拔人才,更在于推动技术落地。据腾讯副总裁蒋杰透露,腾讯内部已在召回、粗排阶段试点生成式模型,效果已体现在营收数据中。未来,腾讯广告将推进三大方向:  
• 数据多模态化:整合文本、图像、视频等多维度信息;  

• 系统Agent化:用智能体动态生成个性化推荐策略;  

• 数据开源:开放大赛脱敏数据,推动社区共同探索。  

更远的想象是即时生成广告:不再从候选池检索,而是根据用户实时兴趣、场景、情绪,生成定制化文案、图片甚至视频——真正实现“千人千面”。

结语:年轻一代的“技术理想”照进现实

Echoch与leejt的方案,既有对问题本质的深刻洞察(如时间感知、冷启动),也有扎实的工程能力(如词表压缩、训推加速)。他们的实践证明:生成式推荐不是“空中楼阁”,而是能解决工业界真实痛点的技术方向。  

正如蒋杰所言:“这届年轻人的方案与工业界几乎没有代差。”当技术理想与产业需求碰撞,广告推荐的下一场革命,或许已经在路上。

作者:盛煌娱乐




现在致电 5243865 OR 查看更多联系方式 →

COPYRIGHT 盛煌娱乐 版权所有