腾讯广告算法大赛冠军方案拆解：200万奖金背后的全模态生成式推荐革命

日期：2025-12-23 15:32:41 / 人气：88

2025年腾讯广告算法大赛落下帷幕，冠军团队Echoch与亚军leejt的技术方案，不仅展现了年轻AI人才的硬核实力，更揭示了广告推荐从“判别式”向“生成式”跃迁的关键路径。在工业界尚未完全攻克的“全模态生成式推荐”领域，这些方案给出了可落地的创新解法。

一、广告推荐的困局：判别式方法的“天花板”与生成式的破局

传统广告推荐依赖判别式方法：通过统计用户特征（如年龄、性别、历史点击）与广告标签的匹配度，用“漏斗式”级联模型层层筛选。但这种方法面临三大瓶颈：
• 特征挖掘触顶：手工特征与统计维度的扩展已难提升效果；

• 世界知识缺失：无法理解用户深层意图（如“点广告是随便看看还是准备购买”）；

• 级联误差累积：拆分目标（点击→转化）导致信息损耗。

生成式方法的崛起，正是为了突破这些限制。它不急于“打分”，而是通过用户全模态行为序列（文本、图像、交互），直接预测“此时此刻最可能的下一步行为”。例如，Google TIGER、Meta HSTU已尝试用生成式模型替代级联组件，快手OneRec、腾讯GPR则探索端到端生成式框架——HSTU甚至首次在推荐领域验证了“缩放定律”（模型越大，效果越好）。

二、冠军Echoch：让推荐系统“读懂”用户“此时此刻”的状态

由华中科技大学、北大、中科大组成的Echoch团队，针对“全模态生成式推荐”的核心挑战（动态词表、冷启动、多目标优化），提出了四大创新方案：

1. 时间感知：三级会话体系+周期编码+时间差分桶

用户行为的“时间感”是推荐的关键。例如，同一“点击”在早高峰可能是“随便看看”，在晚8点可能是“准备下单”。Echoch通过三重设计捕捉这种差异：
• 三级会话体系：将用户行为划分为“即时浏览”“持续兴趣”“回流复访”三类会话，明确当前行为阶段的意图；

• 周期编码：识别用户活跃的时间规律（如工作日午休、周末晚间），匹配对应时段的内容偏好；

• 时间差分桶：区分行为“新鲜度”（如5分钟前 vs 3天前），动态调整历史行为的参考权重。

三者叠加，让推荐系统在“用户作息周期”“兴趣变化节奏”“行为时效性”三个维度精准把控，避免“过时推荐”或“过度轰炸”。

2. 多目标优化：同一模型，两套策略

复赛要求同时预测“点击”与“转化”，但两者的目标权重差异巨大（点击易、转化难）。Echoch的解决方案是让模型“智能切换策略”：通过引入任务标识符（Task ID），模型在生成推荐时自动调整注意力——预测点击时侧重“吸引力”，预测转化时侧重“实用性”。这一设计避免了“一套画像硬撑两目标”的矛盾，线上得分显著提升。

3. 冷启动破局：语义ID的随机性注入

传统聚类生成的语义ID会导致“马太效应”：热门广告占据优质编码，冷门广告被边缘化。Echoch在编码最后一层引入随机扰动，使码表使用更均匀。结果显示，长尾广告的训练关注度提升190倍，曝光分布的基尼系数从0.53降至接近0，彻底激活了冷门广告的潜力。

4. 训推加速：Muon优化器省显存、提速度

生成式模型的大尺寸特性对算力要求极高。Echoch采用Muon优化器替代AdamW，通过牛顿-舒尔茨迭代将梯度矩阵正交化，省去了二阶动量的显存开销（实测显存锐减45%），同时收敛速度提升40%。这一优化让团队在不降低模型规模的前提下，完成了高效训练。

三、亚军leejt：“Scaling is All You Need”的工程实践

中山大学团队leejt的方案，围绕“大数据+大模型”的 scaling 逻辑展开，核心目标是“在有限算力下训出更大更有效的模型”。

1. 词表压缩：从“千万级”到“可控级”

广告推荐的词表规模可达千万甚至上亿（每个广告对应一个token），直接存储嵌入向量会导致显存爆炸。leejt通过两步压缩：
• 低频广告映射：将交互频次极低的广告映射到共享词表，减少冗余；

• ID哈希编码：用哈希函数将原始广告ID压缩为更紧凑的表示，显存占用降低70%。

2. 多模态处理：去噪+离散化

面对高维、噪声重的多模态特征（如商品图片、描述文本），leejt没有直接“堆特征”，而是：
• 用SVD降维去噪，保留核心信息；

• 通过RQ-KMeans将连续向量离散为语义ID（SID），转化为模型易处理的离散表示；

• 舍弃缺失率高、验证效果差的模态（如低质量图像），避免“垃圾进，垃圾出”。

3. 异构时序图：用关系网络补全稀疏数据

用户行为序列常包含跨天、跨兴趣阶段的噪声（如昨天看鞋、今天看手机，模型可能误判为“鞋→手机”的关联）。leejt构建“用户-广告-语义”异构时序图，通过节点间的关联关系（如相似用户、同类广告）“借信号”，用群体行为弥补个体数据稀疏。例如，一个新广告可通过相似广告的历史转化数据，快速学习推荐策略。

4. 极致工程优化：GPU利用率拉满100%

为了在有限算力下扩展模型（从4层512维到8层2048维），leejt团队优化了全流程：
• 混合精度训练+梯度检查点，减少显存占用；

• torch.compile图编译，加速模型计算；

• 数据预处理嵌入Dataloader，实现“加载-计算”并行。

最终，每步训练时间从3.5秒压缩至0.8秒，GPU利用率100%，验证了“模型越大，效果越好”的scaling定律。

四、从实验室到产业：生成式推荐的落地与未来

腾讯广告算法大赛的价值，不仅在于选拔人才，更在于推动技术落地。据腾讯副总裁蒋杰透露，腾讯内部已在召回、粗排阶段试点生成式模型，效果已体现在营收数据中。未来，腾讯广告将推进三大方向：
• 数据多模态化：整合文本、图像、视频等多维度信息；

• 系统Agent化：用智能体动态生成个性化推荐策略；

• 数据开源：开放大赛脱敏数据，推动社区共同探索。

更远的想象是即时生成广告：不再从候选池检索，而是根据用户实时兴趣、场景、情绪，生成定制化文案、图片甚至视频——真正实现“千人千面”。

结语：年轻一代的“技术理想”照进现实

Echoch与leejt的方案，既有对问题本质的深刻洞察（如时间感知、冷启动），也有扎实的工程能力（如词表压缩、训推加速）。他们的实践证明：生成式推荐不是“空中楼阁”，而是能解决工业界真实痛点的技术方向。

正如蒋杰所言：“这届年轻人的方案与工业界几乎没有代差。”当技术理想与产业需求碰撞，广告推荐的下一场革命，或许已经在路上。

作者：盛煌娱乐

腾讯广告算法大赛冠军方案拆解：200万奖金背后的全模态生成式推荐革命

新闻资讯 News

案例展示 Case

现在致电 5243865 OR 查看更多联系方式 →

现在致电 5243865 OR 查看更多联系方式 →