每经记者:可杨 每经编辑:魏官红
当大模型领域的参数竞赛逐渐降温,行业焦点转向实际落地成效时,微博选择以自研轻量化模型入场。11月18日,微博正式发布首个开源大模型“VibeThinker”,其仅15亿参数的规模与约7800美元的训练成本,在万亿级参数模型主导的市场中引发关注。这场“反其道而行之”的技术布局,背后藏着怎样的战略考量?
当前,大模型厂商普遍通过增加参数量提升性能,部分前沿模型参数已突破万亿级。埃隆·马斯克旗下xAI更计划在2025年初发布的Grok 5中将参数规模推高至6万亿。然而,微博AI研发负责人向《每日经济新闻》记者指出,这种“堆参数”模式在制作成本、应用成本及技术开放性上均不可持续。
“微博的核心目标不是与头部企业比拼算力,而是回归社交场景本质,沉淀真正有效的能力。”该负责人表示,模型训练应围绕内容理解、用户兴趣分层、文本生成等关键场景展开,而非盲目追求规模扩张。这一思路与行业“技术普惠”趋势不谋而合——部分厂商已开始探索小模型在特定场景下的优化潜力。
尽管业界普遍认为小模型在复杂任务处理上存在劣势,但微博研发团队通过实践发现,其在实际应用中具备独特优势:模型规模小意味着服务响应更快、计算成本更低,且更易针对特定场景优化。例如,在微博的社交生态中,用户对评论的实时性要求远高于参数规模带来的边际效益。
“我们曾因模型过大导致服务延迟、成本高企、用户体验下降等问题,这促使我们重新思考小模型的逻辑能力。”该负责人透露,通过行业特有数据与针对性训练方法,小模型同样能具备强大的推理能力。这一结论在微博三季度财报中得到印证:AI驱动的智搜MAU突破7000万,DAU与检索量环比增长超50%,搜索总量提升20%,成为平台活跃度增长的核心引擎。
VibeThinker的首个落地场景,极可能是微博官方评论机器人“评论罗伯特”。这款2023年底上线的工具,以自动生成趣味评论活跃社交氛围为目标,被网友戏称为“赛博街溜子”。其研发团队深入挖掘微博心理学领域数据,强化模型在情感抚慰与心理指导上的能力,并引入强化学习训练深度思考版本。
然而,基座大模型的深度思考过程耗时且成本高昂,这正是VibeThinker的诞生初衷——通过轻量化模型实现同等逻辑推理能力,降低每条评论的生成成本。尽管当前开源版本主要展示模型在数学竞赛与编程领域的潜力,但研发负责人强调,其核心目标是提升模型解决现实复杂问题的能力,而非局限于垂直领域优化。
据透露,VibeThinker未来将优先在To C产品中应用,尤其是“评论罗伯特”这类能发挥微博数据优势的场景。通过持续优化,模型有望逐步扩展至搜索、推荐等算力密集型业务,形成“小模型+场景深耕”的商业化闭环。
微博的入局,标志着大模型竞争从“规模至上”转向“场景为王”。当行业开始反思“万亿参数是否必要”时,轻量化路线或许能为资源有限的企业提供新思路:通过聚焦核心场景、优化数据质量与训练方法,小模型同样能实现高效落地。对于微博而言,这场技术实验不仅是成本控制的尝试,更是其在社交AI领域构建差异化竞争力的关键一步。