每经记者:可杨 每经编辑:魏官红
当大模型竞争从参数规模转向落地成效,微博选择在此时下场布局。这一动作背后,既折射出行业技术路线的分化,也暗含商业逻辑的重新校准。
11月18日,微博正式发布首个自研开源大模型“VibeThinker”,以仅15亿参数的轻量化架构引发关注。据公开数据,该模型训练成本被控制在约7800美元,与当前动辄百万美元级的大模型形成鲜明对比。这一选择,恰逢行业对“参数竞赛”的反思浪潮——当头部企业将模型参数推高至万亿级,微博为何逆势选择“小而精”的路径?
技术拐点已至:大模型竞争进入新阶段
11月19日,微博AI研发负责人在接受《每日经济新闻》记者采访时直言:“我们并非要与行业头部比拼算力,而是聚焦微博核心场景,沉淀真正有效的能力。”他强调,大模型的发展不应盲目追求规模扩张,而需围绕内容理解、用户兴趣分层、文本生成等关键场景进行针对性训练。这一观点,与当前行业对“大模型落地难”的共识形成呼应。
数据显示,用户增长趋稳的背景下,信息流分发效率已成为社交平台竞争的核心指标。自研模型既是技术选择,更是商业变量——其能否提升平台体验或商业化效率,将成为检验路径正确性的关键标准。
押注小模型:VibeThinker的成本优化逻辑
当前,通过增加参数量提升模型能力仍是主流选择。埃隆·马斯克旗下xAI计划明年发布的Grok 5,预计将把参数规模推高至6万亿级。然而,微博AI研发负责人指出,这种模式在模型制作成本、AI应用成本、技术开放性等方面均不可持续。
“业界普遍认为小模型在复杂任务和逻辑推理上存在劣势,但这正是我们突破的方向。”该负责人解释称,小模型具有服务响应快、计算成本低、场景优化易等天然优势。微博通过针对性技术改进,使小模型在行业特有数据和合理训练方法下,也能具备强大逻辑推理能力。
这一选择与微博的商业现实密切相关。财报显示,微博三季度净收入4.42亿美元,同比下降5%,但净利润达2.21亿美元,同比增长69%。AI应用成为关键增长引擎:三季度微博智搜MAU突破7000万,DAU和检索量环比增长超50%,搜索总检索量环比提升20%。
“评论罗伯特”:小模型的实验场
VibeThinker的首个落地场景,指向微博官方评论机器人“评论罗伯特”。这款2023年底推出的产品,以自动生成评论活跃社交氛围为目标,被网友戏称为“赛博街溜子”。其研发过程充分挖掘了微博心理学领域数据,增强了模型在情感抚慰上的能力。今年初,团队结合强化学习方法,推出深度思考版本,但基座模型的高耗时和高成本问题亟待解决。
“这正是VibeThinker诞生的初衷。”上述负责人透露,新模型旨在探索逻辑推理能力出色但规模更小的替代方案,使每条评论都能经过深度思考。尽管VibeThinker已对外开源,但目前仍处于实验阶段,开源版本重点展示逻辑推理、竞赛数学和编程能力潜力。
未来,VibeThinker将优先在To C产品中应用,尤其是“评论罗伯特”等能体现微博数据优势的场景。通过挖掘优质领域数据调整模型后,再逐步扩展至搜索、推荐等算力消耗大的场景。这一路径,既符合微博“场景驱动”的技术哲学,也为行业提供了轻量化模型落地的参考样本。