11月11日,人工智能领域迎来重要消息——百度文心多模态思考模型ERNIE-4.5-VL-28B-A3B-Thinking正式宣布开源。这一模型以仅3B的激活参数规模,实现了高效的多模态处理能力,为开发者提供了更轻量级的技术选择。
作为百度文心系列的重要升级,ERNIE-4.5-VL-28B-A3B-Thinking创新性地引入了“图像思考”能力。该能力不仅支持基础的多模态理解,还拓展了图片放大、图片搜索等实用工具的调用功能,进一步提升了模型在视觉场景下的应用潜力。
此次开源标志着百度在多模态AI领域的技术开放迈出重要一步,开发者可通过开源社区获取模型代码及文档,快速构建基于图像与文本协同处理的应用场景。