财联社10月27日电,美团LongCat团队近日宣布正式发布并开源其自主研发的LongCat-Video视频生成模型。该模型针对高分辨率、高帧率视频生成过程中存在的计算瓶颈问题,通过创新性的技术架构实现了显著的性能突破。
据团队介绍,LongCat-Video模型采用"二阶段粗到精生成(C2F)+ 块稀疏注意力(BSA)+ 模型蒸馏"的三重优化方案。这种组合技术不仅有效解决了传统方法在处理高清视频时的计算效率问题,更将视频推理速度提升至原有水平的10.1倍,为实时视频生成应用开辟了新的可能性。
此次开源的LongCat-Video模型将向全球开发者开放核心技术,有望推动视频生成领域的技术创新与应用落地。美团LongCat团队表示,未来将持续优化模型性能,并探索更多垂直场景的应用可能。