定焦One(dingjiaoone)原创
作者 | 陈丹
编辑 | 魏佳
当网友通过简单提示词就能在AI模型中生成迪士尼经典IP形象时,一场关于AI版权侵权的全球风暴正悄然酝酿。9月16日,迪士尼、环球影业、华纳兄弟探索公司三大影视巨头联合向中国AI独角兽上海稀宇科技(MiniMax)发起诉讼,指控其旗下“海螺AI”(Hailuo AI)存在大规模知识产权侵权行为,这场诉讼不仅暴露了AI技术发展与版权保护之间的深层矛盾,更预示着AI行业将进入规则重塑的关键期。
此次联合诉讼中,原告方提交了119页起诉书及58份证据材料,涵盖海螺AI侵权内容示例、产品宣传材料、用户截图及专家技术分析报告。起诉书指出,MiniMax在未经授权的情况下,通过网络爬虫或机器人从互联网(含潜在盗版渠道)下载原告版权作品,经清洗、格式化后用于“海螺AI”模型训练,使原告作品核心元素被嵌入模型。
更引人注目的是,用户仅需输入简单文本提示,如“达斯・维达在死亡之星上行走,手持红色光剑”,“海螺AI”即可生成高质量可下载的图片与视频,且输出内容包含超出提示词的细节,如角色标志性动作、场景细节等。这种“精准复现”能力,被起诉方视为模型中存储了原告作品复制信息的直接证据。
截至发稿,MiniMax暂未对此事公开做出回应。但这场诉讼并非孤立事件——今年6月,美国AI图像生成公司Midjourney已被迪士尼和环球提起版权诉讼;本月初,华纳兄弟探索也对Midjourney提出类似诉讼,形成对AI公司的围剿之势。
MiniMax旗下“海螺AI”的宣传口号——“口袋里的好莱坞工作室”,被三大影视集团斥为“大胆的自封绰号”,因其“业务建立在窃取原告知识产权的基础上”。具体来看,侵权指控聚焦于三个核心环节:
训练阶段:非法抓取版权内容
起诉书指出,MiniMax未经授权抓取原告版权作品用于模型训练,使原告作品核心元素被嵌入模型。这种行为与早期搜索引擎抓取网页内容存在本质区别——AI模型对数据的“消化”是深度学习式的,而非简单的索引存储。
生成阶段:输出高度相似内容
用户输入简单提示词即可生成包含角色标志性动作、场景细节的高质量内容,证明模型中存储了原告作品的复制信息。这种“生成即侵权”的质疑,直指AI模型是否具备真正的“创作”能力。
推广阶段:系统性鼓励侵权
MiniMax被指在官网“探索”页面公开展示侵权内容,在社交媒体用原告IP角色做广告引流订阅用户,且在生成内容上加注自身品牌水印。这种模式被起诉方比喻为“虚拟自动售货机”,实质是“系统性鼓励侵权”。
此外,起诉方强调MiniMax具备侵权防控能力——其已能通过技术措施过滤暴力、裸露内容,却未对版权内容采取类似保护,主观侵权意图明显。
此次诉讼中,好莱坞阵营的诉求清晰明确:一是索要MiniMax的侵权所得利润,或按每部侵权作品最高15万美元主张法定损害赔偿;二是申请永久禁令,禁止MiniMax继续用原告作品训练AI,且禁止其服务生成相似IP内容。
这种强硬态度,与此前起诉Midjourney如出一辙。当时迪士尼、环球影业称Midjourney是“典型的版权搭便车者”,强调“无论侵权内容由AI还是传统技术生成,盗版本质不变”。两起案件的核心指控高度一致:AI公司未经授权复制影视IP作为训练数据,且生成内容与原作角色高度相似。
北京至普律师事务所主任李圣律师分析,现有的著作权法框架下认定AI侵权需满足四大要件:作品受保护、未经授权使用、接触原作、生成内容与原作实质性相似。若案件进入实质审理,争议将集中于三点:
其一,需通过技术溯源证实“海螺AI”训练数据包含涉案版权作品;其二,需鉴定生成内容是“复制/改编”还是“全新创作”;其三,需审查MiniMax是否存在授权、法定许可等合法抗辩事由。
更通俗一些讲,就是要有确凿证据证明MiniMax的AI模型训练数据里,确实包含了原告方的素材;同时,判定AI生成的内容到底是对原作的直接“复制”或“改编”,还是仅仅受了点启发进行的全新创作;以及“有没有理”,MiniMax有没有合理的借口,比如“我已经付钱拿到许可了”或者“法律有特殊规定允许我这么用”。
律师张京团队曾整理多宗原告是版权方、被告是生成式人工智能服务提供者的诉讼,争议焦点都较为类似,即被告的大模型不仅在训练阶段也在输出阶段使用了原告拥有版权的作品。考虑到大语言模型的技术特点,在训练阶段是否能够使用包含版权的作品,在世界范围内还有一定争议,部分司法判例肯定了有可能构成合理使用;但对于输出阶段应采取措施防止和版权方的作品高度类似而产生替代效果,已成为共识,并未出现相反的判决结果。
迪士尼起诉MiniMax,并非孤立事件,而是AI版权纠纷“扩圈”的最新节点。2023年底,《纽约时报》率先起诉OpenAI、微软,指控其非法抓取数百万篇新闻报道用于AI训练,拉开AI版权纠纷序幕。
2024年初,1.6万名英国艺术家计划对Midjourney等AI公司发起集体诉讼,反对AI未经授权使用插画作品训练模型。2024年5月,OpenAI新模型GPT-4o的语音模式“SKY”因高度模仿斯嘉丽・约翰逊声线遭抵制,OpenAI虽否认侵权但下架该语音;随后美国唱片业协会起诉AI音乐公司Suno、Udio,指控其“大规模侵权”。
AI版权的纠纷,从文字、图像延伸至音频领域,而迪士尼起诉MiniMax、Midjourney,标志着影视IP也成为AI版权博弈的核心。这些原告包括作家、新闻媒体、歌手、插画家等等,几乎已经涵盖了大部分艺术领域。他们对AI的指控,细节上虽有差异,但核心都围绕两点:“源头侵权”和“结果侵权”,前者指未经授权使用版权内容训练AI;后者则指AI生成内容构成实质性替代与市场冲击。
面对版权公司和艺术家们的指控,AI公司一直以“合理使用”为自己抗辩。目前来看,AI公司主要从四个方面论证自己“合理使用”:
第一、转化性使用(transformative)
AI训练并非对原作品的简单复制或传播,而是通过算法提取数据中的抽象模式、风格特征与语义关联,最终生成不同于原始数据全新内容。也就是说,“AI不是抄袭,而是为了学习和创造新东西”。
第二、不构成市场替代
AI模型输出的是统计学意义上的生成结果,而非原作的复制品,不影响版权作品的核心商业市场,甚至可能通过二次创作生态间接扩大原作的传播与价值。
第三,使用量和实质性合理
尽管使用了大量数据,但AI公司认为,这是机器学习实现泛化能力的必要前提,且模型参数并未固定存储任何单一作品的具体表达,仅学习其非表达性的底层特征。可以理解为,“AI是看了很多,但这是为了学习,而且没存你的原稿”。
第四,社会效益
该行为服务于公共利益,能推动人工智能这一重要领域的创新与技术进步,符合版权法“促进科学与实用艺术发展”的终极目的。如果限制AI学习,就是阻碍全人类科技进步。
最典型的抗辩来自Midjourney——其在应对迪士尼起诉时称,原告及合作供应商亦在使用Midjourney工具,不能既享AI红利又扼杀技术底层实践。
在AI野蛮生长的时代,AI大模型竞争力往往依赖训练数据规模与质量——数据越丰富,生成能力越强。这促使许多AI公司在初期采用“先污染,后治理”策略:大规模抓取互联网图文音视频作为语料,其中不可避免包含版权内容,从好莱坞IP到新闻报道,皆成“免费素材”。
然而,随着行业规模迅速扩大,版权问题也开始集中爆发。对于许多AI公司而言,“还债时刻”正在到来。从目前的趋势来看,行业正在从无序抓取转向付费合作。例如,OpenAI与新闻集团(News Corp)达成多年期协议,将获得其旗下媒体的内容并用于回答用户的问题,交易价值或超过2.5亿美元。此前它还与《金融时报》达成合作。此外,Meta也与环球音乐集团达成合作,避免未经授权的AI生成内容对创作者造成影响。
一名法律人士认为,今后,AI公司和版权方的付费数据合作将越来越普遍。不过,当前行业仍存在一种误区,即将“版权保护”与“技术创新”对立起来,认为强化版权保护会制约AI发展。
但资深律师张京指出,这种对立思维不符合历史规律——纵观工业革命以来的技术演进,知识产权法始终是创新的“助推器”,而非“绊脚石”。如今AI技术带来的挑战,本质是原有利益平衡机制的打破,需要通过规则调整重建新平衡,而非走向“绝对保护”或“绝对开放”的极端。
短期来看,无论迪士尼诉MiniMax等个案的判决结果如何,都将加速AI版权授权市场的成熟。从长期视角看,版权方与AI公司的博弈不会终结,但将从当前的“火拼”转向规则下的磨合。
*题图及文中配图来源于pexels,张京为化名。