新闻中心

(上篇)基于人工智能文生图第一案,从著作权保护的思想与表达二分法、及人工智能生成物的可复现性与否看人工智能生成物的版权归属

发布时间:2025-04-08

作者:许滕

上海天知澜律师事务所高级合伙人、天知澜苏州分所执行主任。知识产权、TMT、数据与科技法方向律师,专利代理师。

2017年通过司法考试,长期从事法律工作,本科国防科技大学信息与通信工程专业,研究生同济大学电子信息专业人工智能与自动化方向,具有深厚的法律底蕴和技术基础。许滕律师从事知识产权、数据、TMT、科技法方向的日常法律咨询、专项合规、诉讼、专利无效及其他专项法律业务,行业主要集中在人工智能、软件工程、嵌入式系统、集成电路、TMT、大数据等。


2023年11月27日,由北京互联网法院审理的人工智能生成图片著作权侵权纠纷案(以下简称“AI文生图案”),现基于基于人工智能文生图第一案,从著作权保护的思想和表达二分法上,以及人工智能生成物的可复现性与否上,来研究人工智能生成物的版权归属。

著作权保护的思想与表达二分法的运用现状


1994年签订的《与贸易有关的知识产权协定》(TRIPS 协议)将思想表达二分法纳入国际贸易规则。《与贸易有关的知识产权协定》第9条“与《伯尔尼公约》的关系”第二款规定:版权的保护仅延伸至表达方式,而不延伸至思想、程序、操作方法或数学概念本身。TRIPS 协议的这一款规定阐述了著作权保护的这一重要的基本原则——思想与表达二分法,即将作品的思想与表达分开,对表达予以版权保护,而对思想不予以保护。在TRIPS的框架下,各成员国有关思想与表达二分法的运用理念逐渐统一。


我国著作权法的思想与表达二分法这一原则在《计算机软件保护条例》第六条规定中有所表征,即“本条例对软件著作权的保护不延及开发软件所用的思想、处理过程、操作方法或者数学概念等。”将软件创作的思想与表达作了明确区分。我国《著作权法》第三条规定:本法所称的作品,是指文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果。该条明确了作品必须“以一定形式表现”,也在一定程度上体现了思想与表达二分原则,但未对思想与表达二分的原则作出明确规定。


思想与表达二分的方法大量运用于我国的诸多著作权纠纷案件中,如庄羽与北京图书大厦有限责任公司侵犯著作权纠纷案、“蓝月传奇” 诉“烈焰武尊” 游戏侵权纠纷案、“太极熊猫”诉“花千骨”游戏侵权纠纷案、杭州网易雷火科技有限公司诉广州简悦信息科技有限公司著作权侵权及不正当竞争纠纷案、金庸诉江南《此间的少年》侵权案等等。因此,思想与表达二分法虽未明确规定,但法条已经在一定程度上体现,并且广泛运用在我国著作权纠纷的法治实践中。


人工智能文生图第一案中,思想与表达二分法的体现


我国《著作权法》第三条规定:本法所称的作品,是指文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果。该条明确了认定为作品必须具备以下四个条件:1、必须处于文学、艺术、科学领域内;2、具有独创性;3、以一定形式表现;4、必须是智力成果。


“人工智能文生图第一案”判决生效后,审理该案的人民法院指出:“传统的著作权理论与技术发展现实已经不相匹配,应当进行调适和发展,以适应现实情况的变化,更好地满足权益保护和产业发展的需求。因此,我们不能固守历史的标准,唯有面向未来进行思考,才能选好当下的路径”。所以,我们需要紧跟时代潮流,扩大化的去理解上述概念。在“人工智能文生图第一案”判决书的本院认为部分,一、“春风送来了温柔”图片是否构成作品,构成何种类型作品,下面直接阐述了法院的意见,本案中,从涉案图片的外观上来看,其与通常人们见到的照片、绘画无异,显然属于艺术领域,且具有一定的表现形式。在论述独创性时,本院认为部分指出,原告对于人物及其呈现方式等画面元素通过提示词进行了设计,对于画面布局构图等通过参数进行了设置,体现了原告的选择和安排。


另一方面,原告通过输入提示词、设置相关参数,获得了第一张图片后,其继续增加提示词、修改参数,不断调整修正,最终获得了涉案图片,这一调整修正过程亦体现了原告的审美选择和个性判断。在庭审中,原告通过变更个别提示词或者变更个别参数,生成了不同的图片,可以看出,利用该模型进行创作,不同的人可以自行输入新的提示词、设置新的参数,生成不同的内容。因此,涉案图片并非“机械性智力成果”。在无相反证据的情况下,可以认定涉案图片由原告独立完成,体现出了原告的个性化表达。


1、原告的个性化表达中的“表达”,应当理解为《著作权法》第三条中第二个条件:“具有独创性”的要求,还是应当理解为第三个条件:“以一定形式表现”的要求?


(1)从文义上理解,“具有独创性”,包括两个要件,即“独”和“创”。“独”应当理解为作品创作过程中作者的独立完成程度,即考量是否是抄袭他人,如未抄袭他人,即满足“独”的条件。“创”即需要作品的作者完成一定程度上的创造,体现出作者的个性化。“具有一定的表现形式”是指“作品”应当具有一定的外在表现形式,如声音、文字、色彩、符号等有形形式。如果仅仅狭义的从浅显的字面意义上理解,似乎表达与两个条件都不相关,但如果扩大解释,名词短语作动词短语来理解,“具有一定的表现形式”也可以指将“智力成果”这种思想表现出来,而这种动态的过程即为表达。


北京市高级人民法院关于审理涉及综艺节目著作权纠纷案件若干问题的解答中,有提问:10、综艺节目模式是否受《著作权法》的保护?答:综艺节目模式是综艺节目创意、流程、规则、技术规定、主持风格等多种元素的综合体。综艺节目模式属于思想的,不受《著作权法》的保护。综艺节目中的节目文字脚本、舞美设计、音乐等构成作品的,可以受《著作权法》的保护。由此可见,综艺节目模式中属于思想的部分,没有一定的表现形式,不受《著作权法》的保护,而“舞美设计”、“音乐”等不属于思想,具有一定的表现形式。而“舞美设计”、“音乐”等正属于思想的表达,因此可以理解为,“具有一定的表现形式”也可以指表达这一过程。


综上可以看出,个性化表达中的”表达应当理解为第三个条件“以一定形式表现”的要求,而”个性化“应当理解为第二个条件”具有独创性“的要求。


人工智能生成的图片无疑符合第一个条件的规定,第2、4个条件在本系列文章的前面两篇已经有所阐述,那么以生成式人工智能为媒介的文生图是否能认定为作品,关键需要评析是否符合“以一定形式表现”这一个条件,即评析表达如何实现。


2、人工智能生成物(文生图)的表达如何实现?

判决书中提及:获得了第一张图片后,其继续增加提示词、修改参数,不断调整修正,最终获得了涉案图片,这一调整修正过程亦体现了原告的审美选择和个性判断。原告通过变更个别提示词或者变更个别参数,生成了不同的图片。上述操作体现了两点:(1)按创作需求不断调整提示词的多次用户输入;(2)提示词不同,输出的结果不同。


(1)“按创作需求不断调整提示词的多次用户输入”的表达评析:

Stable Diffusion模型输出的结果及流程可复现时,单一回合生成说:创作者输入文字提示词,然后AI回复具体图片。有学者认为,这属于“暗箱模式”,即创作者输入了具体的文本提示词,却无法预见AI输出的具体内容。因此,AI的输出不构成创作者的思想的具体表达,所以不能认定AI输出的图片为创作者的作品。


笔者认为,该学说存在如下问题:

在Stable Diffusion模型选择确定的提示词就能生成固定图片的情形时,在第一次输入确定的提示词时,输出的结果就已经确定,只是创作者无法预见而已。但如果创作者在使用该Stable Diffusion模型时,该名创作者已经有了非常丰富的模型运用经验,对各种提示词大致对生成图片会造成什么样的影响已经是清楚的,那么,当此刻的创作者在输入明确、具体的文本提示词时,对AI输出的具体内容已经有了很强的预见性,虽然这种情况下,创作者对具体预见AI输出的图画的每一个细节存在很大的难度,但总体上的预见已经确定。此时AI输出的图片实际就是创作者想要表达的内容,表达已经实现。但一般情况下,很少已经有创作者对Stable Diffusion模型的输出已经掌握到视如己出的地步,因此对于大部分创作者来说,认定Stable Diffusion模型是黑盒,不认可是创作者创作是合理的。但这并不意味着当然应当视Stable Diffusion模型为黑盒,仍有单回合认定Stable Diffusion模型生成图片的著作权的可能性。


多回合生成说:在Stable Diffusion模型生成了初次图片后,初次图片与创作者脑海中的图片仍有一定差距,于是通过提示词继续引导Stable Diffusion模型,使其按提示词的要求继续作出个性化的表达,对表达的细节进行修改,直至创作者认为Stable Diffusion模型生成的图片符合创作者脑海中图片的要求为止。根据“人工智能文生图第一案”判决中的内容,可以看出,法院是认可多回合生成说可以认定著作权的。如果按认定Stable Diffusion模型是黑盒是黑盒,认为对每次输入提示词后生成的图片是无法预测的,但这单次的结果无法预测,并不等于多次调整后的结果无法预测。无可否认的是,Stable Diffusion模型能按创作者输入提示词的要求进行调整,在历经多次调整后,总能让AI生成的图片与脑海中的图片在大致上相符,那么生成的图片即构成了对脑海中思想的表达。


依据多回合生成说,并未要求脑海中的图片要非常的明确具体,因为同一种思想可以拥有多种不同的表达模式,所以只要能够通过提示词详细的将思想描述出来,并且Stable Diffusion模型经历多次调整后输出的图片符合脑海中的思想,可以认为是创作者创作。



生成过程中技术机制的结合对生成式人工智能著作权判定影响


在人工智能生成内容的版权认定中,除了基于思想与表达二分法的法律分析外,生成算法本身的技术因素也会对作品的独创性和表达产生影响。例如,生成模型中常用的贪心算法会选择局部最优解,而束优化则通过评估多个潜在输出路径。温度采样则控制生成过程中的随机性,通过调整采样温度可以产生更加多样化或更为保守的输出。这些技术手段在一定程度上影响了生成作品的可预测性、创作过程的个性化表达,从而对著作权的归属认定产生了直接或间接的影响。因此,人工智能生成作品的版权保护不仅要考虑法律框架,还需结合生成过程中的技术机制。

人工智能的生成策略,以下方式较为常见:
贪心算法(Greedy Search)属于高度确定性的方法,它每次都选择预测分布中概率最高的 token,确保输出内容尽可能接近模型的最优预测。然而,这种策略通常会导致生成的文本缺乏多样性,甚至出现重复和冗长的现象,因此不适用于需要多样化或创造性文本的场景。

相比之下,束优化(Beam Search)在保留一定确定性的基础上引入了一定的不确定性。它在每个预测步骤保留多个高概率候选,最终选择最优序列。虽然相对于贪心算法,它提高了生成结果的丰富性,但仍存在生成结果可能相似、前后矛盾等问题。因此,它在提升多样性方面有一定限制。

为了进一步增加不确定性并提升文本的多样性,Top-k 和 Top-p(核采样)策略被引入。Top-k 采样限制了候选范围,仅从前 k 个高概率选项中随机抽样,保留了多样性但仍具备一定的确定性。Top-p 则动态调整候选集合的大小,确保累计概率超过设定值,从而更灵活地控制多样性。这两种方法结合使用,可以更有效地平衡生成文本的确定性和不确定性,避免生成结果过于死板或过于混乱。

温度采样(Temperature Sampling)通过调整概率分布的平缓程度来控制文本生成的稳定性与多样性。温度较低时,生成结果更加保守且稳定;温度较高时,生成的内容更加多样化,但稳定性有所下降。结合具体需求,适当调整温度参数可以显著影响生成文本的风格和可预见性。

因此,不同的采样策略通过调节生成过程中的确定性和不确定性,可以满足不同的应用需求。对于高确定性任务,如回答明确问题时,贪心算法或低温度采样是较好的选择。而对于需要多样性和创意性内容的生成任务,如开放性对话或故事生成,Top-k、Top-p 和高温度采样则更为合适。而采用不同的策略,对著作权最深刻的影响是:人工智能生成物是否具有可复现性。

下一篇文章——《生成式人工智能与版权系列(四)基于人工智能文生图第一案,从著作权保护的思想与表达二分法、及人工智能生成物的可复现性与否看人工智能生成物的版权归属(下)》将会着重论述可复现性对版权归属的影响。



END


许滕律师联系方式:15601657356






分享到: