作者:许滕
上海天知澜律师事务所高级合伙人、天知澜苏州分所执行主任。知识产权、TMT、数据与科技法方向律师,专利代理师。
2017年通过司法考试,长期从事法律工作,本科国防科技大学信息与通信工程专业,研究生同济大学电子信息专业人工智能与自动化方向,具有深厚的法律底蕴和技术基础。许滕律师从事知识产权、数据、TMT、科技法方向的日常法律咨询、专项合规、诉讼、专利无效及其他专项法律业务,行业主要集中在人工智能、软件工程、嵌入式系统、集成电路、TMT、大数据等。
在当今数字化快速发展的时代,生成式人工智能与版权的关系日益成为各界关注的焦点。此前我们已对相关内容进行了系列探讨,而本文将基于人工智能文生图第一案,从著作权保护的思想与表达二分法以及人工智能生成物的可复现性与否这两个重要维度,深入剖析人工智能生成物的版权归属问题。
著作权保护的思想与表达二分法的运用现状
01 国际层面的规定与影响
1994年签订的《与贸易有关的知识产权协定》(TRIPS 协议)有着重要意义,它将思想表达二分法纳入国际贸易规则之中。TRIPS 协议第9条“与《伯尔尼公约》的关系”第二款明确指出:版权的保护仅延伸至表达方式,而不延伸至思想、程序、操作方法或数学概念本身。这一规定清晰阐述了著作权保护的思想与表达二分法这一基本原则,即将作品的思想与表达进行区分,仅对表达赋予版权保护,思想则不在版权保护范畴之内。在TRIPS协议的框架引领下,各成员国对于思想与表达二分法的运用理念逐渐趋于统一,为全球范围内著作权保护相关实践奠定了重要基础。
02 我国相关法规中的体现与运用
在我国,著作权法虽未对思想与表达二分法作出明确且详尽的规定,但在诸多法规条文中已然有所体现并在实际的法治实践中广泛运用。
例如,《计算机软件保护条例》第六条规定:“本条例对软件著作权的保护不延及开发软件所用的思想、处理过程、操作方法或者数学概念等。”通过这一规定,将软件创作过程中的思想与表达进行了明确区分,为软件相关的著作权纠纷处理提供了依据。
同时,我国《著作权法》第三条规定:“本法所称的作品,是指文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果。”此条虽未直接点明思想与表达二分法,但明确要求作品需“以一定形式表现”,实则也在一定程度上体现了该原则。并且,思想与表达二分的方法在我国诸多著作权纠纷案件中被大量运用,像庄羽与北京图书大厦有限责任公司侵犯著作权纠纷案、“蓝月传奇”诉“烈焰武尊”游戏侵权纠纷案、“太极熊猫”诉“花千骨”游戏侵权纠纷案、杭州网易雷火科技有限公司诉广州简悦信息科技有限公司著作权侵权及不正当竞争纠纷案以及金庸诉江南《此间的少年》侵权案等等。这些案例充分表明,思想与表达二分法虽未在我国著作权法中以直白的条文明确规定,但已融入到实际的法律适用与纠纷解决过程中,成为重要的判断依据。
人工智能文生图第一案中思想与表达二分法的体现
01 作品认定的法定条件及案件中的分析
我国《著作权法》第三条明确了认定为作品必须具备以下四个条件:一是必须处于文学、艺术、科学领域内;二是具有独创性;三是“以一定形式表现”;四是必须是智力成果。
在“人工智能文生图第一案”判决生效后,审理该案的人民法院指出,鉴于传统的著作权理论与当下技术发展现实已不相匹配,应当进行调适和发展,以适应现实情况变化,更好地满足权益保护和产业发展需求。这意味着我们需要与时俱进,以更开阔的视角去理解相关概念。
就该案中涉案图片来看,从外观上它与常见的照片、绘画并无差异,显然属于艺术领域,满足作品认定的第一个条件,且具备一定的表现形式。在论述独创性方面,法院认为,原告对于人物及其呈现方式等画面元素通过提示词进行了设计,对于画面布局构图等通过参数进行了设置,这体现了原告的选择和安排。而且,原告通过输入提示词、设置相关参数获得第一张图片后,继续增加提示词、修改参数,不断调整修正,最终获得涉案图片,此调整修正过程亦体现了原告的审美选择和个性判断。同时,在庭审中,原告通过变更个别提示词或者变更个别参数,能够生成不同的图片,由此可以认定涉案图片并非“机械性智力成果”,在无相反证据的情况下,可认定涉案图片由原告独立完成,体现出了原告的个性化表达。
02 对“个性化表达”中“表达”的理解
那么,这里原告的个性化表达中的“表达”,究竟应当理解为《著作权法》第三条中第二个条件“具有独创性”的要求,还是第三个条件“以一定形式表现”的要求呢?
从文义角度剖析,“具有独创性”涵盖“独”和“创”两个要件。“独”着重考量作品创作过程中作者的独立完成程度,即判断是否抄袭他人,若未抄袭则满足“独”的条件;“创”则要求作品的作者完成一定程度的创造,彰显出作者的个性化。而“具有一定的表现形式”是指“作品”应当具备如声音、文字、色彩、符号等有形的外在表现形式。
若仅从狭义、浅显的字面意义理解,似乎“表达”与这两个条件关联性不大,但如果进行扩大解释,将名词短语作动词短语来理解,“具有一定的表现形式”也可理解为把“智力成果”这种思想展现出来,而这一动态过程就是“表达”。
例如,北京市高级人民法院关于审理涉及综艺节目著作权纠纷案件若干问题的解答中提到,综艺节目模式属于思想范畴的部分,因其没有一定的表现形式,不受《著作权法》的保护;而“舞美设计”“音乐”等不属于思想,具有一定的表现形式,它们正属于思想的表达,所以能够受《著作权法》的保护。
综合上述分析可以看出,个性化表达中的“表达”应当理解为第三个条件“以一定形式表现”的要求,而“个性化”应当理解为第二个条件“具有独创性”的要求。
对于以生成式人工智能为媒介的文生图而言,其无疑符合作品认定的第一个条件规定,而第2、4个条件在本系列文章的前面两篇已有所阐述,所以关键在于评析是否符合“以一定形式表现”这一条件,也就是要剖析其表达是如何实现的。
03 人工智能生成物(文生图)的表达实现方式
按创作需求不断调整提示词的多次用户输入
在探讨人工智能生成物(文生图)的表达实现时,存在不同的学说与观点,尤其在 Stable Diffusion 模型输出的结果及流程可复现时,情况更为复杂。
单一回合生成说:
创作者输入文字提示词,然后 AI 回复具体图片,有学者将此视为“暗箱模式”,即创作者输入特定文本提示词后,却难以预见 AI 输出的具体内容。基于此,该学说认为 AI 的输出不构成创作者思想的具体表达,所以不能认定 AI 输出的图片为创作者的作品。然而,这一学说存在一定问题。
在 Stable Diffusion 模型选择确定的提示词就能生成固定图片的情形下,当第一次输入确定的提示词时,输出结果其实已然确定,只是创作者事先无法预见罢了。倘若创作者有着丰富的模型运用经验,对各类提示词大致会对生成图片产生何种影响较为清楚,那么在输入明确、具体的文本提示词时,其对 AI 输出的具体内容便会有较强的预见性。尽管要精准预见 AI 输出图画的每一个细节难度颇高,但总体上的预见是能够达成的。此时,AI 输出的图片实际上就是创作者想要表达的内容,表达也就得以实现。不过,通常大部分创作者很难对 Stable Diffusion 模型的输出掌握到如此程度,所以对于多数创作者而言,将 Stable Diffusion 模型视作黑盒,不认可是创作者创作在一定程度上是合理的。但这并不意味着绝对要视 Stable Diffusion 模型为黑盒,仍然存在单回合认定 Stable Diffusion 模型生成图片的著作权的可能性。
多回合生成说:
在 Stable Diffusion 模型生成初次图片后,若该图片与创作者脑海中的预期图片存在一定差距,创作者可通过提示词继续引导模型,使其按提示词要求持续作出个性化表达,对表达的细节进行修改,直至生成的图片符合创作者脑海中的设想为止。从“人工智能文生图第一案”判决内容来看,法院是认可多回合生成说可用于认定著作权的。即便认定 Stable Diffusion 模型是黑盒,认为每次输入提示词后生成的图片无法预测,但单次结果的不可预测并不等同于多次调整后的结果也无法预测。不可否认的是,Stable Diffusion 模型能够依据创作者输入的提示词要求进行调整,历经多次调整后,总能让 AI 生成的图片与创作者脑海中的图片大致相符,那么此时生成的图片便可构成对创作者脑海中思想的表达。
并且,依据多回合生成说,并未要求创作者脑海中的图片必须非常明确具体,因为同一思想可以通过多种不同的表达模式呈现,只要创作者能够借助提示词详细描述思想,且 Stable Diffusion 模型经多次调整后输出的图片符合脑海中的思想,便可以认定为是创作者的创作。
生成过程中技术机制的结合对生成式人工智能著作权判定影响
01 技术因素对作品特性的影响
在人工智能生成内容的版权认定过程中,除了依据思想与表达二分法进行法律层面的分析外,生成算法本身的技术因素同样不容忽视,其会对作品的独创性和表达产生重要影响。
例如,生成模型中常用的贪心算法会选择局部最优解,它每次都选择预测分布中概率最高的 token,以此确保输出内容尽可能接近模型的最优预测。不过,这种策略容易致使生成的文本缺乏多样性,甚至出现重复和冗长的现象,所以不太适用于那些需要多样化或创造性文本的场景。
与之相比,束优化在保留一定确定性的基础上引入了一定的不确定性。它在每个预测步骤保留多个高概率候选,最终选择最优序列。尽管相较于贪心算法,束优化在提高生成结果丰富性方面有所进步,但依然存在生成结果可能相似、前后矛盾等问题,在提升多样性方面存在一定局限。
为了进一步增加不确定性并提升文本的多样性,Top-k 和 Top-p(核采样)策略应运而生。Top-k 采样限制了候选范围,仅从前 k 个高概率选项中随机抽样,在保留一定确定性的同时兼顾了多样性。Top-p 则动态调整候选集合的大小,确保累计概率超过设定值,从而更灵活地控制多样性。将这两种方法结合使用,能够更有效地平衡生成文本的确定性和不确定性,避免生成结果过于死板或过于混乱。
另外,温度采样通过调整概率分布的平缓程度来控制文本生成的稳定性与多样性。当温度较低时,生成结果更加保守且稳定;温度升高时,生成的内容更加多样化,但稳定性会有所下降。结合具体需求,合理调整温度参数能够显著影响生成文本的风格以及可预见性。
02 不同采样策略对著作权判定的影响
不同的采样策略通过调节生成过程中的确定性和不确定性,能够满足不同的应用需求。对于像回答明确问题这类高确定性任务而言,贪心算法或低温度采样是较为合适的选择;而对于开放性对话、故事生成等需要多样性和创意性内容的生成任务,Top-k、Top-p 和高温度采样则更为适用。
而这些不同策略对著作权最关键的影响体现在人工智能生成物是否具有可复现性方面。这一因素对于版权归属的判定至关重要,我们将在下一篇文章——《生成式人工智能与版权系列(四)基于人工智能文生图第一案,从著作权保护的思想与表达二分法、及人工智能生成物的可复现性与否看人工智能生成物的版权归属(下)》中着重论述可复现性对版权归属的影响,以期进一步深入探讨人工智能生成物的版权归属这一复杂且关键的议题,为相关领域的实践与研究提供更全面的参考依据。
END
许滕律师联系方式:15601657356