新闻中心

(下篇)基于人工智能文生图第一案,从著作权保护的思想与表达二分法、及人工智能生成物的可复现性与否看人工智能生成物的版权归属

发布时间:2025-04-08

作者:许滕

上海天知澜律师事务所高级合伙人、天知澜苏州分所执行主任。知识产权、TMT、数据与科技法方向律师,专利代理师。

2017年通过司法考试,长期从事法律工作,本科国防科技大学信息与通信工程专业,研究生同济大学电子信息专业人工智能与自动化方向,具有深厚的法律底蕴和技术基础。许滕律师从事知识产权、数据、TMT、科技法方向的日常法律咨询、专项合规、诉讼、专利无效及其他专项法律业务,行业主要集中在人工智能、软件工程、嵌入式系统、集成电路、TMT、大数据等。


在生成式人工智能与版权系列(三)基于人工智能文生图第一案,从著作权保护的思想与表达二分法、及人工智能生成物的可复现性与否看人工智能生成物的版权归属一文中,论述多回合生成说的人工智能生成物的文生图应当认定为作品的前提是“在Stable Diffusion模型输出的结果及流程可复现时”,上文的前提和结论也由“人工智能文生图第一案”判决书中记载的前提:“原告主张该图片系其于2023年2月24日通过软件Stable Diffusion生成,其提交再现涉案图片生成过程的视频,具体操作步骤如下:”以及通过判决的方式认定“原告享有涉案的生成式人工智能生成的图片的著作权”的结论相印证。

“人工智能文生图第一案”的判决认定前提就是生成式人工智能的生成物的“可复现性”,该案的“可复现性”包括两点:一、结果可复现,即该生成式人工智能再次最终能够生成与主张著作权的图片完全相同的图片;二、流程可复现,即通过相同的提示词顺序和相同的提示词内容,能够生成与主张著作权的图片完全相同的图片。本文将继续论述生成式人工智能的生成物的“可复现性”对著作权认定的影响。


同一人工智能可复现的理解


在讨论生成式人工智能(如ChatGLM、GPT、Stable Diffusion等)时,确定“同一人工智能”的概念至关重要。因为研究和认定可复现性前提是要在同一人工智能上实验。然而,理解“同一人工智能”不仅仅涉及模型的外部表现,还包括其内部结构、数据处理方式、硬件平台、软件环境以及推理策略的选择。这些方面都可能影响模型的输出结果,因此在讨论“同一人工智能”时,我们需要从多层次、多维度进行深入分析。

1、软件部分,至少包括:
1.1 模型架构、参数的一致性。即具有相同的层数、相同的注意力头、相同的激活函数、相同的归一化方法等,具有相同的量化,具有包括超参在内的相同的参数。

1.2 预处理方式的一致性,输入数据的预处理方式直接影响模型的输出结果,如分词、编码、去停用词的方式不同等。输入数据的格式或编码方式的微小差异也可能导致不同的输出。例如,在生成图片时,输入的图像的特征向量可能会进行裁剪、缩放或归一化,会对结果造成影响。

1.3 推理策略的一致性
大模型在生成任务中通常涉及推理策略的选择。推理是指模型在给定输入下生成输出的过程,例如文本生成任务中的下一个词的预测、图片生成任务中的像素生成等。推理策略有多种不同的方法,如贪心算法、束搜索、温度采样等。即使是相同的模型和输入,不同的推理策略也可能产生不同的输出结果。

1.4 相同的软件环境,如果环境不同,显而易见的会对输出结果产生影响。

2、硬件部分,至少包括,硬件配置完全相同。
因为即使在相同的开发环境、系统配置和随机种子下,不同的 GPU 也会导致 LLMs 产生不同的模型输出。同一大模型在不同GPU上的输出结果产生差异的原因可以从以下几个方面解释:

浮点运算的不确定性:由于浮点运算不满足结合律,所以即使在相同的硬件配置、开发环境、系统设置和随机种子下,不同的GPU在处理浮点运算时可能会存在微小的差异。即使是极小的误差,经历数百万次计算,误差可能累积,影响最终的模型输出。在短提示的情况下这些差异不太明显,但随着提示长度的增加,误差逐渐累积,导致输出差异逐渐显著。

并行处理的差异:不同GPU在管理并行任务时有所不同。内存的访问顺序、任务分割的方式以及计算结果的组合方式在不同硬件架构下可能存在差异。这种差异在数百万次的计算中放大会导致模型的输出结果出现偏差。

硬件架构的差异:不同GPU的硬件架构差异会直接影响浮点运算、内存带宽以及计算单元的表现。例如,Nvidia的T4基于Turing架构,而A10G基于Ampere架构,这些架构之间在处理并行计算、内存访问和浮点运算上都有不同的优化方式,会影响模型输出。

模型量化的影响:模型量化是通过降低计算精度以换取更高的计算效率和更小的内存占用。然而,不同的GPU在处理低精度运算时方法上略有差异,因此在量化模式下,GPU对近似值的处理会影响到模型的输出。

RNN类模型的情况:对于RNN类模型,特别是依赖于cuDNN和CUDA的实现,可能会因为GPU上的底层库(如cuDNN版本的差异)导致结果不可复现。这类问题可以通过设置特定的环境变量来缓解,确保相同的计算路径。

3、即使是相同的软硬件环境,GPU内存的使用率过高、温度过高、频率过低也会对结果产生影响,因此需要尽量避免GPU过载,以降低这些可能的额外因素的影响。

事实上,对生成式人工智能,尤其是大模型,影响输出的因素很多,但这并不意味着生成式人工智能的输出结果是完全随机的。通过设置temperature=0、deterministic=True,定下相同的随机种子等,尽可能的去掉随机因素,类似于Stable Diffusion模型的过程和结果复现是完全有可能的。

因此,人工智能的输出并不能理解为一个完全随机且不可预测的的黑盒。以“生成式人工智能相同的输入,却会产生不同的输出,这些输出完全是随机的,因此创作者的一个思想生成多种不同的表达形式,对生成式人工智能的表达不能决定,表达随机且完全依赖于人工智能本身,以进而推出创作者只有思想而没有表达的说法不能成立。”


可复现与创作工具说的理解


赋予创作者以人工智能生成物的著作权,创作工具说的主要理论是将人工智能与相机、画笔等作为对比,认为人工智能是人创作的工具,因此应当认定人工智能生成物为作品。华东政法大学王迁教授在《三论人工智能生成的内容在著作权法中的定位》一文中写到,“认定创作工具的标准并不在于其是否能够以相同的方式处理其收到的指令、产生了相同的结果,而在于其是否直接决定或实质性参与决定了结果。如果答案是否定的,相关结果由人提出的特定要求所直接决定,则其是创作的工具。反之,说明提出特定要求的人无法决定甚至在许多情况下无法预见所产生的结果,此时就不能说是人以其为工具进行创作。”很明显,创作工具说不能成立,因为人工智能所受的训练数据和算法实质性的决定其所能输出的内容,表达的内容并不是由创作者完全决定的。

生成式人工智能的可复现并不当然的意味着人工智能是人创作的工具,创作工具也不是赋予著作权的必然要求。根据思想与表达二分法,创作者需要将自己的思想以确定的方式表达出来即可,因此,可复现性决定了其表达是确定的。创作者有自己的思考,并通过人工智能表达出来,应当认为其符合《著作权法》作品的要求。

可复现与唯一确定性的区别,及与著作权的关系


“创作”是一种基于能直接决定表达性要素的自由意志的行为,“无意识的自动创作”并不是真正的创作。生成式人工智能可能会有这样的一种输出:“按相同的顺序输入相同的提示词,通过反复实验,发现该人工智能有且仅可能会生成图画A、图画B、图画C、图画D四种有区别的图片,但是反复实验发现这四种图片都可能会重复出现,即在输出提示词时,存在随机的四种可能性,每次都会生成A、B、C、D中的随机一张图。”此时,能否依据创作者也无法知道他的思想将会是何种表达而否认掉其享有图画的著作权呢?

试想这样一种场景,你要作一幅图,但是你用了一种神奇的笔,这种笔的神奇之处在于,每次你决定作画后,都会随机的伸出毛笔、钢笔、彩水笔、铅笔四种之一,你无法决定你作画的时候会出现哪一种笔,那么,如果你使用这种神奇的笔作出一幅画,因你的思想在作画前无法确定会用何种笔表达,就可以否认掉你享有这幅画的著作权吗?这显然是不行的。因此,认定是否能成为作品和确定著作权的归属,唯一确定性并不是必然的条件,只要确认具有可复现性即可。


生成式人工智能“选择作图论”的不合理之处



生成式人工智能“选择作图论”的含义是:人工智能所受的训练数据和算法实质性的决定其所能输出的内容,创作者的不断调整提示词的过程,实质是选择输出内容的过程,选择行为不是表达行为,因此不能够赋予创作者该图画的著作权。”笔者认为,分析是选择还是表达,关键是分析提供的选择是否足够丰富且系统,能够将创作者的思想按提示词的方式调整和表达出来。


如果我是一名英语初学者,仅仅学会了英语常见的500个单词,但我已经能够通过500个单词写作文,将我简单的思考表达了出来。显然,我应该享有对这篇英文作文的著作权。从选择的角度来看,我只能在这500个单词中选择拼凑,如果按“选择作图论”的理解来看,我不应当享有著作权,这显然是错误的。我虽然仅能够在500个单词中选择拼凑,但这500个单词的组合已经能够表达我的简单思想。对于不断的用提示词调整图画以使得其符合对创作者思想来看,这种选择的过程已经足够细微且系统,能够表达出创作者的思想,应当认定为是对创作者思想的表达,赋予创作者著作权。


不可复现的生成式人工智能生成物是否能够认定为创作者的作品?


人工智能的生成图片不可复现,如果是由于证据的问题(如丢失、改变了原先生成式人工智能的参数而不可改回),应当根据《民事诉讼法》的规定处理。如果不是证据原因,而是确实不可复现,可以确定该图片的生成是一个完全的随机性过程,且本质与之前论述的可复现但不符合唯一确定性的情形不同。许多艺术的创作具有较大的随机性,比如泼墨成画,但泼墨成画本身就不能认定为《著作权法》意义上的作品,只是具有艺术价值罢了。不可复现的生成式人工智能生成的画,虽体现了创作人的意志,但是表达是随机性的,不确定的,人工智能所受的训练数据和算法实质性的决定其所能输出的内容,创作者失去了对其表达内容的决定,图片是人工智能完全随机生成的表达。正如泼墨成画一样,即使泼墨成的画表现出了创作人想要表达的思想,这种随机表达结果也不能认定为作品。

综上所述,可复现性是对创作者享有生成式人工智能生成的图的著作权的必要因素,无可复现性,即无著作权。


END


许滕律师联系方式:15601657356






分享到: