作者:许滕
上海天知澜律师事务所高级合伙人、天知澜苏州分所执行主任。知识产权、TMT、数据与科技法方向律师,专利代理师。
2017年通过司法考试,长期从事法律工作,本科国防科技大学信息与通信工程专业,研究生同济大学电子信息专业人工智能与自动化方向,具有深厚的法律底蕴和技术基础。许滕律师从事知识产权、数据、TMT、科技法方向的日常法律咨询、专项合规、诉讼、专利无效及其他专项法律业务,行业主要集中在人工智能、软件工程、嵌入式系统、集成电路、TMT、大数据等。
在当今科技与法律深度交融的时代背景下,生成式人工智能与版权之间的关系愈发复杂且备受关注。此前,我们在本系列的首篇文章中,已对生成式人工智能的概念、现代人工智能领域核心技术以及人工智能生成物“独创性”的判断依据等内容进行了简述与分析,并明确了人工智能生成物具备获得“独创性”的可能性。在此基础上,本篇文章将围绕“独创性”的来源及其分配展开进一步探讨,同时概述人工智能(AI)涉及的其他版权问题,以期为大家深入剖析这一复杂领域的诸多关键要点。
人工智能技术本身产生的“独创性”能力
01 纯粹的“符号主义”人工智能
符号主义人工智能(Symbolic AI)聚焦于运用符号和逻辑来呈现知识以及进行推理。其具备以下显著特点与主要技术:
主要特点:
1.符号表示:该类型的人工智能采用明确的符号,如单词、变量、常量、函数及关系等,用以表示知识与信息,使得知识能够以一种特定的符号形式被存储和处理。
2.逻辑推理:依靠逻辑规则与推理机制来操作这些符号,进而实现推理和决策过程。常见的逻辑系统涵盖一阶逻辑、模态逻辑等,通过严谨的逻辑规则推导,尝试模拟人类的思维推理模式。
3.显式知识库:符号主义 AI 通常依赖于预先构建的显式知识库,这里面包含了大量关于世界的事实与规则,作为其进行推理和决策的重要依据来源。
主要技术:
4.专家系统:借助知识库与推理引擎,模拟人类专家的决策流程,旨在针对特定领域的问题,依据知识库内的既有知识和设定的推理规则,给出相应的解决方案或决策建议。
5.定理证明:运用逻辑规则与推理算法,对数学和逻辑命题的正确性予以证明,是符号主义在数学逻辑领域的重要应用体现。
6.自然语言处理(早期形式):例如早期的语法解析器和语义网络,通过符号化的方式对自然语言进行解析和理解,尝试把握语言的结构与语义关系。
7.规划和调度:依据符号和逻辑规则,对任务进行规划安排以及资源的合理调度,确保各项活动能够按照既定的逻辑有序开展。
然而,从技术本质层面审视,“符号主义”人工智能的核心在于“符号”以及“逻辑规则”本身,且各类“符号”均由开发者预先设定,这就导致其灵活性严重受限,先天便缺乏产生“独创性”的能力,其输出更多是基于既定规则和预设符号的组合运用,难以创造出全新的、前所未有的内容。
与“符号主义”不同,“联结主义”侧重于通过模拟大脑神经网络的结构与功能来开展计算和学习。它借助复杂的网络结构,不断挖掘深层次的特征信息,并依照统计学习规律进行内容生成。
在“联结主义”范畴内,“独创性”的体现与神经网络结构的深度和规模密切相关。理论上而言,神经网络结构越深层、规模越庞大,就越能够提取到深层次的特征信息,而这些深层次特征信息经过重构与组合后,更易于展现出“独创性”。
回顾本系列首篇文章对传统机器学习技术和深度学习技术的对比可知,大模型在生成领域所展现出的“独创性”本领已然较为突出。总体来看,仅就技术本身而论,大模型技术的“独创性”高于深度学习技术,深度学习技术的“独创性”又高于传统机器学习技术。不过需要明确的是,这种“独创性”本领的排序并非绝对,而是要结合具体应用技术以及实际应用场景进行具体分析,毕竟不同场景下各技术的表现和发挥的作用会存在差异。
其他的“独创性”本领赋予主体分析
从现有司法判决案例来看,法院在认定人工智能生成物具有“独创性”时,并未对人工智能所运用的具体技术加以限定,也就是说,无论基于何种人工智能技术所产生的生成物,都存在具备“独创性”的可能。
当某一人工智能技术本身所具备的生成“独创性”能力不足时,那么剩余的“独创性”便只能来源于其他参与主体。在人工智能的整个生态系统中,除了开发者之外,使用者也是重要的参与主体。
在人工智能的开发过程中,虽然开发者自身很可能贡献了相当程度的“独创性”,但不容忽视的是,若没有使用者的参与,仅仅依靠开发者和人工智能本身,是无法产出具体的人工智能生成物的。基于这一现实情况,在很多情形下,开发者的版权主体身份往往难以得到认定,甚至可视为开发者将自身具备的“独创性”本领赋予了人工智能,进而使得其在版权归属方面的角色认定更为复杂。
具有“独创性”的版权主体认定
在满足其他相关条件的前提下,涉及人工智能生成物“独创性”的版权主体,从可能性角度来看,主要集中在人工智能的所有者(通常为开发者)、使用者以及人工智能本身这三个主体上。然而,鉴于当前法律尚未赋予人工智能版权主体的地位,所以实际上可供考量的主体便缩减至人工智能的所有者(开发者)和使用者这两类。
依据前文分析,在未作特殊约定的情况下,开发者的版权主体身份往往不易被认可,其原因在于开发者通常被视作将“独创性”本领赋予了人工智能,进而导致其自身很难成为版权主体。
就目前的法律实践而言,若人工智能的所有者(开发者)与使用者在相关协议中明确约定,将人工智能生成物的所有权或版权赋予使用者,那么法院在审理此类案件时,往往倾向于支持使用者享有相应版权,这里的版权涵盖了使用者自身的“独创性”以及人工智能所展现出的“独创性”,即认定版权归使用者所有。
而对于使用者与所有者(开发者)签订协议,约定人工智能生成物的版权均归开发者所有的情况,尽管目前暂无相关判例可供参考,但考虑到人工智能本身不具备版权主体身份这一客观事实,笔者认为,在此种情形下,同样难以认定开发者能够成为人工智能生成物的版权主体,其背后涉及到诸多法律层面对于主体资格、权利赋予以及实际创作贡献等多方面因素的考量。
其他生成式人工智能与版权问题概述
生成式人工智能与版权之间的关联极为复杂,除了上述所探讨的人工智能生成物的版权归属问题之外,还存在大量其他值得关注的版权相关事项,以下将逐一进行概述:
01 生成式人工智能训练集的版权风险
生成式人工智能高度依赖大量的训练数据,而这些数据中常常涵盖受版权保护的作品。即便生成的内容在表面上呈现为新的创作,但只要其本质上是对原始作品的模仿或复制,就存在构成版权侵权的可能性。
并且,即便训练数据本身不存在侵犯版权的情况,也不能绝对保证生成物就不会侵犯他人版权。所以,为了尽可能避免此类侵权行为发生,有必要在生成式人工智能的设计和应用过程中,做好生成抑制功能,通过技术手段和规则设定等方式,对可能产生侵权的内容生成加以管控,降低侵权风险。
02 生成式人工智能生成物是否属于衍生品的问题衍生品在版权领域有着明确的定义,即基于原有作品进行改编、翻译或其他形式的再创作作品。对于生成式人工智能生成物而言,如果其被认定为衍生品,那么在使用和传播过程中,就必须获得原作品版权持有者的许可。
这一认定结果无疑会增加生成式人工智能的使用成本,同时也可能对其创新和发展形成一定限制,毕竟获取众多原作品版权许可并非易事,且可能涉及复杂的协商和授权流程,所以如何准确界定生成式人工智能生成物与衍生品之间的关系,是一个亟待解决且影响深远的问题。
03 生成式人工智能生成物侵犯他人版权的责任承担问题在生成式人工智能的整个生态系统中,涉及多个主体,包括开发者、使用者以及服务提供者等。当生成物出现侵犯他人版权的行为时,究竟应由谁来承担相应的法律责任,这是一个颇为复杂且关键的问题。
特别是在生成物的侵权行为是由用户的恶意使用所导致的情况下,是否能够追究用户的责任,同时又如何保障开发者和服务提供者的合法权益,需要综合考量各方在整个过程中的角色、行为以及相应的注意义务等因素,通过完善的法律规定和责任划分机制来妥善解决,避免出现责任推诿或权益无法保障的局面。
04 开源协议“传染性”对生成式人工智能版权的影响开源协议中常见的“传染性”条款要求衍生品也必须遵守相同的开源协议,这一特性在生成式人工智能开发过程中可能会对版权保护产生重要影响。
当使用开源软件进行生成式人工智能开发时,如果未能充分了解并严格遵守开源协议的相关规定,很可能会引发版权纠纷,进而影响到生成式人工智能生成物的版权归属、使用范围以及后续的传播等多个方面,所以开发者在利用开源资源时,必须对开源协议的“传染性”条款予以高度重视,确保开发行为的合规性。
05 其他相关问题
此外,还存在部分人工智能生成物虽未被授予版权,但开发者和使用者在其产生过程中付出了大量劳动或进行了其他要素投入的情况,对于此类生成物是否应当参照版权保护的相关规定予以保护,以及依据何种法律基础来实施保护,同样是值得深入探讨的问题。
同时,对于生成式人工智能服务提供者而言,如何制定并实施严格的版权管理制度,加强对用户行为的监控和管理,确保生成物的合法性和合规性,以有效防范版权风险,也是其在运营过程中面临的重要挑战。
END
许滕律师联系方式:15601657356