文/胡嘉琦
在人工智能大模型的训练中,训练数据的处理所涉及的法律关系并非简单的知识产权关系,而是更类似于人类吸收知识提升智力的过程。因此,我们需要从客观实际操作中了解和定义这些法律关系,从而更好地推动立法进程,促进数字经济的发展。
6月12日—13日,在《商学院》创办20周年之际,《中国经营报》、《商学院》和中经传媒智库主办了2024中国企业竞争力年会系列论坛之“中国商业20年跃迁与创变引领新商业文明”论坛。在院长之夜主题论坛上,中国政法大学互联网金融法律研究院院长李爱君教授发表了关于“数字确权和数据产权制度”的重要演讲。
李爱君指出,在数字经济时代,数据已经成为最重要的生产要素之一。要释放数据价值并构建有效的制度框架,必须从以下四个方面入手:
第一,充分发挥数据自然属性的价值。
对数据自然属性的科学认知是制度建构的基础。数据的自然属性包括:
1.无体性:数据无形,此特征是无争议的。
2.排他性:数据是否具有排他性存在争议。尽管初期研究中李爱君也认为数据不具排他性,但经过长期深入研究和对客观实践的考察,数据确实具有排他性,否则就无法解释数据壁垒和数据集中优势。
3.可控性:尽管存在争议,但数据是可控的,正是可控性导致了数据壁垒的存在。
4.财产属性:数据具有财产属性,这是数据立法的基础。
5.无消耗性:数据在使用过程中不消耗,可以多次复制和使用。
6.非竞争性:数据的使用不具有竞争性。
第二,科学认知数据与信息的区别。
混淆数据与信息的概念将导致立法的逻辑混乱。李爱君引用《中华人民共和国数据安全法》和《深圳数据条例》的定义,说明数据和信息在法律层面上的不同之处,呼吁立法者在制定相关法律时必须明确区分两者,以确保法律的科学性和可操作性。
第三,尊重数据的双重结构特征。
数据由载体层和内容层组成,这种双重结构特征决定了数据在释放价值时需要遵守数据记录信息内容层的相关法律制度,对内容层相关主体的权益进行保护,如《中华人民共和国个人信息保护法》和《中华人民共和国保守国家秘密法》等。李爱君强调,只有在充分认知数据双重结构特征的基础上,才能构建科学的数据产权制度。
第四,充分保护数据承载的多元主体的合法权益。
李爱君将数据比作书,强调数据承载了多元主体的权益。她指出,在数据立法过程中,必须明确区分数据权利和数据记录内容的相关主体权利,在维护数据记录内容相关主体权利的前提下,建立以数据为权利客体的控制权、处理权、处分权和收益权的法律框架,以保护各方合法权益。
李爱君的演讲不仅为数据确权和数据产权制度的构建提供了理论基础,还呼吁企业家和技术研发者积极参与立法过程,实现立法的民主性,推动法律的科学性。她指出,只有通过实务界的积极参与和科学认知,才能形成科学的法律制度,促进数字经济的高质量发展。
最后,李爱君特别强调了在大模型训练中知识产权保护的问题。她认为,大模型训练过程类似于读书学习,属于知识吸收和智力提升的过程,并非简单的知识产权关系,需要从实际操作中了解和定义法律关系,从而更好地推动立法进程。立法者在制定相关法律时应充分考虑这一点,以避免过度限制技术发展,从而更好地促进数字经济的发展。