10月22日,全球超过10500名创意产业人士签署一份声明,警告人工智能公司未经许可使用他们的作品,称这是对艺术家生计的“重大、不公正威胁”。声明发表之际,创意产业人士与科技公司之间正就版权问题发生一系列法律纠纷。
数据的“非人化”与“合理使用”
据《卫报》22日报道,来自文学界、音乐界、电影界、戏剧界和电视界的创意产业人士对该声明表示支持,其中包括瑞典ABBA乐队成员比约恩·乌尔瓦尤斯(Björn Ulvaeus)、美国女演员朱丽安·摩尔(Julianne Moore)、“电台司令”(Radiohead)乐队主唱托姆·约克(Thom Yorke)、诺贝尔文学奖得主石黑一雄(Kazuo Ishiguro)等。包括美国音乐家联合会、美国演员工会电视和广播艺人联合会(SAG-AFTRA)、欧洲作家理事会和环球音乐集团等创意产业组织和公司也签署了这份声明。
这份只有短短29个词的声明写道:“未经许可使用创意作品来训练生成式人工智能,是对这些作品背后创作者生计的重大、不公正威胁,绝不允许。”这封信的发起者、非营利组织Fairly Trained首席执行官、英国作曲家、前人工智能高管埃德·牛顿-雷克斯(Ed Newton-Rex)表示,以创意工作为生的人对知识产权未收到保护的情况感到 “非常担忧”。
“生成式人工智能公司建立人工智能模型需要三种关键资源:人员、计算和数据。他们在前两者上花费巨资——有时在一个工程师上花费超100万美元,而每个模型花费高达10亿美元,但他们却希望免费获得训练数据。”
牛顿-雷克斯认为,当人工智能公司把这些“数据”称为“训练数据”时,就是把这些“数据”非人化了,而实际上这背后是人们的艺术创作。
牛顿-雷克斯曾是科技公司Stability AI的音频主管,但去年因公司认为未经许可使用受版权保护的内容来训练人工智能模型构成“合理使用”而辞职。
OpenAI等科技公司需要文本、图像、视频和其他材料来训练聊天机器人等人工智能系统的算法。这些数据通常是未经同意、未获得补偿或未注明来源就从互联网上抓取的。
科技公司辩称,这种做法受到版权法的“合理使用”保护,但内容所有者和出版商的反击日益激烈。它们在诉讼和向监管机构提出的请求中声称,使用其作品的人工智能开发者非法侵犯了版权。
在美国,约翰-格里沙姆(John Grisham)、乔迪-皮考特(Jodi Picoult)和乔治-RR-马丁(George RR Martin)等一批作家起诉OpenAI涉嫌侵犯版权;索尼音乐、环球音乐集团和华纳音乐集团等大型唱片公司也在起诉人工智能音乐公司Suno和Udio。
看似有选择的“退出计划”
一些内容出版商与科技公司也并非完全“硬碰硬”,它们或与其签署协议,提供对数据的访问权限,以换取报酬或其他利益。
而对于来自政府层面的监管举措,认为生成式人工智能“剥削创造者”的牛顿-雷克斯则发出了警告。
上个月,谷歌呼吁英国放宽对文本和数据挖掘(TDM)做法的限制,即允许出于学术研究等非商业目的复制受版权保护的作品。据《金融时报》报道,英国政府正就一项计划进行磋商,该计划将允许人工智能公司从艺术家和出版商那里获取内容,除非后者“选择退出”这一过程。
牛顿-雷克斯曾为人工智能公司实施过退出计划,他表示,“退出”选项存在缺陷,因为大多数人并不知道有这样的计划,即使设计地非常完美,大多数人也可能错过。
“将退出人工智能训练的责任推给创作者是完全不公平的。如果政府真的认为这对创作者来说是件好事,那么它就会制定一个选择加入的计划。”