《薩拉·西爾弗曼:一塵不染》(Sarah Silverman: A Speck of Dust,2017)畫(huà)面。
據(jù)美國(guó)《洛杉磯時(shí)報(bào)》《紐約時(shí)報(bào)》等媒體報(bào)道,當(dāng)?shù)貢r(shí)間上周五,莎拉·西爾弗曼以及另外兩位作家理查德·凱德里(Richard Kadrey)和克里斯托弗·戈登(Christopher Golden)在舊金山聯(lián)邦法院發(fā)起了集體訴訟。莎拉·西爾弗曼除了從事演出以外也是一位作家,她于2010年出版了暢銷回憶錄《尿床者》(暫譯,The Bedwetter)。根據(jù)法庭文件,這些作家聲稱這兩家科技公司將他們圖書(shū)的“文本”注入到被稱為大型語(yǔ)言模型的生成式人工智能軟件中,卻并未給予他們?nèi)魏握J(rèn)可或補(bǔ)償。每項(xiàng)訴訟要求不到10億美元的賠償。
幾周之前,暢銷書(shū)作家莫娜·阿瓦德(Mona Awad)和保羅·特倫布雷(Paul Tremblay)也以類似理由提起圖書(shū)版權(quán)的侵權(quán)訴訟。接受這項(xiàng)訴訟的律師約瑟夫·薩維里(Joseph Saveri)和馬修·巴特里克(Matthew Butterick)還代表幾位視覺(jué)藝術(shù)家對(duì)備受爭(zhēng)議的人工智能藝術(shù)工具“Stable Diffusion”(動(dòng)畫(huà)生成工具)提起訴訟,同時(shí)對(duì)微軟公司的軟件“GitHub Copilot”(編程工具)進(jìn)行集體訴訟。
科幻紀(jì)錄片《我們需要談?wù)劇罚ˋI We Need To Talk About A.I.,2020)畫(huà)面。
OpenAI公司的ChatGPT這類的大型語(yǔ)言模型需要消耗大量的文本,然后這些生成式人工智能開(kāi)始“自我訓(xùn)練”,以便于使用模仿人類自然的回應(yīng)方式來(lái)回答用戶的提示或問(wèn)題。它們可以編寫(xiě)代碼、創(chuàng)作粉絲小說(shuō)、代擬求職申請(qǐng)信,或者幫助完成學(xué)校作業(yè)。另外,Meta公司的生成式人工智能語(yǔ)言模型LLaMA(一種語(yǔ)言模型)與ChatGPT有所不同,它不是一個(gè)問(wèn)答系統(tǒng),而是一個(gè)旨在為人工智能領(lǐng)域內(nèi)的研究人員提供工具的研究工具。然而,這幾起訴訟對(duì)這類模型接收信息的方式和數(shù)據(jù)來(lái)源提出了控訴。
人工智能模型的資料通常來(lái)自于電子圖書(shū)館,其中的一部分是合法的,比如Project Gutenberg(數(shù)據(jù)庫(kù)),這是一個(gè)收集版權(quán)已過(guò)期的電子書(shū)的數(shù)據(jù)庫(kù)。另外一些來(lái)源常被稱為“影子圖書(shū)館”,其中充斥著一些讀者可以獲得的電子書(shū),但通常缺乏作者和出版商的版權(quán)許可。訴訟指責(zé)Meta和OpenAI公司向其人工智能模型提供了包括來(lái)自“影子圖書(shū)館”收集的書(shū)籍在內(nèi)的數(shù)據(jù),并稱這種做法是“公然違法”。
這項(xiàng)訴訟中附有與ChatGPT的對(duì)話副本來(lái)支持原告的主張,這份對(duì)話內(nèi)容顯示,這些人工智能模型能夠準(zhǔn)確地概括莎拉·西爾弗曼、理查德·凱德里和克里斯托弗·戈登等人所寫(xiě)的書(shū)籍,比如ChatGPT可以為西爾弗曼的回憶錄《尿床者》、凱德里的暢銷書(shū)系列“沙人斯利姆系列”(Sandman SlimSeries)以及戈登的超自然驚悚小說(shuō)《亞拉致命峽谷》(Ararat)等書(shū)籍生成摘要。
在這項(xiàng)發(fā)起的訴訟中,被視為涉及侵權(quán)的幾本書(shū)籍。
這項(xiàng)訴訟還引用了公開(kāi)發(fā)表的評(píng)論,該評(píng)論者聲稱收集了Meta公司用于“訓(xùn)練”人工智能的圖書(shū)數(shù)據(jù),并確認(rèn)其中包括了知名影子圖書(shū)館“Bibliotik”的全部圖書(shū),總共超過(guò)19萬(wàn)6640本的侵權(quán)圖書(shū)。幾位原告也指控OpenAI公司向其ChatGPT軟件提供了未經(jīng)授權(quán)的圖書(shū)來(lái)“獲得豐厚的利潤(rùn)”。據(jù)《洛杉磯時(shí)報(bào)》的報(bào)道,生成式人工智能引發(fā)的擔(dān)憂也擴(kuò)散到了音樂(lè)、銀行、電影業(yè)在內(nèi)的其他行業(yè),比如美國(guó)編劇工會(huì)發(fā)起罷工的理由之一,就是好萊塢的制作工作室正在使用人工智能軟件取代編劇和演員的工作。
參考資料:
(1)Sarah Silverman Sues OpenAI and Meta Over Copyright Infringement
https://www.nytimes.com/2023/07/10/arts/sarah-silverman-lawsuit-openai-meta.html
(2)Sarah Silverman and other bestselling authors sue Meta and OpenAI for copyright infringement
https://www.latimes.com/entertainment-arts/books/story/2023-07-10/sarah-silverman-authors-sue-meta-openai-chatgpt-copyright-infringement
編譯/李永博
編輯/羅東
校對(duì)/陳荻雁