近期,備受行業(yè)關(guān)注的美國(guó)人工智能公司Anthropic侵權(quán)一案有了新進(jìn)展。Anthropic公司向法官表示,愿意支付15億美元以和解作家集體訴訟,這一消息再次引發(fā)全球范圍內(nèi)對(duì)人工智能訓(xùn)練數(shù)據(jù)合法性問題的激烈討論。這起具有標(biāo)志性的案件,不僅將重塑美國(guó)乃至全球人工智能企業(yè)的合規(guī)路徑,也為正在大力推進(jìn)“人工智能+”行動(dòng)的中國(guó)提供了重要鏡鑒。
今年6月,美國(guó)加州北區(qū)聯(lián)邦法院就三位作家訴人工智能公司Anthropic侵權(quán)案件作出關(guān)鍵裁決。法官裁定,公司使用受版權(quán)保護(hù)的書籍來訓(xùn)練其大語言模型Claude的行為,屬于美國(guó)版權(quán)法下的“合理使用”,包括將合法購買的紙質(zhì)書掃描成數(shù)字副本用于內(nèi)部研究,也被認(rèn)定為合理使用;但是,公司從盜版網(wǎng)站下載數(shù)百萬本書籍并將其永久存儲(chǔ)在其中央數(shù)據(jù)庫中的行為,構(gòu)成了對(duì)作者版權(quán)的侵犯。
法官“一半是火焰,一半是海水”的判決,折射出人工智能數(shù)據(jù)訓(xùn)練的法律困境。眼下,人工智能訓(xùn)練與版權(quán)之間的沖突正在多個(gè)領(lǐng)域集中爆發(fā),我國(guó)同樣存在類似糾紛。2023年,某公司指控另一公司盜取其平臺(tái)用戶生成的作文素材用于訓(xùn)練人工智能作文助手,涉嫌不正當(dāng)競(jìng)爭(zhēng)與著作權(quán)侵權(quán)。同年,多位插畫師聯(lián)合起訴某社交媒體平臺(tái),指控其未經(jīng)授權(quán)抓取平臺(tái)用戶上傳的原創(chuàng)插圖訓(xùn)練人工智能繪畫模型,侵犯其署名權(quán)、復(fù)制權(quán)和網(wǎng)絡(luò)信息傳播權(quán)。
這些案件共同揭示出三個(gè)問題:一是數(shù)據(jù)獲取的合法性邊界模糊。人工智能企業(yè)常以“技術(shù)中立”為名,大量爬取、復(fù)制互聯(lián)網(wǎng)公開內(nèi)容,卻忽視其版權(quán)屬性和授權(quán)鏈條。二是訓(xùn)練過程中的“復(fù)制”行為性質(zhì)難定。究竟是學(xué)習(xí)還是竊???是轉(zhuǎn)化性使用還是實(shí)質(zhì)性替代?司法實(shí)踐中尚未形成統(tǒng)一標(biāo)準(zhǔn)。三是生成內(nèi)容與訓(xùn)練數(shù)據(jù)之間的權(quán)屬關(guān)系復(fù)雜。人工智能輸出內(nèi)容是否構(gòu)成衍生作品?原作者是否應(yīng)享有收益分成?這些問題在現(xiàn)行著作權(quán)法中均缺乏明確界定。
此次Anthropic侵權(quán)案件的相關(guān)判決,是美國(guó)法院首次就“使用版權(quán)數(shù)據(jù)訓(xùn)練生成式人工智能模型是否構(gòu)成合理使用”這一核心問題作出明確的裁決,將人工智能公司“獲取、存儲(chǔ)、訓(xùn)練”行為鏈條逐一進(jìn)行剖析,給出了清晰的法律定性。判決既認(rèn)定了使用受版權(quán)保護(hù)的書籍訓(xùn)練其大語言模型的合法性,也打消了人工智能公司試圖用“最終用途的變革性”來掩蓋“上游侵權(quán)行為”的幻想。這一判決,不僅關(guān)系著Anthropic公司的命運(yùn),更將對(duì)所有依賴海量數(shù)據(jù)訓(xùn)練的公司,甚至千千萬萬的內(nèi)容創(chuàng)作者,產(chǎn)生深遠(yuǎn)影響。
在目前的法律體系中,世界各國(guó)都在通過司法判例與行業(yè)實(shí)踐逐步探索人工智能訓(xùn)練的合法性路徑。美國(guó)通過“合理使用四要素”測(cè)試(使用目的、作品性質(zhì)、使用比例、市場(chǎng)影響)對(duì)人工智能訓(xùn)練行為進(jìn)行個(gè)案判斷。與此同時(shí),美國(guó)正興起一個(gè)數(shù)據(jù)授權(quán)市場(chǎng),人工智能公司開始與出版商、內(nèi)容平臺(tái)建立合作,通過支付許可費(fèi)獲取合法訓(xùn)練數(shù)據(jù),逐步形成合規(guī)換取數(shù)據(jù)的商業(yè)模式。在我國(guó),著作權(quán)法第二十四條以“列舉+兜底”方式規(guī)定了合理使用情形,但未明確將人工智能訓(xùn)練納入其中。目前司法實(shí)踐傾向于嚴(yán)格解釋“為個(gè)人學(xué)習(xí)、研究或欣賞”等條款,企業(yè)很難援引此條抗辯。
在缺乏明確例外條款的情況下,事前許可和法定許可成為可行路徑。部分平臺(tái)開始通過用戶協(xié)議獲取“未來使用授權(quán)”,或在內(nèi)容上傳時(shí)明確提示可能用于人工智能訓(xùn)練,以此降低法律風(fēng)險(xiǎn)。此外,也有學(xué)者建議參考廣播權(quán)、錄制權(quán)等法定許可制度,建立人工智能訓(xùn)練法定許可機(jī)制,在保障權(quán)利人獲酬權(quán)的前提下降低交易成本。
我國(guó)正在積極推進(jìn)“人工智能+”行動(dòng),旨在推動(dòng)人工智能與實(shí)體經(jīng)濟(jì)深度融合。在這一背景下,構(gòu)建既鼓勵(lì)創(chuàng)新又保護(hù)原創(chuàng)的知識(shí)產(chǎn)權(quán)體系至關(guān)重要。我們或可從幾方面展開行動(dòng)和探索。
一是明確人工智能訓(xùn)練的版權(quán)例外邊界,可允許人工智能企業(yè)對(duì)已公開發(fā)表的作品進(jìn)行必要的復(fù)制與處理,但須符合“非表達(dá)性使用”“不影響原作品市場(chǎng)”等限制條件。二是強(qiáng)化平臺(tái)責(zé)任與數(shù)據(jù)合規(guī)監(jiān)管,要求人工智能企業(yè)建立數(shù)據(jù)來源追溯機(jī)制,對(duì)訓(xùn)練數(shù)據(jù)實(shí)施分類管理,確保數(shù)據(jù)來源和使用合法合規(guī)。三是推動(dòng)公共數(shù)據(jù)開放與共享,政府可牽頭建設(shè)人工智能訓(xùn)練公共數(shù)據(jù)資源庫,推動(dòng)高質(zhì)量、多模態(tài)、合規(guī)授權(quán)的公共數(shù)據(jù)向人工智能企業(yè)開放,降低企業(yè)對(duì)侵權(quán)數(shù)據(jù)的依賴。
Anthropic的天價(jià)和解不僅是一個(gè)案件的終結(jié),更是一個(gè)時(shí)代的開始。它標(biāo)志著人工智能行業(yè)從“數(shù)據(jù)蠻荒”走向“合規(guī)文明”的轉(zhuǎn)折。對(duì)我國(guó)而言,既要抓住“人工智能+”的戰(zhàn)略機(jī)遇,也必須盡快構(gòu)建起兼顧創(chuàng)新與保護(hù)的知識(shí)產(chǎn)權(quán)新秩序。唯有在法律的軌道上奔跑,人工智能才能真正成為推動(dòng)社會(huì)進(jìn)步的可信賴力量。(中國(guó)科學(xué)院科技戰(zhàn)略咨詢研究院學(xué)部綜合研究支撐中心執(zhí)行副主任 王振宇,知識(shí)產(chǎn)權(quán)律師 劉捷)
編輯:劉舒然