AI訓(xùn)練數(shù)據(jù)不用擔心版權(quán)問題?日本政府表態(tài)引發(fā)熱議-今日訊
發(fā)布時間:2023-06-03 06:43:45 文章來源:南方都市報
生成式AI爆火的現(xiàn)在,其背后模型用以訓(xùn)練的信息數(shù)據(jù)的版權(quán)問題一直是人們關(guān)注的焦點——到底怎樣才算合法的

生成式AI爆火的現(xiàn)在,其背后模型用以訓(xùn)練的信息數(shù)據(jù)的版權(quán)問題一直是人們關(guān)注的焦點——到底怎樣才算合法的訓(xùn)練數(shù)據(jù)?是否會在無意間侵犯他人版權(quán)?


(資料圖片)

對此,有外媒稱,日本的政府人工智能戰(zhàn)略委員會于5月26日提交了一份草案,表示不會強制人工智能訓(xùn)練中使用的數(shù)據(jù)符合版權(quán)法。而日本文部科學(xué)(相當于國內(nèi)教育部)大臣永岡桂子在當?shù)貢h上證實了這一消息,稱日本的法律不保護AI訓(xùn)練所用資料的版權(quán)。

具體在4月24日,日本眾議院定居點管理監(jiān)督委員會第二小組委員會上,日本的一位名叫紀伊隆的議員與永岡桂子進行了直接討論。

根據(jù)紀伊隆在會后整理的問答可以看到,永岡桂子在談到日本關(guān)于使用AI進行信息分析的法律制度(版權(quán)法)時,表示“在日本,無論使用何種方法,無論是出于營利或非營利目的,無論用于復(fù)制以外的行為,還是從非法網(wǎng)站獲得的內(nèi)容,都可以使用信息分析作品。

對此,紀伊隆則認為,從權(quán)利保護的角度來看,“違背版權(quán)所有者意愿使用”這一事實是有問題的,還是有必要制定保護版權(quán)所有者的新規(guī)定。

此外,兩人也談到了在學(xué)校使用ChatGPT等人工智能聊天機器人的教育指導(dǎo)方針。據(jù)外媒報道,該技術(shù)或工具最早將于2024年3月被日本教育系統(tǒng)采用。對此,永岡桂子并沒有給出具體的時間,只是表示會“盡快”回復(fù)。

此事引起了極其廣泛的討論。AI三巨頭之一,Meta首席科學(xué)家楊立昆(Yann LeCun)就發(fā)推表示:

日本已經(jīng)成為機器學(xué)習(xí)的天堂。

但有網(wǎng)友指責他不應(yīng)該將“能夠竊取知識版權(quán)而不受影響”稱之為“天堂”,楊立昆則在評論下方回復(fù)道:構(gòu)成知識產(chǎn)權(quán)“財產(chǎn)”的本質(zhì)是由政府定義和執(zhí)行的。它也受到政府的限制。驅(qū)動原則是最大化公共利益,而不是最大化內(nèi)容所有者的權(quán)利。

事實上,圍繞AI訓(xùn)練資料是否應(yīng)得到版權(quán)保護這一點,網(wǎng)友們展開了激烈的討論。有人贊同日本大臣的這一立場,并提出,一批待訓(xùn)練的圖像數(shù)據(jù)一定會經(jīng)過層層處理,最終轉(zhuǎn)換成為AI模型或者計算機能看懂的數(shù)據(jù)、代碼或其他電子格式。也就是說,模型訓(xùn)練所使用的數(shù)據(jù)基本上都高度有損,因此,即使在最壞的情況下也只是在用“派生作品”,這當然是合理使用。只有當模型抄襲受版權(quán)保護的代碼、制作版權(quán)圖像的圖像或者復(fù)制書籍,最后再分發(fā)輸出,這才算是侵權(quán)。

對此,馬上有人反對:無論是否有損,訓(xùn)練數(shù)據(jù)都提供了價值。如果各種各樣的人沒有花時間制作所有最終成為訓(xùn)練數(shù)據(jù)的東西,那么它訓(xùn)練的模型就不會存在。

還有網(wǎng)友提出,爭論版權(quán)問題沒有意義,人類總是通過研究已經(jīng)存在、曾經(jīng)發(fā)布過的東西來不斷學(xué)習(xí)進化,所以更重要的是從監(jiān)管層面討論如何更便捷合理地使用、分享或組織控制這些“共享信息”。

標簽:

資訊播報

樂活HOT

娛樂LOVE

精彩推送