新聞 > 科教 > 正文

☕列印版 ◪圖片版 ◫PDF

為訓練AI不擇手段!Meta被曝下載數十TB盜版電子書

【阿波羅新聞網 2025-02-12 訊】

快科技2月9日消息，據媒體報導，一名圖書作者對Meta提起訴訟，指控該公司未經授權下載了大量盜版電子書，用於訓練其AI模型。

最新泄露的郵件顯示，Meta承認下載了一個有爭議的大型數據集LibGen，其中包括數千萬本盜版書籍。

根據法庭文件，Meta通過名為「安娜的檔案」（Anna's Archive）的渠道下載了至少81.7TB的數據，其中包括來自知名盜版網站Z-Library和LibGen的至少35.7TB的內容，Meta還被指此前從LibGen下載了額外的80.6TB數據。

作者指出，Meta的這一行為構成了非法的電子書庫種子下載，且這一數字可能只是其盜版行為的冰山一角。

作者估計，這些盜版電子書庫可能僅占Meta盜版版權作品總量的0.008%，這表明Meta的盜版規模可能遠超目前所揭露的。

郵件還顯示，Meta公司員工也意識到其行為的法律風險，2023年4月，Meta的研究工程師尼古拉·巴什利科夫在郵件中表示：「用公司的筆記型電腦下BT感覺不妥。」

到2023年9月，巴什科夫加大了抗議力度，並諮詢了法律團隊，他指出，使用Torrents意味著對文件進行「播種」，即對外共享內容，這在法律上是不允許的。

但Meta仍決定繼續，並試圖通過將數據集下載到非Meta伺服器來避免被追溯的風險。

責任編輯：李華　來源：快科技轉載請註明作者、出處並保持完整。

本文網址：https://tw.aboluowang.com/2025/0212/2174560.html

相關新聞