英國《衛報》報導指稱,有越來越多媒體為了保護智慧財產權,在其網頁封鎖ChatGPT人工智慧(AI)程式利用網絡爬蟲程式截取其網站內容,用於訓練其AI系統。包括美國《紐約時報》、有線電視新聞網(CNN)、路透社、澳洲廣播公司(ABC)等媒體都已經採取類似的防堵程式。
多家知名媒體已封鎖Chat GPT的爬蟲程式,不想讓其內容被用於訓練人工智慧。資料照片
報導指出,由美國人工智慧實驗室Open AI開發的網絡爬蟲程式「GPTBot」,會掃描新聞媒體的網頁、收集資料,用於AI大型語言模型以及內容生成。但對於上述新聞媒體而言,他們撰寫的心血結晶,可能並不想被AI拿去利用。
美國科技網站The Verge稍早指稱,《紐約時報》網站可能從8月17日之前就已修改網頁指令,封殺GPTBOT,《衛報》深入了解後,發現除了《紐時》,還有CNN、澳洲ABC、美國《芝加哥論壇報》、路透社、澳洲社區新聞集團(ACM)旗下的《坎培拉時報》、《紐卡索論壇報》都已在8月採取類似的封鎖措施。
AI內容檢查工具OriginalityAI公司稍早的報告也指出,電商巨擘亞馬遜(Amazon)、圖庫網站Shutterstock也都已封鎖GPTBot。
類似Chat GPT的語言模型,都需要收集大量資訊來訓練其人工智慧,才能使用近似人類語言的模式來回答問題,但開發者對於其AI資料庫有多少他人的版權內容,三緘其口。
CNN證實近期封鎖GPTBot進入其網頁爬梳,路透社發言人則說;「智慧財產是我們業務的命脈,保護我們內容的版權至為重要。」《紐時》公司發言人說,最近更新該網站的服務約定條款,旨在更明確表達禁止擷取我們的內容,用於AI訓練與開發。
AI使用於收集新聞的範圍日漸擴大,全球新聞媒體都面臨這種要不要讓AI吸取內容的決定。法新社與圖片交易公司Getty Image(蓋帝圖像)在今年8月初發表一封公開信,呼籲加強規範人工智慧的使用,對其用於訓練的內容增加透明度,並應取得版權持有者的同意。也在進行人工智慧軟體開發的Google公司聲稱,AI系統應該有權擷取其他出版物用於創造AI模型,「除非對方有提出反對」。