阿波羅新聞網 新聞 > 科教 > 正文

微軟悄悄刪除千萬人臉識別資料庫

隨著人臉識別數據是否侵犯人權的議題在國際延燒,微軟(Microsoft)日前悄然刪除其最大的公共人臉識別資料庫,美國斯坦福大學(Stanford University)和杜克大學(Duke University)也相繼刪除了面部識別數據。

據《金融時報》報導,在微軟使用旗下最大資料庫的數天之後,該公司悄悄從互聯網上,撤下他們面向全球面部識別系統的資料庫資料,刪除大約1,000萬張人臉信息。微軟表示,“這個網站的目的是為了學術需求。後來交由不再與微軟合作的員工運營,現在(網站)已被移除。”

這個資料庫名為MS Celeb,於2016年發布,被微軟稱之為全球最大的公共面部識別資料庫,擁有超過1,000萬張圖像,將近10萬人的面部信息。MS Celeb主要用於訓練多個國家地區的面部識別系統,其中包括:軍事研究人員和商湯科技(SenseTime)、曠視科技(Megvii)等中國公司。

根據人工智慧論文中的引文可見,已經有多個商業組織在使用MS Celeb資料庫,IBM、松下電氣(Panasonic)、阿里巴巴、輝達(Nvidia)、日立、商湯科技、曠視科技均有使用。而商湯科技和曠視科技都是中共新疆政府的設備供應商,當地大批維吾爾人和穆斯林少數民族被當局追蹤、關押在拘留營中。

由於資料庫所使用的照片,沒有徵得照片當事人的同意,微軟根據《知識共享許可協議》(Creative Commons license)將他們的面部數據信息從搜索引擎和視頻中去除。

除了微軟刪除人臉資料庫資料以外,另有兩個學術單位也刪去了相關數據,包括由杜克大學研究人員建造的Duke MTMC監控資料庫,和斯坦福大學的Brainwash資料庫。

Brainwash資料庫使用的信息來自舊金山下海區的Brainwash咖啡館的顧客,他們通過直播相機拍攝登門的消費者。斯坦福大學發言人表示,在其中一位研究者提出要求後,已經刪除了資料庫,該校致力保護學校和社區的個人隱私。

杜克沒有回應評論請求。

這三個數據酷的侵權問題都是由柏林研究員亞當·哈維(Adam Harvey)所發現,他的百萬畫素(Megapixels)項目記載了諸多資料庫的詳細信息以及使用方式。哈維調查發現,微軟本身已經使用這些資料庫來訓練面部識別的計算。

微軟將資料庫命名為“Celeb”(名流),表明它所概括的面孔是公眾人物的照片。經媒體查證,MS Celeb確實包括了一些特別人物、媒體人的信息,例如:基姆·澤特(Kim Zetter)《連線》雜誌的高級記者,報導涉及網路犯罪、公民自由、隱私和安全等主題。阿德里安·陳(Adrian Chen)和《監視資本主義時代》作者肖沙娜·朱伯夫(Shoshana Zuboff)。

哈維指出,微軟利用“名人”(celebrity)一詞來包括僅僅只是在網上工作,並在數位世界擁有知名度的人。

當《金融時報》聯繫被收錄在資料庫的當事人時,他們未意識到自己的照片已經被收錄。科技類別作家亞當·格林菲爾德(Adam Greenfield)說,“我絕不是一個公眾人士,我沒有辦法放棄我的隱私權。”“這表明微軟無法讓自己的研究人員保持誠信和正直,在員工離職之前報廢(資料庫)。”

阿蘭·圖靈研究所(Alan Turing Institute)技術政策研究員邁克爾·維爾表示表示,微軟可能違反歐盟通過的《一般資料保護法》(General Data Protection Law),該法規於去年生效,MS Celeb資料庫在法規生效後投入使用。

對此,微軟表示,該網站已經刪除,尚不清楚《一般資料保護法》是否帶來影響。

儘管資料庫已被微軟刪除,但仍可供以前下載過的研究人員和公司使用。哈維表示,它仍然在開源網站上分享。

阿波羅網責任編輯:楚天 來源:大紀元記者洪雅文編譯報導 轉載請註明作者、出處並保持完整。

科教熱門

相關新聞

➕ 更多同類相關新聞