人工智慧生成身份的識別方法，單靠眼睛看不夠了＊阿波羅新聞網

你們有沒有收到過陌生人的好友請求，看了一眼頭像，覺得"這人挺正常的"，然後就通過了？

幾乎所有人都舉手。

對。這就是問題所在。

問題已經換了一張臉

去年在油管上有一個案例，一名芝加哥男子叫Grant，在Facebook Dating上遇到了一個"女性"。

兩個人聊了好幾個月，視頻通話都有過，對方的聲音、表情、笑容，一切看起來都很真實。

最後Grant損失了7萬美元——不對，應該說，他把7萬美元轉進了一個根本不存在的投資平台，而跟他談了幾個月戀愛的那個"人"，是一套運行在伺服器上的AI系統。

這不是科幻。這是2025年以後的日常詐騙作業。

以前識別假帳號很簡單：頭像是從某個庫存圖片網站截的，個人簡介兩句話，好友列表里全是機器帳號，發帖記錄要麼是空白要麼全是轉發。

2015年前後，在情報培訓課上學的"怎麼識別假帳號"，講的就是這套方法，基本上十分鐘能搞定一個。

現在這套方法幾乎全部失效了。

新一代的AI生成身份長這樣：一張清晰自然的人臉照片，在谷歌和百度里反向搜索不到任何結果，因為這張臉根本不存在，是AI憑空生成的；個人簡介寫得連貫有溫度，讀起來像是一個真實的人在認真介紹自己；社交記錄從兩三年前就開始積累，有時間跨度，有情緒變化，有"生活細節"。

一個研究人員做過一個測試：一台五年前的舊電腦，零圖像編輯技能，從零開始搭建一個完整的假身份，包括文件、照片、社交歷史——總共花了70分鐘。

70分鐘。

這就是你現在面對的對手。

先從那張臉開始

任何人拿到一個可疑帳號，第一步都應該看頭像。不是因為頭像最重要，而是因為它最直接，可以最快給出信號。

AI生成的人臉，主要來自兩類技術。

一類是GAN（生成對抗網絡），典型代表是StyleGAN，thispersondoesnotexist.com用的就是這個，每次刷新就生成一張新的人臉，而這張臉永遠不會出現在任何身份證上。

另一類是擴散模型（Diffusion Model），是Midjourney、DALL-E、Stable Diffusion背後的技術。這兩類生成的人臉在視覺上非常不同，檢測方法也略有差異。

怎麼說呢，理論上最好用的視覺判斷方法，其實是看眼睛。

人的雙眼在真實光照環境下，角膜上會有光點反射，也叫角膜鏡面高光。這個反射的形狀、角度和位置，在左右兩眼上應該是基本一致的，因為兩隻眼睛看的是同一個空間，接受的是同一個光源。

GAN在生成人臉的時候，它的訓練目標是"讓這張臉看起來真實"，而不是"遵守物理光學規律"，所以它根本不在乎角膜反射是否對稱。結果就是：AI生成的人臉，兩眼的高光點形狀往往不一致，有時候一個圓潤有時候一個扭曲，有時候乾脆缺失其中一個。

布法羅大學的研究團隊開發了一套自動化工具，專門通過分析雙眼角膜反射的一致性來識別GAN人臉，測試中準確率達到了94%。

上圖這些人哪些是假的？答：全部都是假的。

當然，你在看一張頭像的時候，不可能用肉眼去分辨角膜反射。但有幾個肉眼可見的特徵可以作為初步篩查：

耳環和眼鏡

這是GAN的經典盲區。如果一張AI臉戴了耳環，你會發現左耳和右耳的耳環往往形狀不一樣，甚至一個有一個沒有。眼鏡也是——AI很難讓兩片鏡片完美對稱，經常出現一邊傾斜或者形狀扭曲的情況。

GAN在訓練時重點學習的是人臉，對背景的處理能力相對弱。背景部分經常出現奇怪的扭曲、撕裂感，或者顏色異常滲透到頭髮邊緣——行話叫"螢光滲透"（bleed-through），就是背景的亮色倒進頭髮里，形成一圈光暈。這在標準攝影里是不會出現的。

牙齒

這是AI的另一個弱點。面帶笑容的照片裡，牙齒往往渲染異常，形狀相近、顏色均一，缺乏真實牙齒的不對稱細節，有時還會出現"三顆門牙"這種匪夷所思的情況。

髮絲邊緣

真實照片裡頭髮的邊緣是自然散亂的。AI生成的頭髮有時看起來過於均勻、過於順滑，或者在頭髮與背景的交界處出現一層模糊的發光層，像是剪切蒙版沒做乾淨。

算了，說了這麼多視覺特徵，其實有一個更實際的做法：直接上工具。

Hive Moderation（thehive.ai）提供免費的圖片AI檢測，可以直接上傳頭像，它會給出一個0到1的置信分數，分數越高說明AI生成的可能性越大，測試準確率據稱高達99.9%。

FotoForensics（fotoforensics.com）則用的是ELA（錯誤級別分析）技術，原理是檢測圖片裡不同區域的壓縮噪音差異——如果一張圖片某些區域的噪音和周圍不匹配，通常意味著這個區域被單獨處理或合成過。

還有一個更基礎的操作：反向圖片搜索。

把頭像圖片上傳到Google Images、Yandex Image Search或者TinEye，看看這張臉有沒有出現在別的地方。

老式假帳號經常用庫存照片，會被搜出來。但AI生成的人臉恰恰不會——因為這張臉是獨一無二的，之前從未存在過，自然也找不到匹配結果。

注意，"搜不到"不等於"真實"。

這個邏輯要倒過來想：搜到了同一張臉出現在別處，那肯定有問題；搜不到，只能說排除了庫存照片這條路，不代表排除了AI生成。

一張臉只是入場券，真正的驗證從這裡開始

大多數人用反向圖搜索沒搜到，就覺得"這人應該是真的"。

這個邏輯漏洞可以害死人。

圖片核查只是第一關。通過之後，要開始做身份考古。

帳號創建時間與內容密度的關係

真實的人在網上積累存在感，是一個自然的、非線性的過程。他們可能某一年發了很多帖子，某一年幾乎消失，可能因為換工作、搬家、生了孩子。

AI構建的假身份，如果要製造"歷史感"，通常會批量生成內容，時間線看起來均勻——一周發幾條，每條間隔差不多，內容風格高度統一，沒有"人生起伏"。

打開那個帳號，滾到最底部，看最早的帖子是什麼時候。如果帳號號稱已經有六七年歷史，那麼它六七年前的帖子應該反映出當時的語境——當時的熱門話題、當時流行的表情包、當時用的網絡流行語。

如果一個聲稱2018年就開始活躍的帳號，它最早期的帖子用的是2024年才流行的網絡梗，那就有問題了。

數字足跡的跨平台一致性

真實的人會在多個平台上留下互相印證的記錄。一個人的LinkedIn說他2019年在某個公司工作，那他那段時間可能在Instagram曬過辦公室咖啡，在Twitter/X上轉發過行業新聞，說不定還在某個論壇里回答過相關領域的問題。這些痕跡是自發的、分散的、語境各異的。

假身份很難做到這一點。因為構建這些痕跡需要大量時間和資源，哪怕AI能幫忙生成內容，跨平台痕跡的時間戳一致性依然很難偽造。

具體如何操作

把那個人的用戶名拿去跑一遍WhatsMyName（whatsmyname.app），這個工具可以同時在600多個平台上檢索這個用戶名是否存在。如果結果是零，不能說明什麼；如果結果是只有一兩個新近註冊的帳號，而且平台之間沒有任何內容互動，值得警惕。

再進一步，把這個人聲稱工作過的公司用Wayback Machine（web.archive.org）調一下歷史快照。

如果那家公司在他聲稱任職的年份確實存在，而且規模對得上，這是加分項。如果公司官網只有兩年歷史，或者歷史版本裡的團隊頁從沒出現過這個人的名字，減分。

這裡有一個我的實操步驟：

記錄對方聲稱的關鍵信息——就職公司、畢業院校、居住城市、工作年限

用Google搜索"公司名+人名"，以及"公司名+ site:linkedin.com"

在領英上查那家公司的"員工"列表——如果對方說在那裡工作，理論上應該有可查到的痕跡

用Wayback Machine查公司官網的歷史頁面，看那個人名有沒有出現過

如果對方聲稱有學歷，用學校官網的校友搜索或者領英的教育篩選功能核對

以上五步走完，一個真實存在的人至少會留下兩三條可以互相印證的痕跡。如果五步全空，這個人從公共記錄里徹底蒸發——在數字時代，這本身就是一個很大的異常。

他們怎麼寫話，和他們說了什麼

照片過了，背景信息過了，接下來要看文字。

AI生成的文字，從技術原理上就註定了它有特定的統計指紋。這裡面有兩個概念值得認真理解：

困惑度

語言模型在閱讀一段文本時，會用它的概率系統預測"下一個詞應該是什麼"。如果實際出現的詞跟它預測的高度吻合，困惑度就低；如果實際出現的詞很出人意料，困惑度就高。

AI自己寫的文字，就是它"預測出來的最可能的詞"的連續輸出，所以AI文字的困惑度極低——平均分在10到30之間；而人類寫的文字，因為我們有私人記憶、個人習慣、情緒衝動，困惑度通常在40到100以上。

爆發度

這是指文本里句子長短的變化幅度。人類寫作的節奏是不規律的——可能一段話里有一個三字短句，緊跟著一個五十字的複合句，再來一個反問，再來一個感嘆。

AI的輸出在句子長度上高度均勻，通常聚集在每句15到25個詞，很少出現極短或極長的句子。從外部感受來說，AI寫的東西"流暢但沒有脈搏"——你讀起來很順，但感覺不到一個活人在跟你說話。

以這兩個維度為基礎，目前比較可靠的AI文字檢測工具是GPTZero（gptzero.me）。在獨立基準測試中，GPTZero對純AI生成文本的檢出率達到了95.7%，誤判人類文章為AI的比例控制在1%左右。

當然，這個數字是基準測試下的成績，真實使用中會有更多複雜情況，比如混合寫作、風格化寫作，準確率會下降到89%到93%之間。

這些工具的結果只是參考，不是判決。

你不需要只靠工具，你也可以直接閱讀。AI生成的個人簡介有一些非常典型的語言特徵，經過對12000個真實與AI生成簡介的語料分析，研究者發現AI簡介里"adventurous"、"passionate"、"genuine"這類空洞形容詞出現的頻率是真實簡介的4.8倍。這些詞聽起來像在描述一個人，實際上什麼都沒說。

另外一個特徵叫做"缺乏時間錨點"。

真實的人在描述自己時，會用具體的時間節點，舉個簡單的例子我三年前搬到這裡來，上個月剛換了工作，去年冬天開始學中文。

AI傾向於寫永恆的現在時：我喜歡探索新地方，我重視真誠的連接。沒有時間，沒有具體地點，沒有失敗和尷尬，只有完美對稱的自我描述。

怎麼測試？很簡單：給對方發一個需要具體細節的問題。

不是"你最近怎麼樣"，而是"你上次出去玩是去哪裡，印象最深的是什麼"。

一個真實的人會給你一個稍顯隨意的、充滿個人色彩的回答。

一個AI會給你一個禮貌、全面、結構完整但缺乏任何獨特細節的答案——就像一份沒有具體案例的工作匯報。

元數據：他們藏不住的時間戳

很多人知道要做圖片反向搜索，但很少人會去看圖片的元數據（EXIF data）。

EXIF是圖片文件里自動嵌入的技術信息，包括：拍攝時間、拍攝設備型號、GPS坐標（如果拍攝時沒關掉定位）、圖像編輯軟體名稱。用ExifTool（支持Linux/Windows/Mac的命令行工具，或直接訪問exifmeta.com進行在線分析）就可以提取這些信息。

命令行操作如下：

textexiftool-a-u-g1 suspect_image.jpg

重點看以下欄位：

Software：如果這裡顯示的是"Stable Diffusion"、"Midjourney"或者任何AI圖像生成器的名字，直接結案。

Create Date vs Modify Date：如果修改時間早於創建時間，說明元數據被人工篡改過。

GPS coordinates：如果對方聲稱在紐約，但圖片GPS顯示在東歐某個城市，這個矛盾本身就是一個信號。

Camera Model：真實照片通常來自手機或相機，型號應該是正常的消費設備。如果這裡是空的，或者是某個奇怪的軟體名，需要追問。

當然，有經驗的操作者會提前清除元數據。

這也是一種信號：一個普通用戶隨手拍的照片，一般不會刻意清除EXIF。

如果你拿到的圖片元數據是空的，而且圖片看起來又像是專業拍攝的——這個組合本身就要注意了。

行為時間線：他們繞不過去的節奏問題

有一種檢查方法，簡單到讓人覺得不像情報分析，但它非常管用。

去翻那個帳號的完整發帖歷史，在紙上或者表格里記下每一條帖子的時間戳，然後看節奏。

真實的人有生活節奏。白天上班，可能中午發一條，晚飯後發幾條，深夜偶爾冒一條。周末節奏不同，節假日節奏又不同。情緒好的時候發的多，情緒低的時候消失一段時間。這個節奏是有機的、不規律的。

AI帳號或者低成本營運的假帳號，它的發帖節奏往往呈現出一種機械感：每隔大約相同的時間發一條，不管是凌晨三點還是工作日上午九點，頻率高度一致。

或者相反——某一段時間密集爆發（因為某個任務節點），然後突然沉寂（因為換了操作員或者換了任務）。

還有一個細節：帳號切換語言或者風格的節點。如果一個帳號前兩年發帖用的是自然口語，忽然有一段時間切換成了明顯的AI語言模式，再後來又恢復成口語，這說明帳號可能在某個時間段被AI接管了，然後又回到人工營運。這種"風格斷層"在情報調查里是一個非常可靠的信號。

規模背後的產業邏輯

我不想只說技術。技術之外，你需要知道這件事是在一個什麼樣的規模上發生的。

Interpol在2025年的一份報告裡提到，截至2025年3月，已有來自66個國家的受害者被販賣進東南亞的網絡詐騙中心，這些中心僱傭（更準確地說是強迫）工人使用預製的AI生成身份，每天對全球目標發起有組織的接觸。

Operation Storm Makers II在2023年涉及27個國家，270,000次檢查和執法行動。

2025年以後，這些中心已經大規模引入AI工具，不再需要那麼多"人工客服"去維持虛假的情感關係——AI可以同時維持數十條"戀愛關係"，記住每個目標說過的所有細節，無需休息，無需培訓。

根據LexisNexis Risk Solutions的調查，如今大約80%的身份欺詐案例里都包含deepfake技術，包括視頻覆蓋或圖像操縱。這意味著即使是視頻通話，也不再是驗證真人的安全手段。

在亞太地區，2022年到2023年間deepfake相關欺詐事件的增幅超過了1500%。

這個數字重讀一遍：1500%。

一套可操作的檢查框架

把以上所有內容整合起來是一個分層篩查模型，按照從快到慢、從易到難的順序排列：

第一層（5分鐘以內）：

反向圖搜索頭像（Google Images+ Yandex，因為Yandex對面孔識別能力更強）

把頭像上傳到Hive Detect或者AI or Not（aiornot.com）做AI生成檢測

看帳號創建時間，以及最早帖子是否符合當時的時代語境

第二層（15-30分鐘）：

WhatsMyName搜索用戶名，看跨平台存在情況

用ExifTool或在線工具提取圖片元數據

GPTZero分析對方發布過的較長文字，檢查AI指紋

翻完整發帖歷史，記錄時間節奏是否符合真實人類行為

第三層（1小時以上，適合高風險場景）：

用Wayback Machine核查對方聲稱工作單位或相關網站的歷史檔案

用LinkedIn驗證對方聲稱的工作經歷，看是否有同事背書和相互背書的網絡

主動提問，要求對方提供具有強時間錨點的具體細節，並對這些細節獨立核查

嘗試視頻通話，注意觀察：幀率是否異常，面部邊緣是否有扭曲，光源方向是否與聲稱的場景邏輯一致

關於視頻通話的補充說明：現在的實時deepfake已經能夠欺騙普通觀察者，那位芝加哥受害者Grant就是在和"對方"進行了多次視頻通話後仍然被騙的。你需要關注的不是"臉對不對"，而是一些技術性細節：背景的光源和人臉光源方向是否一致，人臉邊緣在快速轉頭時是否有一幀的模糊或扭曲，耳朵和頸部的輪廓是否自然。

如果條件允許，要求對方完成一些"不可預測的動作"——比如隨機舉起三根手指或者用手遮住半邊臉，這類即興動作對實時deepfake系統的壓力更大，更容易暴露技術痕跡。

這件事為什麼比你想的更難

這裡要說一個沮喪的事實：即使你把以上每一步都做了，你也無法百分之百確定一個人是真實的。

這不是悲觀，這是方法論上的誠實。

檢測AI生成身份的本質，是一場一致性核查。你在做的，是收集足夠多的信號，看這些信號能不能在獨立來源之間互相印證。

如果一個人在十個不同的維度上都呈現出"真實"的特徵，而且這些維度之間的邏輯關係是自洽的、難以整體偽造的，那麼這個人大概率是真實的。

但"大概率"不是確定。

對抗也在升級。GAN和擴散模型的進化速度，始終比檢測工具快一步。今天Hive Moderation能以99.9%的準確率識別某一類AI生成圖像，是因為它是基於已知模型的輸出訓練的。

明天出現一個新模型，它的輸出特徵還沒有進入檢測系統的訓練集，準確率就會下降。

這是一場沒有終點的追逐。

所以最可靠的防禦，不是找到一個萬能的檢測工具，而是建立一種思維習慣：在高風險場景——涉及金錢、涉及機密信息分享、涉及重要決策——任何人的身份都應該經過多維度的獨立核查，而不是僅憑直覺或單一技術手段判斷。

"那有沒有可能整套流程都過了，這人還是假的？"