你們有沒有收到過陌生人的好友請求,看了一眼頭像,覺得"這人挺正常的",然後就通過了?
幾乎所有人都舉手。
對。這就是問題所在。
問題已經換了一張臉
去年在油管上有一個案例,一名芝加哥男子叫Grant,在Facebook Dating上遇到了一個"女性"。
兩個人聊了好幾個月,視頻通話都有過,對方的聲音、表情、笑容,一切看起來都很真實。
最後Grant損失了7萬美元——不對,應該說,他把7萬美元轉進了一個根本不存在的投資平台,而跟他談了幾個月戀愛的那個"人",是一套運行在伺服器上的AI系統。
這不是科幻。這是2025年以後的日常詐騙作業。
以前識別假帳號很簡單:頭像是從某個庫存圖片網站截的,個人簡介兩句話,好友列表里全是機器帳號,發帖記錄要麼是空白要麼全是轉發。
2015年前後,在情報培訓課上學的"怎麼識別假帳號",講的就是這套方法,基本上十分鐘能搞定一個。
現在這套方法幾乎全部失效了。
新一代的AI生成身份長這樣:一張清晰自然的人臉照片,在谷歌和百度里反向搜索不到任何結果,因為這張臉根本不存在,是AI憑空生成的;個人簡介寫得連貫有溫度,讀起來像是一個真實的人在認真介紹自己;社交記錄從兩三年前就開始積累,有時間跨度,有情緒變化,有"生活細節"。
一個研究人員做過一個測試:一台五年前的舊電腦,零圖像編輯技能,從零開始搭建一個完整的假身份,包括文件、照片、社交歷史——總共花了70分鐘。
70分鐘。
這就是你現在面對的對手。
先從那張臉開始

任何人拿到一個可疑帳號,第一步都應該看頭像。不是因為頭像最重要,而是因為它最直接,可以最快給出信號。
AI生成的人臉,主要來自兩類技術。
一類是GAN(生成對抗網絡),典型代表是StyleGAN,thispersondoesnotexist.com用的就是這個,每次刷新就生成一張新的人臉,而這張臉永遠不會出現在任何身份證上。
另一類是擴散模型(Diffusion Model),是Midjourney、DALL-E、Stable Diffusion背後的技術。這兩類生成的人臉在視覺上非常不同,檢測方法也略有差異。
怎麼說呢,理論上最好用的視覺判斷方法,其實是看眼睛。
人的雙眼在真實光照環境下,角膜上會有光點反射,也叫角膜鏡面高光。這個反射的形狀、角度和位置,在左右兩眼上應該是基本一致的,因為兩隻眼睛看的是同一個空間,接受的是同一個光源。
GAN在生成人臉的時候,它的訓練目標是"讓這張臉看起來真實",而不是"遵守物理光學規律",所以它根本不在乎角膜反射是否對稱。結果就是:AI生成的人臉,兩眼的高光點形狀往往不一致,有時候一個圓潤有時候一個扭曲,有時候乾脆缺失其中一個。

布法羅大學的研究團隊開發了一套自動化工具,專門通過分析雙眼角膜反射的一致性來識別GAN人臉,測試中準確率達到了94%。

上圖這些人哪些是假的?答:全部都是假的。
當然,你在看一張頭像的時候,不可能用肉眼去分辨角膜反射。但有幾個肉眼可見的特徵可以作為初步篩查:
耳環和眼鏡
這是GAN的經典盲區。如果一張AI臉戴了耳環,你會發現左耳和右耳的耳環往往形狀不一樣,甚至一個有一個沒有。眼鏡也是——AI很難讓兩片鏡片完美對稱,經常出現一邊傾斜或者形狀扭曲的情況。
GAN在訓練時重點學習的是人臉,對背景的處理能力相對弱。背景部分經常出現奇怪的扭曲、撕裂感,或者顏色異常滲透到頭髮邊緣——行話叫"螢光滲透"(bleed-through),就是背景的亮色倒進頭髮里,形成一圈光暈。這在標準攝影里是不會出現的。
牙齒
這是AI的另一個弱點。面帶笑容的照片裡,牙齒往往渲染異常,形狀相近、顏色均一,缺乏真實牙齒的不對稱細節,有時還會出現"三顆門牙"這種匪夷所思的情況。
髮絲邊緣
真實照片裡頭髮的邊緣是自然散亂的。AI生成的頭髮有時看起來過於均勻、過於順滑,或者在頭髮與背景的交界處出現一層模糊的發光層,像是剪切蒙版沒做乾淨。
算了,說了這麼多視覺特徵,其實有一個更實際的做法:直接上工具。
Hive Moderation(thehive.ai)提供免費的圖片AI檢測,可以直接上傳頭像,它會給出一個0到1的置信分數,分數越高說明AI生成的可能性越大,測試準確率據稱高達99.9%。
FotoForensics(fotoforensics.com)則用的是ELA(錯誤級別分析)技術,原理是檢測圖片裡不同區域的壓縮噪音差異——如果一張圖片某些區域的噪音和周圍不匹配,通常意味著這個區域被單獨處理或合成過。
還有一個更基礎的操作:反向圖片搜索。
把頭像圖片上傳到Google Images、Yandex Image Search或者TinEye,看看這張臉有沒有出現在別的地方。
老式假帳號經常用庫存照片,會被搜出來。但AI生成的人臉恰恰不會——因為這張臉是獨一無二的,之前從未存在過,自然也找不到匹配結果。
注意,"搜不到"不等於"真實"。
這個邏輯要倒過來想:搜到了同一張臉出現在別處,那肯定有問題;搜不到,只能說排除了庫存照片這條路,不代表排除了AI生成。
一張臉只是入場券,真正的驗證從這裡開始
大多數人用反向圖搜索沒搜到,就覺得"這人應該是真的"。
這個邏輯漏洞可以害死人。
圖片核查只是第一關。通過之後,要開始做身份考古。
帳號創建時間與內容密度的關係
真實的人在網上積累存在感,是一個自然的、非線性的過程。他們可能某一年發了很多帖子,某一年幾乎消失,可能因為換工作、搬家、生了孩子。
AI構建的假身份,如果要製造"歷史感",通常會批量生成內容,時間線看起來均勻——一周發幾條,每條間隔差不多,內容風格高度統一,沒有"人生起伏"。
打開那個帳號,滾到最底部,看最早的帖子是什麼時候。如果帳號號稱已經有六七年歷史,那麼它六七年前的帖子應該反映出當時的語境——當時的熱門話題、當時流行的表情包、當時用的網絡流行語。
如果一個聲稱2018年就開始活躍的帳號,它最早期的帖子用的是2024年才流行的網絡梗,那就有問題了。
數字足跡的跨平台一致性
真實的人會在多個平台上留下互相印證的記錄。一個人的LinkedIn說他2019年在某個公司工作,那他那段時間可能在Instagram曬過辦公室咖啡,在Twitter/X上轉發過行業新聞,說不定還在某個論壇里回答過相關領域的問題。這些痕跡是自發的、分散的、語境各異的。
假身份很難做到這一點。因為構建這些痕跡需要大量時間和資源,哪怕AI能幫忙生成內容,跨平台痕跡的時間戳一致性依然很難偽造。
具體如何操作
把那個人的用戶名拿去跑一遍WhatsMyName(whatsmyname.app),這個工具可以同時在600多個平台上檢索這個用戶名是否存在。如果結果是零,不能說明什麼;如果結果是只有一兩個新近註冊的帳號,而且平台之間沒有任何內容互動,值得警惕。
再進一步,把這個人聲稱工作過的公司用Wayback Machine(web.archive.org)調一下歷史快照。
如果那家公司在他聲稱任職的年份確實存在,而且規模對得上,這是加分項。如果公司官網只有兩年歷史,或者歷史版本裡的團隊頁從沒出現過這個人的名字,減分。
這裡有一個我的實操步驟:
記錄對方聲稱的關鍵信息——就職公司、畢業院校、居住城市、工作年限
用Google搜索"公司名+人名",以及"公司名+ site:linkedin.com"
在領英上查那家公司的"員工"列表——如果對方說在那裡工作,理論上應該有可查到的痕跡
用Wayback Machine查公司官網的歷史頁面,看那個人名有沒有出現過
如果對方聲稱有學歷,用學校官網的校友搜索或者領英的教育篩選功能核對
以上五步走完,一個真實存在的人至少會留下兩三條可以互相印證的痕跡。如果五步全空,這個人從公共記錄里徹底蒸發——在數字時代,這本身就是一個很大的異常。
他們怎麼寫話,和他們說了什麼
照片過了,背景信息過了,接下來要看文字。
AI生成的文字,從技術原理上就註定了它有特定的統計指紋。這裡面有兩個概念值得認真理解:
困惑度
語言模型在閱讀一段文本時,會用它的概率系統預測"下一個詞應該是什麼"。如果實際出現的詞跟它預測的高度吻合,困惑度就低;如果實際出現的詞很出人意料,困惑度就高。
AI自己寫的文字,就是它"預測出來的最可能的詞"的連續輸出,所以AI文字的困惑度極低——平均分在10到30之間;而人類寫的文字,因為我們有私人記憶、個人習慣、情緒衝動,困惑度通常在40到100以上。
爆發度
這是指文本里句子長短的變化幅度。人類寫作的節奏是不規律的——可能一段話里有一個三字短句,緊跟著一個五十字的複合句,再來一個反問,再來一個感嘆。
AI的輸出在句子長度上高度均勻,通常聚集在每句15到25個詞,很少出現極短或極長的句子。從外部感受來說,AI寫的東西"流暢但沒有脈搏"——你讀起來很順,但感覺不到一個活人在跟你說話。
以這兩個維度為基礎,目前比較可靠的AI文字檢測工具是GPTZero(gptzero.me)。在獨立基準測試中,GPTZero對純AI生成文本的檢出率達到了95.7%,誤判人類文章為AI的比例控制在1%左右。
當然,這個數字是基準測試下的成績,真實使用中會有更多複雜情況,比如混合寫作、風格化寫作,準確率會下降到89%到93%之間。
這些工具的結果只是參考,不是判決。
你不需要只靠工具,你也可以直接閱讀。AI生成的個人簡介有一些非常典型的語言特徵,經過對12000個真實與AI生成簡介的語料分析,研究者發現AI簡介里"adventurous"、"passionate"、"genuine"這類空洞形容詞出現的頻率是真實簡介的4.8倍。這些詞聽起來像在描述一個人,實際上什麼都沒說。
另外一個特徵叫做"缺乏時間錨點"。
真實的人在描述自己時,會用具體的時間節點,舉個簡單的例子我三年前搬到這裡來,上個月剛換了工作,去年冬天開始學中文。
AI傾向於寫永恆的現在時:我喜歡探索新地方,我重視真誠的連接。沒有時間,沒有具體地點,沒有失敗和尷尬,只有完美對稱的自我描述。
怎麼測試?很簡單:給對方發一個需要具體細節的問題。
不是"你最近怎麼樣",而是"你上次出去玩是去哪裡,印象最深的是什麼"。
一個真實的人會給你一個稍顯隨意的、充滿個人色彩的回答。
一個AI會給你一個禮貌、全面、結構完整但缺乏任何獨特細節的答案——就像一份沒有具體案例的工作匯報。
元數據:他們藏不住的時間戳
很多人知道要做圖片反向搜索,但很少人會去看圖片的元數據(EXIF data)。
EXIF是圖片文件里自動嵌入的技術信息,包括:拍攝時間、拍攝設備型號、GPS坐標(如果拍攝時沒關掉定位)、圖像編輯軟體名稱。用ExifTool(支持Linux/Windows/Mac的命令行工具,或直接訪問exifmeta.com進行在線分析)就可以提取這些信息。
命令行操作如下:
textexiftool-a-u-g1 suspect_image.jpg
重點看以下欄位:
Software:如果這裡顯示的是"Stable Diffusion"、"Midjourney"或者任何AI圖像生成器的名字,直接結案。
Create Date vs Modify Date:如果修改時間早於創建時間,說明元數據被人工篡改過。
GPS coordinates:如果對方聲稱在紐約,但圖片GPS顯示在東歐某個城市,這個矛盾本身就是一個信號。
Camera Model:真實照片通常來自手機或相機,型號應該是正常的消費設備。如果這裡是空的,或者是某個奇怪的軟體名,需要追問。
當然,有經驗的操作者會提前清除元數據。
這也是一種信號:一個普通用戶隨手拍的照片,一般不會刻意清除EXIF。
如果你拿到的圖片元數據是空的,而且圖片看起來又像是專業拍攝的——這個組合本身就要注意了。
行為時間線:他們繞不過去的節奏問題
有一種檢查方法,簡單到讓人覺得不像情報分析,但它非常管用。
去翻那個帳號的完整發帖歷史,在紙上或者表格里記下每一條帖子的時間戳,然後看節奏。
真實的人有生活節奏。白天上班,可能中午發一條,晚飯後發幾條,深夜偶爾冒一條。周末節奏不同,節假日節奏又不同。情緒好的時候發的多,情緒低的時候消失一段時間。這個節奏是有機的、不規律的。
AI帳號或者低成本營運的假帳號,它的發帖節奏往往呈現出一種機械感:每隔大約相同的時間發一條,不管是凌晨三點還是工作日上午九點,頻率高度一致。
或者相反——某一段時間密集爆發(因為某個任務節點),然後突然沉寂(因為換了操作員或者換了任務)。
還有一個細節:帳號切換語言或者風格的節點。如果一個帳號前兩年發帖用的是自然口語,忽然有一段時間切換成了明顯的AI語言模式,再後來又恢復成口語,這說明帳號可能在某個時間段被AI接管了,然後又回到人工營運。這種"風格斷層"在情報調查里是一個非常可靠的信號。
規模背後的產業邏輯
我不想只說技術。技術之外,你需要知道這件事是在一個什麼樣的規模上發生的。
Interpol在2025年的一份報告裡提到,截至2025年3月,已有來自66個國家的受害者被販賣進東南亞的網絡詐騙中心,這些中心僱傭(更準確地說是強迫)工人使用預製的AI生成身份,每天對全球目標發起有組織的接觸。
Operation Storm Makers II在2023年涉及27個國家,270,000次檢查和執法行動。
2025年以後,這些中心已經大規模引入AI工具,不再需要那麼多"人工客服"去維持虛假的情感關係——AI可以同時維持數十條"戀愛關係",記住每個目標說過的所有細節,無需休息,無需培訓。
根據LexisNexis Risk Solutions的調查,如今大約80%的身份欺詐案例里都包含deepfake技術,包括視頻覆蓋或圖像操縱。這意味著即使是視頻通話,也不再是驗證真人的安全手段。
在亞太地區,2022年到2023年間deepfake相關欺詐事件的增幅超過了1500%。
這個數字重讀一遍:1500%。
一套可操作的檢查框架
把以上所有內容整合起來是一個分層篩查模型,按照從快到慢、從易到難的順序排列:
第一層(5分鐘以內):
反向圖搜索頭像(Google Images+ Yandex,因為Yandex對面孔識別能力更強)
把頭像上傳到Hive Detect或者AI or Not(aiornot.com)做AI生成檢測
看帳號創建時間,以及最早帖子是否符合當時的時代語境
第二層(15-30分鐘):
WhatsMyName搜索用戶名,看跨平台存在情況
用ExifTool或在線工具提取圖片元數據
GPTZero分析對方發布過的較長文字,檢查AI指紋
翻完整發帖歷史,記錄時間節奏是否符合真實人類行為
第三層(1小時以上,適合高風險場景):
用Wayback Machine核查對方聲稱工作單位或相關網站的歷史檔案
用LinkedIn驗證對方聲稱的工作經歷,看是否有同事背書和相互背書的網絡
主動提問,要求對方提供具有強時間錨點的具體細節,並對這些細節獨立核查
嘗試視頻通話,注意觀察:幀率是否異常,面部邊緣是否有扭曲,光源方向是否與聲稱的場景邏輯一致
關於視頻通話的補充說明:現在的實時deepfake已經能夠欺騙普通觀察者,那位芝加哥受害者Grant就是在和"對方"進行了多次視頻通話後仍然被騙的。你需要關注的不是"臉對不對",而是一些技術性細節:背景的光源和人臉光源方向是否一致,人臉邊緣在快速轉頭時是否有一幀的模糊或扭曲,耳朵和頸部的輪廓是否自然。
如果條件允許,要求對方完成一些"不可預測的動作"——比如隨機舉起三根手指或者用手遮住半邊臉,這類即興動作對實時deepfake系統的壓力更大,更容易暴露技術痕跡。
這件事為什麼比你想的更難
這裡要說一個沮喪的事實:即使你把以上每一步都做了,你也無法百分之百確定一個人是真實的。
這不是悲觀,這是方法論上的誠實。
檢測AI生成身份的本質,是一場一致性核查。你在做的,是收集足夠多的信號,看這些信號能不能在獨立來源之間互相印證。
如果一個人在十個不同的維度上都呈現出"真實"的特徵,而且這些維度之間的邏輯關係是自洽的、難以整體偽造的,那麼這個人大概率是真實的。
但"大概率"不是確定。
對抗也在升級。GAN和擴散模型的進化速度,始終比檢測工具快一步。今天Hive Moderation能以99.9%的準確率識別某一類AI生成圖像,是因為它是基於已知模型的輸出訓練的。
明天出現一個新模型,它的輸出特徵還沒有進入檢測系統的訓練集,準確率就會下降。
這是一場沒有終點的追逐。
所以最可靠的防禦,不是找到一個萬能的檢測工具,而是建立一種思維習慣:在高風險場景——涉及金錢、涉及機密信息分享、涉及重要決策——任何人的身份都應該經過多維度的獨立核查,而不是僅憑直覺或單一技術手段判斷。
"那有沒有可能整套流程都過了,這人還是假的?"
有。
這就是為什麼最後那一關——要求對方提供具有時間特異性的、可獨立核查的現實細節是不能省的。
一個真實的人,可以給你提供他上周去的那家餐廳的名字,然後你能在網上找到那家餐廳的用戶評價,而且開業時間跟他的描述對得上。














