新聞 > 科教 > 正文

美女洗版真假難辨 網友:AI網戀詐騙時代開啟

而Cosplay風格的AI照片也讓一些人感嘆「商業Coser和攝影師可能雙雙下崗」。對於ChilloutMix+LoRA這樣的技術,作者也意識到了可能被濫用的風險,並著重提示了法律風險,特別強調不要用於真實存在的人物。

什麼?這些不是真人照片,都是AI畫出來的?!



最近這樣一組美女圖片洗版了,許多人看到第一反應都是「AI逼真到這個份上了?」。



直到看到手部露出了破綻,才敢確定確實是AI畫的。



原來在ChatGPT的光芒掩蓋一切的這段時間,圖像生成AI已經從從畫畫悄悄進化到了「畫照片」。

這種風格和質量的AI照片,還有很多在各大網絡社區流傳,國內貼吧、微博、NGA,國外推特、油管,到處都是。



有網友表示:AI聊天+AI照片,快進到AI網戀詐騙。

而Cosplay風格的AI照片也讓一些人感嘆「商業Coser和攝影師可能雙雙下崗」。



根據各帖子發布者透露,這些AI照片都出自同一個模型,Chilloutmix。





多個模型融合進化,照片級AI誕生

ChilloutMix,二月初出現在模型分享社區CivitAI(不少愛好者稱之為c站)。

不到兩周時間,下載數量超過5萬。



簡單來說,這個模型還是基於大家熟悉的Stable Diffusion,1.5版本,但是由許多衍生模型合併(Merge)而來。

主要組件包括兩大模型,首先是Basilmix,專攻逼真的紋理和亞洲臉型。



但這個模型主要還是擅長半寫實的「2.5D風格」。



接下來合併了用照片集數據優化的Dreamlike的衍生模型,讓最終生成結果更接近3D寫實風格。



除了兩個主要模型之外,作者還添加了一些小的Embeddings(相當於給AI模型打補丁)。



比如第一個Pure Eros Face,提供的.pt文件只有3.92KB,可以合併到任何基於SD1.5的模型,專門負責生成「純欲系面孔」。



所有這些模型和Embeddings,各自擅長不同的地方,如一種畫風、一種紋理、人物臉型甚至姿勢。

Merge在一起後,可通過不同提示詞調用它們的能力,一般原作者都會附上使用指南。



如果還是不太會用,CivitAI社區里還會有很多網友曬使用相應模型生成的作品,其中還有很多標記了「NSFW」或「18+」,懂得都懂。



除了ChilloutMix之外,文章開頭的那組圖片之所以能固定生成同一張面孔,還使用了另一項技術LoRA。

LoRA本來是微軟研究團隊早在2021年提出的一項大語言模型微調的技術,可以大大提高微調訓練速度。

去年底,韓國科學技術院KAIST一位研究員@cloneofsimo與HuggingFace合作,將此方法擴展到Stable Diffusion上。

不僅實現了單塊11GB顯存的RTX2080Ti實現模型完整微調,同時原始模型權重凍結,新訓練出來的權重可以保存為3MB大小的單個文件發布。

這項技術被AI繪畫愛好者用來讓模型固定生成一個物體,最流行的就是固定一個人物形象。

現在,在CivitAI社區里,每個微調好的權重就叫做一個Lora,就相當於一個人物模版,所有人都可以方便下載使用。

如開頭的那組圖片就是來自叫「Korean Doll Likeness」的Lora,目前下載量排名第一。



對於ChilloutMix+LoRA這樣的技術,作者也意識到了可能被濫用的風險,並著重提示了法律風險,特別強調不要用於真實存在的人物。



為什麼AI還是不會畫手?

對於這個問題,最近也有了研究進展。

Stability AI 發言人表示,在AI數據集中,手的圖像不夠顯著,「在源圖像中,手(比面部部分等)要小得多。」

佛羅里達大學AI和藝術副教授Amelia Winger-Bearskin解釋說,AI基於從網際網路上收集的數十億張圖像進行訓練,它並不能真正理解「手」是什麼,至少不理解解剖學意義上手和人體的關聯。



在用來訓練生成AI的圖像中,手通常會抓住一些東西,或者另一隻手。如此一來,手指的情況就不容易辨清。

如果所有的訓練圖像中,手都是五指張開,AI就能夠畫出正常的手。

責任編輯: 夏雨荷  來源:量子位 轉載請註明作者、出處並保持完整。

本文網址:https://tw.aboluowang.com/2023/0216/1867365.html