地球的ChatGPT時刻來了!
谷歌DeepMind推出AlphaEarth Foundations模型(下面簡稱AEF),實現高精度繪製地球。
諾獎得主、谷歌DeepMind執行長Demis Hassabis表示:它將為科學家提供近乎實時的地球觀測。
該模型主要是解決了數據過載和信息不一致兩大難題。簡單來說就是觀測數據多但高質量標註數據少,給繪製全球地圖帶來困難。
AEF就像一個虛擬衛星,整合了光學衛星圖像、氣候模擬等PB級的海量地球觀測數據,能夠利用多源、離散的數據生成通用的地理空間表示,讓科學家能夠按需創建地球地圖,毫不費力實現全球測繪和監測。
由它生成的衛星嵌入數據集現已被聯合國糧農組織、哈佛森林等超50個全球組織使用。
實際上,不只是科學家,普通人也能通過AlphaEarth Foundations輕鬆讀懂地球的變化。
從大航海時代到現代,人類花了500年時間繪製地球,而現在AEF的出現讓每天重新繪製地球成為現實。
這讓前谷歌地圖方面的研究員Bilawal Sidhu驚呼:谷歌朝著構建地球版ChatGPT邁出了重要一步。

來看看它是怎麼做到的。
高精度追蹤地球
多源信息融合,對時間連續建模
現在有衛星、雷達、無人機、氣象站等無數設備,每天都在收集地球的圖像、溫度、濕度、地形等數據。
但不同國家、機構對於觀測數據的標註標準可能不一樣,並且地球表面隨時在變化(比如森林被砍伐),但實地標註往往幾年才更新一次,導致標註數據和實際情況脫節。
簡單來說,地球觀測數據就像「拍了無數張地球的照片」,但知道「照片裡具體是什麼」的標註卻很少,這直接卡住了全球地圖的繪製精度和效率。
而AEF的價值,就在於它能在標註稀少的情況下,依然用好海量觀測數據,畫出更準確的地圖。

AEF是一種嵌入場模型,核心是時空精度編碼器(STP),STP通過空間自注意力捕捉地理上的遠距離關聯,通過時間軸自注意力解析時序動態,再結合卷積操作保留局部精細特徵。

通俗一點說就是把地球表面的複雜信息(如地形、植被、氣候等)壓縮成一組「數字密碼」(嵌入向量),這些密碼能精準反映地球表面的時空特徵,既能看全局又能抓細節。
AEF的另一大創新是對時間的連續建模能力。
它將觀測數據的支持期(數據實際採集的時間範圍)與地圖生成的有效期(需要映射的時間範圍)分離,即使在有效期內沒有直接觀測數據,也能通過插值或外推生成連續的結果。

比如,如果只有2018年和2020年的衛星圖像,模型能可靠推測出2019年某地區的地表狀態,這解決了傳統模型只能處理固定時間點數據的局限。

在數據處理上,AEF實現了多源信息的深度融合。
它能接收光學衛星、雷達、雷射雷達、氣候數據甚至地理文本等10多種輸入,打破了數據類型的壁壘。通過統一的編碼方式將這些不同類型、不同解析度的數據轉化為可兼容的特徵。
例如,光學圖像的植被顏色、雷達的地表結構信息、氣象站的溫度數據,都會被整合到同一個嵌入向量中,這個向量僅64位元組。

模型的訓練機制也頗具特色。它採用師生模型和對比學習策略。同時,引入文本對齊訓練,將地理文本描述與對應區域的嵌入向量關聯,進一步豐富特徵的語義信息。
最終,AEF生成的嵌入場以10x10米方格形式精確分析地球陸地和沿海水域,同時為每個方格創建高度緊湊摘要,存儲空間需求僅為其他AI系統的十六分之一,降低了分析成本。

並且這些嵌入向量無需重新訓練就可直接用於各類映射任務,無論是土地覆蓋分類、農作物識別還是森林變化檢測,都能通過簡單的遷移學習實現高精度結果。

卓越性能
與傳統方法和其他AI測繪系統相比,AEF在不同時間段執行多種任務時,包括識別土地利用和估算地表屬性等,始終保持最高準確性。
例如在某土地覆蓋分類任務中,AEF的平衡準確率達0.82,而次優模型僅0.69。
AEF尤其在標籤數據稀缺場景下表現出色,平均錯誤率比測試模型低24%,展現出卓越的學習效率。

從具體應用場景來看,AEF在主題映射(如土地覆蓋分類)、生物物理變量估計和變化檢測中表現全面。
例如,在年度土地覆蓋變化識別中,它能精準區分森林、農田、城市等類型,對細微變化的捕捉誤差遠低於傳統方法。

衛星嵌入數據集
在谷歌地球引擎中,由AEF驅動的衛星嵌入數據集是同類規模中最大的數據集之一,每年包含超過1.4萬億個潛入足跡。目前已在Earth Engine數據目錄發布。
這一系列年度嵌入數據已被全球多個組織採用,其中包括聯合國糧食及農業組織、哈佛森林、地球觀測組織等。它們藉助該數據集製作功能強大的自定義地圖。
例如,「全球生態系統地圖集」這一項目旨在打造首個全面資源,用於繪製和監測全球生態系統。該項目正利用此數據集幫助各國將未測繪的生態系統劃分為海岸灌叢、極端乾旱沙漠等類別。
全球生態系統地圖集全球科學負責人Nick Murray說:
衛星嵌入數據集正在徹底改變我們的工作,它幫助各國繪製未知生態系統的地圖——這對於精準定位保看護作的重點區域至關重要。

展示衛星嵌入數據集從粗到精的分割的無監督聚類動畫
巴西MapBiomas團隊正在測試該數據集,以更深入地了解全國範圍內的農業和環境變化,它為亞馬遜雨林等關鍵生態系統的保護策略和可持續發展舉措提供了重要依據。
AEF還有助於解決糧食安全、森林砍伐和水資源等關鍵問題。
對此,有網友表示:人工智慧模型正在成為公共基礎設施。

畢竟,看懂地球才能更好保護它。
















