大家好,我是美國高中在讀十年級的Jennifer。
這兩天,人工智慧拿下諾貝爾物理、化學獎,我身邊的同學紛紛開玩笑,這是我們離諾獎最近的一次。
畢竟,在很多私立美高,在上課和寫作業時使用AI工具已經成了極其平常的一件事,甚至還開了一門關於AI研究的新課程。
我們老師也會用AI改論文、檢測作弊情況,但結果常常令我們這些學生嚇出一身冷汗——自己辛辛苦苦一字一句寫的作業,竟經常被它判定為「100%抄襲」!
當時我以為這種情況只是個例,但萬萬沒想到,我有一次完全自己寫出來的歷史作業,也被判定為「50%AI寫作」。
而且不光是我這個國際生,連美國本土長大的同學,也被AI這樣坑過。
這也讓我產生了莫大的好奇:
AI到底是如何判定一份文本是否抄襲的?如果我讓AI自己寫一份,再讓AI自己去批改,結果又會如何?我們還該繼續相信AI嗎?
■AI在美國學校里的使用率非常高,但也有一些學校禁止使用
■這是我媽媽的留言
被老師鼓勵使用的AI
從去年ChatGPT出現,學校對於AI的使用還是比較鼓勵的。
我們老師就曾在晨會上聊過這個話題——並不是那種嚴肅深刻地討論,而是更加包容且有互動性地表達一些觀點並和同學們交流。
後來,在今年的一個關於選課的會議上,我們學校的CS老師介紹了一門關於AI研究的新課程,也針對AI的出現做了一些更加詳盡地解釋和說明,並且倡導大家合理地使用,保持好與AI的邊界。
因為學校的態度還是比較「鼓勵」的,我們也就比較頻繁地使用著ChatGPT,它能很大地幫我提高學習效率,保持作業的準確率。
■美高需要大量閱讀,這些AI工具都可以幫我快速閱讀和總結
那麼,什麼是「與AI的邊界」呢?
準確來說,因為AI經常編造一些資料來源、引用等等,所以我覺得無論它多麼完善,主導者依然需要是我們自己,而不能完全依賴AI。
完成作業的時候,我一般會用AI去給我一些建議。
比如英語寫作project的語法修改建議或是結構建議,在這些方面AI確實比我們細緻一些。
■可以給出詳細語法修改建議的Grammerly AI
數學方面,AI對我來說更是一個「進階版作業幫」的用處,它最大的好處就是,在我遇到不會的題的時候,會給我非常詳細的每一步思路,如果我不會,還可以追問它,就像一個一對一的老師。
但最大的問題是,AI的答案經常是錯的。所以建議大家使用的時候,重點借鑑它的思路,答案還是要自己親手算出來。
■數學輔導AI有很多,通常都是上傳作業後給出詳細的每一步思路,比如這個號稱正確率高於ChatGPT的Tutoreva(近期我們也會分享好用的數學AI資源)
還有,有時候我們西班牙語會有一些presentation,比如最近我們需要做一個關於某個城市的旅遊介紹,需要先製作一個包含十個活動的旅遊攻略。
這時候我們老師會說這一部分可以給到ChatGPT做出來一個大綱,但是具體內容需要我們自己寫。
■ChatGPT也是西班牙語等二外的學習助手
被AI背刺
AI在美國校園的使用越來越普遍,但問題也應運而生,比如作弊。
相應地,如今也出現了很多AI檢測工具,像是Turnitin GPT,GPTZero等等,可以做論文查重,防止有人直接讓AI代替自己寫作業。
前段時間,我的學校歷史課有一個作業是關於撰寫一篇自己選擇的歷史事件的分析,前期的要求是進行research以及大綱撰寫。因為我有改述一部分資料上的內容,所以我就比較好奇我的查重率會不會變高。
於是,我就在網上隨便檢索了一個查重檢測工具,想看看會不會有什麼有趣的發現。
毫無疑問,我的thesis statement通過了查重檢測,顯示「沒有抄襲」。但是當我看到下面的「AI Detector」按鈕的時候,我突然想到前段時間一直讓我感到疑惑的問題:
無論是自己寫的、又或是AI寫出來的內容,都是由一個一個詞藻組成的,AI到底會用什麼分別其區別呢?
即使真的能夠分辨出來,它的準確性是否值得參考呢?因此,我便把我的thesis statement又放在了這個AI檢測的欄框裡。
令人驚訝的是,AI檢測給出的結果竟然是:我的內容有40%的可能是AI創作的!
至此,我開始對AI檢測的真實可靠性產生了懷疑。因為各種不同的檢測網站層出不窮,我便試圖又找了幾個網站希望獲得一些其他的信息。
有些搞笑的是,這幾個AI檢測的網站中,每個檢測結果都大相逕庭。有的AI說100%都是人類寫的,有的則說40%是用AI寫的。
無所不能的AI出現了如此出人意料的漏洞,徹底點燃了我的探索欲——如果ChatGPT自己寫一段文字,再讓別的AI去檢測,結果會是如何?
我便又讓ChatGPT幫我寫了一個相似方向的thesis statement,提交給不同的AI檢測工具。
這次的結果,比檢測自己的內容還讓我更加出乎意料——這些100%由AI寫的東西,在某些網站竟被判定為「人類撰寫」。
這下我徹底迷惑了:人類寫的被判定為抄襲AI,而AI自己寫的又被歸為人類的功勞,人工智慧到底在幹什麼?
第二天上課的時候,我們被兩兩分成了小組互相討論彼此作業的內容。我和我的同桌便探討起了關於AI檢測的內容。
接著,他也嘗試把自己寫的作業放進不同的檢測工具里,看看AI是否能夠較為準確地分辨和識別,最終的結果令我們兩個人都驚了——
一位純英語母語者,作業竟然也被判定為AI寫作。
我想,作為一個非母語者,或許語言能力沒有母語者那麼地道是一個情有可原的事情。但這個離奇的結果告訴我:
AI不單單歧視的是非母語者,而是所有人類。
■斯坦福一位學者的論文發現,AI在判定非母語者的論文時,會變得格外不可靠
那麼到底是為什麼,AI總是把在檢測查重的時候背刺我們人類呢?
這個問題困惑了我很久,於是我查閱了資料。
史丹福大學生物醫學數據科學教授詹姆斯·鄒發現,AI檢測的指標依據叫做perplexity(困惑度),也就是詞滙豐富度,詞彙多樣性,句法複雜性和語法複雜性。
顯然,非母語人士會在這個指標上得分比較低,會被認為語言過於機械和匱乏。
相應地,要想繞過人工智慧審查也非常容易,只要在自己寫的內容里,加入一段AI生成的「包含複雜文學性語言」的語段,就能輕鬆獲得高分。
■這兩年出現很多這類事情,比如這個新聞里的媽媽,女兒的作業被AI判定為90%抄襲,她花了幾個月的時間向教育部門申訴,因為這個記錄會影響大學錄取
對我而言,語言能力其實是一個很籠統的表述——
就像托福作為一個語言能力測試,分成了4個方面聽說讀寫,有些人有一門或者兩門十分出類拔萃,剩下的一兩門不是那麼顯眼,或是獲得了不是那麼優異的成績。
這算學習語言的能力過於機械、過於缺乏嗎?
或者就說我自己,我是一個非常不擅長應試的人,這樣的標準化考試會讓我感到緊張、焦慮,但是我的GPA不算低、學校的成績也能比較輕鬆地handle住,這算是語言機械、抑或是語言能力的缺乏嗎?
應試能力≠學習能力,每個人能力也不應該被任何事物標籤化,我覺得才是留學真正讓我收穫的意義。
■幾天之後的歷史課,老師講到了我們research的一些citation要求,雖然和之前的要求相差無幾,但是這次多了一個關於AI Citing的要求。
我還會相信AI嗎?
被AI「耍」了好幾輪,我還會繼續使用並相信它嗎?
在我的觀點裡,AI依然是一個作為學生值得學習、探索以及使用的工具。
AI在很多時候能夠讓我節省很多時間,比如複習某個科目的guideline,一些難解的問題找不到方法,AI都能夠高效地幫我篩掉無效信息,檢索出最精確的我所需的內容(雖然有時候還是會抽風)。
除此以外,我覺得我這段時間的一個特別的小的經歷,也能夠推動我對AI的態度有更清晰的認知。
最近上數學課的時候,我們班的有一個同學問老師,這些複雜的微積分題目在未來到底對我們有什麼用,我們又不會成為數學家、科學家。
老師的回答給了我一個對於學習所有科目的新思路:
「學習數學的目的並不是為了在未來解更多的數學題,而是為了培養一種我們的數學思維,這種思維模式能夠讓我們有更清晰的思路,去解決更多在未來面對的不同的難題。」
■羅博深教授曾來分享的時候也說過,「確保孩子擁有旺盛的好奇心和求知慾,用頭腦和工具提供創新的解決辦法,才能解決無數沒見過的新問題」(羅教授的女兒也是本文作者的學姐,申到了MIT和加州理工,最終選了後者)
所以,當我看到《第一個被AI淘汰的專業出現了?!》中討論翻譯會不會被徹底取代的時候,我的第一反應是並不會。
就像翻譯有翻譯器,藝術有AI作畫,但是其中的思維模式、學習能力,以及藝術靈感和人文思維,恰恰都是AI無法代替的。
這些能力並不會局限於某個領域,而是在生活中解決不同的生活問題的時候伴隨著我們,讓我們用積攢的能力獲得難題的最優解。
■目前AI總是畫不好人類的手和腳,有人猜測,這是AI在故意露怯,緩解人們對於AI接管世界的恐懼:「你看,我連手和腳都畫不好,怎麼會代替你呢?」