引子
中國古代傳說中,有這麼兩位重要人物,一位是神農氏,一位是倉頡。
神農氏,又稱炎帝,是中國上古時期的三皇之一。傳說中是他發明了農業,教會人們種植五穀,並且遍嘗百草,發現了許多藥用植物,是古代中醫藥的發明人。神農氏的貢獻不僅在於農業和醫藥方面,他還被認為是最早的市場和貿易的創立者,為促進社會經濟的發展做出不可替代的貢獻。
倉頡,是傳說中漢字的創造者,「天生睿德,四目重瞳」,被後世尊稱為「文字之祖」。據說他是黃帝的史官,觀察鳥獸的足跡和自然界的各種形態,創造了最早的象形文字。傳說中,倉頡在成功創造了漢字之後,發生了兩件神奇的事情:
一,天降粟米
傳說倉頡造字成功後,天上降下了粟米。這象徵著文字的創造帶來了豐收和繁榮,表達了古人對文字發明的感激和崇敬。
二,鬼哭神嚎
另一個傳說是倉頡造字後,鬼神都為之驚嘆,甚至發出了哭嚎聲。這反映了文字的力量和影響力,認為文字的出現改變了天地之間的秩序。
用今天的眼光看這兩位「神人」,或者說,用科學的原理審視他們兩位的發明創造,我們或許會認為他們所做的,應該是一個在相關領域對前人積累的經驗及創造的成果進行收集、整理、歸納、提煉、總結、普及的工作,發明創造云云有些言過其實了。但我們若換一個角度看這個問題,就不難明白我們的先輩將神農氏和倉頡視為神祇,並賦予他們兩人無比崇高的地位,內在的動因是堅實且切合我們民族的生存與發展的實際的——
一,自古我們就有「民以食為天」的說法,在農耕方面做出「集大成」之貢獻、為民之「食」奠定恆久基業的人,將其推至至尊至聖者「神人」的位置,受子孫萬代的感念與敬仰,是絕不為過的。
二,文字是記錄的工具,是傳遞信息、普及科學與新知、傳承文化的重要手段。但文字的功能遠遠不止這些,它還是「挽留」歷史——記錄過往的重要人物與事件,使人類藉以從中吸取經驗教訓、遞進向前發展的重要工具和手段。記得有位學者說過,文字的出現是文明的起始點,沒有文字的民族,依舊生活在史前階段,而且很可能永遠無法走出史前階段。明白了文字的諸般作用和神奇功能,就不難明白,我們的祖先為何要編造「天降粟米,鬼哭神嚎」這樣的神話來描繪倉頡造字產生的影響。
中國的文字也稱漢字或方塊字,它為我們中國人記錄歷史、交流思想、傳承文明提供了一種「同一且恆定」的工具。文字學家黃德寬說:「漢字是世界上獨一無二的、持續穩定且歷久彌新的自源文字符號系統,這一特點從根本上保證了歷史悠久的中華文化的完整保存和持續傳承。」它與西方人使用的拼音文字相比,有許多獨特别致的地方,其主要的特徵表現在如下幾個方面:
一,方塊型字體,一字一體:漢字字形是平面型方塊體,且一字一體,每個字都書寫在一個方框內,筆畫自然有序分布,眾多書寫規整的漢字排列在一起給人軍列隊的感覺:整齊而莊重。
二,形音義結合:漢字的形、音、義之間有一定的聯繫。許多漢字可以通過字形聯想到字義或讀音,如「日」、「月」、「山」、「川」、「水」、「木」、「忍」等。
三,表意功能:漢字是一種象形文字,其表意功能十分突出、明顯,這是它與拼音文字相比極為重要的一個特徵。漢字中的每一個字,通過其固定的筆畫、結構、形體來表達一定的含義,一旦某個漢字被另一個同音字、異體字或拼音字母取代了,它的表意功能就會大受影響。
當然漢字還有其他一些特點,這裡就不一一列舉了。總之漢字的諸多特點使其在世界文字體系中別樹一幟,具有獨特的文化魅力和價值。
上篇:敏感詞審查對中國人網絡表達的影響
不知不覺間,漢字伴隨中國人走過了兩千多年的漫長曆程,雖然這期間漢民族多次淪為異族的奴隸,做了亡國奴,但漢字卻奇蹟般的保存下來,延續至今。
令人痛心疾首、不由得要仰天長嘆的是,歷史演進到二十世紀末,在網際網路成為人們發布信息、交流互動的主要通道和平台後,中國人在使用自己祖先創造的文字時,突然受到諸多限制——中國人,在不知不覺間,發現不能像以往那樣正常使用方塊字了。
中共當局限制中國人自由使用漢字的第一個手段是建立網絡監控體系。政府轄下的多個部門參與到這一浩大的「清網行動」中,具體執行人包括公安部門,國家安全部門,新聞管理部門、通信管理部門、文化管理部門、廣播電影電視部門、出版部門及保密等部門的工作人員。如此龐大的陣容負責監控全中國大陸的論壇、網誌、聊天室和私人即時通訊、電子郵件等。而他們通常使用的技術手段有域名劫持、關鍵字過濾、網絡嗅探、閘道器IP封鎖和電子數據取證等。這些工作人員會根據截獲的文件判斷其內容是否包含政府禁止的不良信息,並嚴格禁止、刪除各類被認為是「有害」的信息;查禁、封堵和阻斷可能會「利用網際網路造謠、誹謗」或者發表、傳播「有損國家利益和政府聲譽」的信息,例如關於「煽動顛覆國家政權、推翻社會主義制度」、「煽動分裂國家、破壞國家統一」、「煽動民族仇恨、民族歧視,破壞民族團結」、「竊取、泄露國家秘密」、邪教和淫穢等方面的信息。同時對特定人群實行網絡監控,並後台阻斷敏感人士的網絡通信。
在上世紀90年代,一種被稱為「敏感詞過濾」技術開始逐漸應用於網絡內容的管理和審查,它成為中共管控網際網路、打壓異見人士、限制網民言論自由的重要手段。
所謂敏感詞過濾,就是通過特別的網絡應用程式,來偵測和識別文本當中是否包含被政府劃歸為「敏感」或「有害」的字、詞、句,在發布前將其攔截、更換或刪除的技術手段,被中國政府廣泛應用於社交媒體、搜尋引擎、電子郵件等各種網際網路服務中。
由於這樣一種邪惡的技術「橫亘」在中國人和網際網路之間,中國人在發文發帖前不得不先自行做一番自我審查自我閹割的工作;又因為「敏感詞」是官方在暗中設定的,對廣大網民秘而不宣,人們在自我審查自我閹割時,也只能是邊猜測邊推敲,用不斷「試錯」方式摸黑往前行。
敏感詞過濾的具體起始年份很難確定。另外,它隨著網際網路和資訊技術的發展,以及網民規避審查的方式的增多,也在不斷的演變和升級。這一技術的應用給社交媒體的管理者同樣帶來困擾。我這裡保存有一份國內某論壇在2007年發布的公告,從這份公告中我們能明顯感受到網站的管理方在首次遭遇論壇「被直接掛上敏感詞詞庫」時的慌亂及手足無措的複雜心情——
✘✘論壇[公告]:
避免頁面屏蔽問題的相關事項,請學友配合
由於我壇被直接掛上敏感詞詞庫,一出現敏感詞,該頁面即被屏蔽,至今已多次出現主頁/分壇被屏蔽的現象,由於敏感詞範圍難以確定,學友發貼時,很容易出現幾個字湊巧碰在一起成為敏感詞的情況,而對於敏感詞,站方和版主們都沒有處理辦法,只能被動地進行一些處理,經驗總結之下,需要學友配合:
1/學友發貼後如發現被屏蔽,馬上記錄好出問題的地址、論壇名稱。
2/然後匯報到懇談本帖之下:
http://www.winterwind.com.cn/dispbbs.asp?boardID=56&ID=7378&page=1
請不要把文章題目寫上,只把連結貼上即可,或給出貼子編號,如上貼編號為7378,否則一出現題目可能馬上又被屏蔽。
請大家發貼後出現屏蔽時立即COPY該貼地址,並粘貼到本貼後面報告,謝謝!
那麼,當網站自動檢測到敏感詞後,除了屏蔽以外,還會採取哪些措施來處理和應對呢?
從我個人的經歷經驗分析,大致有以下這麼幾種方式——
一,用符號替換:將敏感詞替換為一些特殊的符號或變為方格。比如,某句話中出現了敏感詞「六四」或「天朝」,就將該敏感詞用「**」或」口口」替換掉。這是一種較溫和的處理方法,使發帖人知道自己在哪裡觸碰到紅線了,今後打字時好繞過這些詞。(見圖1、圖2)
圖1:「六四」兩個字被屏蔽,變成了兩個星號
圖2:「天朝」兩個字被屏蔽,變成了兩個方格
二,僅發布者可見:這是一種「逗你玩」的屏蔽方式。你在微信群發布了一條信息,從你的手機上看,它發布成功了——你能看到該條信息。但是群里的人看不到。有時候你會納悶,怎麼沒有人回應或點讚?後來你才明白,該信息被導入「僅發布者可見」模式,你想與群友分享的東西被系統成功攔截了。(見圖3、圖4)
圖3:僅發布者可見-1
圖4:僅發布者可見-2
三,警告:直接向用戶發出警告,提示你所輸入的內容包含敏感詞。(見圖5、圖6)
圖5:警告-1
圖6:警告-2
四,審核:將包含敏感詞的內容標記為待審核,由人工做進一步的檢查,然後給出處理結果。(見圖7、圖8)
圖7:待審核-1
圖8:待審核-2
五,刪除:刪除分兩種情況,一種是僅將一段話或一篇文章中所包含的敏感詞刪掉,其他內容仍然保留。另一種是將這段話或整篇文章徹底刪除,既網民們通常所說的「刪帖」。這是一種較為嚴厲的處罰方式,通常用於嚴格控制內容的網絡平台,或在所謂的「敏感時期」貫常使用的手段。這兩種」刪除」我都親歷過,下面簡單說一下——
一次是2017年初,我將一位朋友寫的隨筆,內容是他第一次與賀衛方先生聚會的經過以及留下的印象,發到「貓眼看人」論壇。文章經網站審核後放行。我瀏覽時發現,賀衛方的名字不見了。我趕快從頭到尾看了一遍,才知道整篇文章凡出現賀衛方名字的地方,都被刪掉了。惡劣的是,你刪除人名,至少該留出空格來,讓讀者知道這裡有個敏感詞被拿去了,但網站的做法是,人名刪除,卻不留空格,文章從外表一點也看不出被人動過手腳的痕跡。這是一種非常陰損的做法,但受傷害最重的其實不是被刪除名字的人,而是作者和讀者——讀者看這樣的文章,不明就裡,不知所云,還以為作者是個神經病呢,說出的話讓人摸不著頭腦,一頭霧水。(見圖9、圖10)
圖9:賀衛方成了敏感詞
圖10:境外媒體的同一篇文章
我整篇文章被刪除的經歷發生過許多次,最嚴重的一次發生在2007年,記得當時是在「貓眼看人」論壇發了一個啟蒙類的帖子,內容是自己平時讀書摘錄的關於自由、民主、人權與憲政方面的論述,數量很多,可以說是洋洋大觀。帖子放行後,我感覺看的人不是很多,於是將帖子的題目該改了一下,原題想不起來了,只記得改成了「反洗腦工作室」。這一改產生神奇效果,帖子立即火了起來,熱得不得了,點擊量節節攀升,短時間就有十多萬人閱讀。就在我暗自高興自己平時閱讀積累的東西能被如此眾多的網友喜愛,大家在分享這一「大餐」時也不斷給我鼓勵和點讚,我正偷著樂時,帖子突然不見了,消失了。慌亂中我想是不是帖子沉底了,就一頁一頁地翻找,但怎麼也找不到。這時候我心裡霍然明白過來,帖子一定是被站方刪除了,被斃掉了,不存在了。讓我完全想不到的是,站方這一次給了我更加嚴厲的懲罰——我發在貓眼的全部帖子,發在凱迪網的數百篇貼文,全部被刪除乾淨,片「瓦」未留。(見圖11、圖12)還好,過了一陣子別的帖子又給恢復了,不過這是後話,另文再詳述吧。
圖11:下午6點30分左右,我在凱迪的所有帖子全沒了
圖12:2013年遭遇的一次全論壇封口
六,封號。封號是對網絡使用者最為嚴厲的一種懲罰措施。它分為兩種情況,一種是臨時封號,大約時長為7天到15天不等,到時會自動解禁。另一種是永久封號,若是你發了被網站視為「極端反動」或「有害」的信息,有些網站就會對你採取永久封號措施,那你在該網站就「沒得玩的」了,只好到別處去「另謀高就」啦。
(未完待續)