如何繼承和傳播漢字_網(wǎng)絡(luò)傳播中漢字功能的探析
發(fā)布時間:2020-02-21 來源: 感恩親情 點(diǎn)擊:
網(wǎng)絡(luò)傳媒中的符號主要有兩類:內(nèi)容類符號和管理類符號。一般來說,內(nèi)容類符號用來表達(dá)互聯(lián)網(wǎng)傳播的信息內(nèi)容,包括各種文字、代碼、聲音、圖片等;而管理類符號用來控制、識別、管理網(wǎng)絡(luò)中的信息流轉(zhuǎn),主要由英文字母和英文鍵盤符號來承擔(dān)。原因,當(dāng)然是發(fā)明計(jì)算機(jī)的是有拼音字母文明背景的美國人。漢字在互聯(lián)網(wǎng)的歷史上主要作為內(nèi)容類符號指事、狀物,基本不參加網(wǎng)絡(luò)管理。
網(wǎng)絡(luò)身份認(rèn)證與驗(yàn)證碼
近兩年來,情況有所變化,互聯(lián)網(wǎng)上廣泛使用的服務(wù):論壇、留言板(BBS)、博客(Blog)等,大量存在網(wǎng)絡(luò)機(jī)器人(Robots,網(wǎng)絡(luò)自動注冊登錄的軟件)惡意注冊,注冊登錄后發(fā)一些廣告、黃色、欺騙、語言暴力信息的現(xiàn)象。垃圾信息已成為令人頭痛的世界性問題。例如,如果網(wǎng)絡(luò)機(jī)器人連續(xù)在博客論壇中發(fā)表同一個內(nèi)容的帖子,不久論壇的整個板塊就全是單一發(fā)表的信息了,其他信息全被擠在了后面。假設(shè)惡意發(fā)表的信息足夠多,版主都刪不完時,那么這個論壇基本就報(bào)廢了!這在網(wǎng)絡(luò)中被稱為:惡意“灌水”。其他的商業(yè)論壇也意識到了防止惡意“灌水”的重要性,紛紛使用了一些防止惡意自動登錄發(fā)帖的措施:有發(fā)帖間隔時間的限制、同一IP(網(wǎng)絡(luò)地址)地址的發(fā)帖數(shù)限制、內(nèi)容不能重復(fù)等,但是這些都不是當(dāng)前的重點(diǎn)。由于論壇使用的是一個公用發(fā)帖表單,對發(fā)帖的客戶身份進(jìn)行監(jiān)督、鑒定成為重點(diǎn),即用“驗(yàn)證碼”進(jìn)行網(wǎng)絡(luò)身份認(rèn)證,鑒別和區(qū)分登錄者是自然人還是自動登錄的機(jī)器。當(dāng)然,自然人也可能手工發(fā)布垃圾信息,但畢竟耗時費(fèi)力,數(shù)量有限。網(wǎng)絡(luò)機(jī)器人可以一天24小時向全世界網(wǎng)絡(luò)自動發(fā)布信息,是公共論壇的主要敵手和防范對象。
簡而言之,驗(yàn)證碼(Captcha Decoder)就是通過符號代碼把人類與計(jì)算機(jī)進(jìn)行自動區(qū)分、判別的一種手段。
早期的驗(yàn)證碼比較簡單,主要是數(shù)字和字母組成的用戶名和密碼。用在BBS、論壇和網(wǎng)站中,用戶在注冊、發(fā)帖時,通過驗(yàn)證碼驗(yàn)證成功后方可使用這些功能。目的是防止有人利用自動登錄的機(jī)器,如專業(yè)發(fā)帖機(jī)、自動投票機(jī)、自動充值機(jī)等,在網(wǎng)站上亂發(fā)垃圾帖、廣告帖?墒牵栏咭怀,魔高一丈,后來的網(wǎng)絡(luò)機(jī)器人程序經(jīng)過改進(jìn),可以破解相對簡單的原形數(shù)字和字母驗(yàn)證碼。
目前各類網(wǎng)站對安全問題都提出了較高的要求,傳統(tǒng)的“用戶名+密碼”的方案難以滿足復(fù)雜的外部環(huán)境需求。因此,各類網(wǎng)站大量采用圖片“驗(yàn)證碼”來防止有不良用心的人對網(wǎng)站進(jìn)行“暴力破解”(自動反復(fù)猜測密碼)登錄,把隨機(jī)生成字符信息放入圖片中,防止計(jì)算機(jī)自動登錄軟件直接識別。具體做法是:登錄采用圖片驗(yàn)證碼,它是包含無規(guī)律字符信息的圖片。普通用戶用肉眼就可以辨認(rèn)其中的字符信息,系統(tǒng)在執(zhí)行其它操作之前,先驗(yàn)證用戶輸入的“驗(yàn)證碼”是否和圖片上的一致。如果不一致,則直接返回到客戶端,不進(jìn)行余下操作。這樣,通過使用惡意軟件自動登錄的行為(用意不善的用戶用行為不合法的軟件登錄系統(tǒng)或網(wǎng)站,而不用人工輸入號碼和密碼)就會被有效阻止。
但是事情的另一方面也在發(fā)生變化,為了對付驗(yàn)證碼,“敵人”在自動登錄軟件中采用了文字識別技術(shù)(文字識別技術(shù)是指電腦自動識別圖片中的文字,不用人的肉眼辨認(rèn)。它可以被盜號者用來掛號,與驗(yàn)證碼是矛與盾的關(guān)系。)因此“我們”必須不斷改進(jìn)才能防止這些軟件的自動識別,改進(jìn)的驗(yàn)證碼加入了一些雜點(diǎn)、線條,所以較以前更加難以辨認(rèn)!拔覀儭闭谂Ω倪M(jìn),期望在不太影響用戶體驗(yàn)的前提下,提高安全性能。
“戰(zhàn)爭”還在繼續(xù),當(dāng)前大多數(shù)網(wǎng)站采用的“字母+數(shù)字”圖片的方法來進(jìn)行驗(yàn)證,由于“字母+數(shù)字”數(shù)據(jù)量較少且筆形相對比較簡單,還是容易被OCR(光學(xué)字符識別)軟件破解。無奈之下,國內(nèi)的網(wǎng)絡(luò)管理者祭出了中國人看家的法寶――漢字,由于漢字?jǐn)?shù)量眾多且筆畫復(fù)雜,再加上其它防范措施,就使?jié)h字驗(yàn)證碼具有較高的防破解能力。用漢字可以筑起一道國際互聯(lián)網(wǎng)上的“長城”,有效抵御、過濾自動登錄惡意信息。通過使用戶名、密碼和位圖漢字驗(yàn)證碼的混合認(rèn)證方式,除了要求用戶輸入用戶名和密碼之外,還要求手工輸入隨機(jī)生成的隨機(jī)碼(動態(tài)生成圖片漢字驗(yàn)證碼),基本上防止了自動化的程序填寫登錄;同時限制錯誤登錄次數(shù)和使用“擴(kuò)展動態(tài)密碼”,密碼錯誤超過限制次數(shù),即封堵欲登錄者IP(網(wǎng)絡(luò)地址)或ID(用戶登錄號),以降低惡意程序訪問服務(wù)器的頻率。頁面中的隨機(jī)碼為漢字字符,用圖形顯示,每個隨機(jī)碼對應(yīng)的圖形不止一種,使用文字變形, 非固定大小, 背景噪聲等,以防止非法程序的分析破解。①
常見的字符圖片驗(yàn)證碼種類及其強(qiáng)度
字符圖片驗(yàn)證碼主要由數(shù)字、漢字、英文字母組成。不考慮順序,三者能產(chǎn)生7種組合。即:純數(shù)字、純漢字、純字母;數(shù)字+漢字、數(shù)字+字母、字母+漢字;數(shù)字+漢字+字母。
考慮到自然人用戶的體驗(yàn)等因素,常用的字符圖片驗(yàn)證碼種類及其強(qiáng)度見下表②:
可以看出,隨機(jī)的原形數(shù)字字符串圖片驗(yàn)證碼,驗(yàn)證作用幾乎為零。目前常用的隨機(jī)數(shù)字圖片驗(yàn)證碼,如果圖片上的字符比較中規(guī)中矩,驗(yàn)證作用也很弱,因?yàn)閿?shù)字和字母加起來一共30多個,很容易被黑客用窮舉的方法破解。有的網(wǎng)站用圖片式的“隨機(jī)數(shù)字+隨機(jī)大寫英文字母(變形)+隨機(jī)干擾像素+隨機(jī)位置”,整個構(gòu)圖有點(diǎn)夸張,每刷新一次,字符還會變位置,有時候出來的圖片,雖然阻擋了計(jì)算機(jī)自動識別,可人眼都不易識別了,比如數(shù)字“1”和字母“l(fā)”就很難區(qū)分,有的字母大寫和小寫也很難區(qū)分,有些字母大幅度變形,以提高機(jī)器的識別難度?墒,人的識別難度在增加,破壞了用戶體驗(yàn)。相比之下,漢字圖片驗(yàn)證碼就不同了,由于漢字?jǐn)?shù)量眾多且筆畫復(fù)雜,再加上其它防范措施,就使?jié)h字驗(yàn)證碼天然處在防破解能力的高端,雖然經(jīng)過旋轉(zhuǎn)、縮放、干擾等處理,中國人用肉眼識別其中的驗(yàn)證碼信息,再輸入表單提交網(wǎng)站驗(yàn)證,應(yīng)該沒有太大的問題。
驗(yàn)證碼的效果
現(xiàn)在越來越多的網(wǎng)站為了安全性或是防止“垃圾郵件”(spam)的侵害,采用了驗(yàn)證碼的校驗(yàn)技術(shù)。驗(yàn)證碼可以有效防止對口令的刺探和所謂的網(wǎng)絡(luò)推廣軟件帶來的大量的“垃圾信息”內(nèi)容,目前已經(jīng)被許多互聯(lián)網(wǎng)應(yīng)用接受為標(biāo)準(zhǔn)的實(shí)現(xiàn)方式。
一位飽受垃圾信息困擾的論壇版主寫道:“一直被群發(fā)搞得我一天刪除幾千條評論,我這懶人也被逼急了,給論壇加裝了驗(yàn)證碼,世界終于清靜了。”
另一博客的作者寫道:“今天上午遭受機(jī)器人‘灌水’攻擊,評論一下激增200多條,其特點(diǎn)是留言為全英文,其中夾雜兩至三個鏈接。想著去官方論壇匯報(bào)一下的,誰知道遭遇此事的不止我一個,并且網(wǎng)站官方已經(jīng)給出方案:加裝新驗(yàn)證碼,在驗(yàn)證碼框中輸入正確答案即為通過。評論或留言的內(nèi)容有兩個或以上鏈接,不給通過。日期: 2007-06-14 17:31。”
國內(nèi)最大的專業(yè)論壇軟件制造商:康盛創(chuàng)想科技于2007年7月推出了專業(yè)論壇管理軟件新版本Discuz!6.0 。該版本提供強(qiáng)大驗(yàn)證碼(中文、英文、Flash動畫),強(qiáng)化了防“灌水”機(jī)制。他們表示:越來越多的論壇被“灌水機(jī)”困擾!許多論壇都成了“灌水機(jī)”軟件較量的演兵場!有的站長自我解嘲:新站剛建好就日發(fā)帖(被灌水的廣告帖)上百了!這正是很多站長的真實(shí)感受,論壇的人氣常常會因?yàn)椤肮嗨畽C(jī)”肆虐而陷入低谷!為了方便站長們對付各種“灌水機(jī)”和惡意“灌水”,Discuz!開發(fā)團(tuán)隊(duì)在Discuz!6.0新版本中進(jìn)一步增強(qiáng)了驗(yàn)證碼功能,增強(qiáng)的驗(yàn)證碼功能將有三種驗(yàn)證方式:英文圖片驗(yàn)證碼、中文圖片驗(yàn)證碼、Flash動畫驗(yàn)證碼。其中中文圖片驗(yàn)證碼,允許站長根據(jù)自己網(wǎng)站的具體情況來設(shè)置驗(yàn)證碼的復(fù)雜度。③
漢字圖片驗(yàn)證碼的發(fā)展
隨著現(xiàn)代信息技術(shù)的蓬勃發(fā)展,拼音字母符號在某些方面已有些力不從心。漢字符號承載了中華五千年的悠久文明,漢字所蘊(yùn)藏的豐富信息和科學(xué)內(nèi)涵,與拼音文字相較而言,有其獨(dú)特的優(yōu)勢。漢字的意象思維功能、圖形功能等,在互聯(lián)網(wǎng)管理中的作用已逐漸顯現(xiàn)。漢字不是線性的,而是平面的、二維的(Two-dimensional),一個“字形”是一個二維的方塊圖形。一個漢字包含了比單個拼音字母更復(fù)雜的信息。英國語言學(xué)家帕默爾認(rèn)為:“在中國,一如在埃及,文字不過是一種程式化了的、簡化了的圖畫的系統(tǒng)。就是說,視覺符號直接表示概念,而不是通過口頭的詞再去表示概念這就意味著書面語言是獨(dú)立于口頭語言的各種變化之外的,它意味著,一個學(xué)生學(xué)了4000個左右的視覺符號(據(jù)說足夠日常應(yīng)用了)之后,四千年的文獻(xiàn)就立刻展現(xiàn)在他面前了。漢字是中國通用的唯一交際工具,它是中國文化的脊梁。如果中國人屈從西方國家的再三要求,引進(jìn)一種字母文字,充其量不過為小學(xué)生(和歐洲人)省出一兩年學(xué)習(xí)時間。但是為了這點(diǎn)微小的收獲,中國人就會失掉他們對持續(xù)了四千年的豐富的文化典籍的繼承權(quán)!雹
漢字傳播價值的獨(dú)特性就在于它的表意性,即能夠通過字形來顯示它的意義。具體模式為:以具有象形特征的漢字字根為核心,通過字根的繁衍造字,通過把這些字根作為構(gòu)字部件造成新字的方式,將象形示意的功能擴(kuò)散到所有的漢字之中。漢字字根的最主要特征就是它的象形性,即能夠從一個字的字形上直觀形象地辨知到這個字的意義,傳統(tǒng)說法稱漢字為象形文字也就是從這個意義而言的。⑤
漢字的表意性使得漢字包含了比拼音字母更復(fù)雜的結(jié)構(gòu)和更多的意義信息。中國人通過學(xué)習(xí)漢字,已經(jīng)對常用漢字的結(jié)構(gòu)和意義了然于胸。對漢字的一些變化處理,如旋轉(zhuǎn)、字體變化等,基本上不會影響人工識別,而計(jì)算機(jī)識別變化過的漢字,由于計(jì)算機(jī)程序表意分析能力弱,自動識別就比較困難。正如徐德江先生所言:“低水平的工業(yè)化時代歪曲了漢字,只有高水平的信息化時代,才能揭示出蘊(yùn)藏在漢字中的人類高度智慧的科學(xué)奧秘!雹
1.安全性問題
進(jìn)一步提高提高安全性,可以采取下列辦法:增加文字旋轉(zhuǎn)角度;增加隨機(jī)漢字字體;增加隨機(jī)漢字大。辉黾訚h字?jǐn)?shù)量;增加彩色背景等。
目前的漢字驗(yàn)證碼只是利用了漢字的字形,以后可以進(jìn)一步利用字義驗(yàn)證。例如,可提供漢語成語、古詩詞來實(shí)現(xiàn)驗(yàn)證。圖片顯示“政通人□”,空格由用戶來填;顯示“白日依山□”,空格由用戶來填。
有的網(wǎng)站提出了“漢字語音驗(yàn)證碼”:顯示的漢字圖片帶有干擾碼,基本上是看不大清楚,網(wǎng)頁附帶語音模塊,需要語音朗讀才能準(zhǔn)確辨認(rèn)!目前速度不是很理想,有延遲,有待進(jìn)一步完善。⑦
2.用戶體驗(yàn)問題
對用于互聯(lián)網(wǎng)信息傳播管理的漢字字符進(jìn)行篩選,國標(biāo)字符集GB2312中的漢字不是全都要用。可以集中選擇一些平時大家都認(rèn)識的漢字。如果生成中文漢字驗(yàn)證碼中有很多不認(rèn)識的漢字讓我們輸入,對于使用拼音輸入法的客戶來說可不是件好事,五筆輸入使用者還能勉強(qiáng)根據(jù)漢字的長相打出來。這方面王玉菊、魯川先生提出的《“漢語一千字”作為通用語義符號系統(tǒng)的設(shè)想》可以作為一種解決方案。⑧
一些網(wǎng)站的驗(yàn)證碼過多,出現(xiàn)了“濫用”的現(xiàn)象。應(yīng)該給用戶一個機(jī)會,超過某個次數(shù)再使用驗(yàn)證碼,使它更趨人性化。例如,只有當(dāng)垃圾評論較多的時候才啟用它。
3. 使用范圍問題
漢字驗(yàn)證碼目前主要用在面向漢語網(wǎng)民的網(wǎng)站認(rèn)證上,防止有人利用軟件自動批量注冊。漢字目前的國際化程度不高,面向英文的網(wǎng)站就不能用了。不過有些事情的缺點(diǎn)可能正是它的優(yōu)點(diǎn),漢字驗(yàn)證碼在阻擋外來非漢語國家的垃圾信息應(yīng)該有奇效。一些主要面向國內(nèi)的論壇、社區(qū),甚至是機(jī)關(guān)、管理部門網(wǎng)站都可以優(yōu)先選用漢字據(jù)調(diào)查驗(yàn)證碼。據(jù)調(diào)查,美國仍然是垃圾郵件發(fā)送大國, 2007年第三季度,超過四分之一的垃圾郵件來自美國。南韓是全球第二大垃圾郵件生產(chǎn)國,但只占所有垃圾郵件的
5.2%,而美國占比例的28.4%,英國排名第十,所占比例為2.4%,可見阻擋外來非漢語垃圾信息的重要性。⑨
總之,漢字在現(xiàn)代網(wǎng)絡(luò)信息傳媒中已從“被”表現(xiàn)的內(nèi)容符號,進(jìn)入到信息管理符號的行列。雖然只是漢字應(yīng)用的一小步,對將來漢字在信息時代的發(fā)展提供了一種現(xiàn)實(shí)的可能性。
注釋:
、亳医⒌取痘赪eb的多重身份認(rèn)證的設(shè)計(jì)與實(shí)現(xiàn)》, 《電腦知識與技術(shù)(學(xué)術(shù)交流)》2007年第1期
、诹簿W(wǎng)絡(luò),http://www.省略/captcha/
、凵鐓^(qū)動力Discuz!,http://www.省略/index.省略/demo/yuyin/
、圄敶ā稘h字在信息時代和知識經(jīng)濟(jì)社會中的地位》,《漢字文化》2007年第4期
、嶂袊ヂ(lián)網(wǎng)協(xié)會反垃圾郵件工作委員會http://www.省略/
相關(guān)熱詞搜索:漢字 探析 網(wǎng)絡(luò)傳播 網(wǎng)絡(luò)傳播中漢字功能的探析 網(wǎng)絡(luò)語言的傳播學(xué)探析 漢字類新聞傳播論文投稿
熱點(diǎn)文章閱讀