http://www.kadhoai.com.cn 2026-04-08 03:17:10 來源:中國自動化學會專家谘詢工作委員會
要素重組:讓自主創新能力無窮大的秘密

許嘉璐(右)和他的學生陳小盟(左)。中為河北省委常委、唐山市委書記趙勇(時任團中央書記處書記)。
許嘉璐曾經撰文指出,HNC的研究,第一,必須采取集體攻關的辦法;第二,可以用“百花齊放,百家爭鳴”的方針,不拘一格,幾種風格齊頭並進,既相互競爭,又彼此取長補短;第三,采用科學的管理辦法,按照科學研究的規律管理;第四,既要爭取國家的支持,又要盡量與企業合作;第五,既要出成果又要出人才;第六,中文信息處理事業將是長期的,要有薪火相傳的準備;第七,允許失敗,在不斷失敗—研究—再失敗—再研究的循環往複中前進。
按照這一思路,北京大正語言知識處理研究院十分注意生產要素重組工作,他們要讓自主創新的能力無窮大。
在許嘉璐的主持建議下,2004年1月,北京師範大學成立了中文信息處理研究所,以發揮語言學與應用語言學學科優勢,加強中文信息處理應用基礎研究;促進語言學與計算機等相關學科的交融,推動計算機語言學這一交叉學科的發展;搭建中文信息處理領域的合作平台,彙集高校、科研院所、高科技企業的專家學者集體攻關,探索中文信息處理理論與應用研究的新路;為國家培養兼通語言學與計算機科學的“兩棲型”專業人才;保持我國在語言信息技術領域的競爭力,保障國家、民族和社會的信息安全。
而er北bei京jing大da正zheng語yu言yan知zhi識shi處chu理li科ke技ji有you限xian公gong司si,具ju有you民min營ying性xing質zhi,是shi針zhen對dui自zi然ran語yu言yan理li解jie處chu理li的de理li論lun探tan索suo及ji其qi技ji術shu應ying用yong的de高gao新xin技ji術shu企qi業ye,是shi科ke技ji成cheng果guo轉zhuan化hua的de基ji地di。
根據許嘉璐的意見,研究院第二個資源重組的表現為全新的“學、研、產、用”相結合的產業化創新之路。許嘉璐多次指出,中文信息處理事業事關國家安全和社會穩定,它的發展需要加強基礎研究、應用研究和社會需求三者的結合,需要語言學界和計算機科學界專家學者的密切配合、共同攻關。HNC基礎理論和技術及其應用研究過程中,課題組通過探索市場經濟條件下的科學研究模式和項目管理模式,組織了中國科學院、北京大學、清華大學、上海交通大學、北京大正語言知識處理研究院等高校、科研院所、高科技企業的專家集體攻關,打通語言學與計算機科學的壁壘。
中國計算機語言學專業委員會第一屆主任魯川,在《有關“科學”和“語言”的暢想》一文中寫道:“HNC是自然科學跟人文科學交叉的新興‘智慧科學’的(de)一(yi)個(ge)典(dian)型(xing)代(dai)表(biao)。在(zai)探(tan)索(suo)過(guo)程(cheng)中(zhong),北(bei)京(jing)大(da)正(zheng)語(yu)言(yan)知(zhi)識(shi)處(chu)理(li)研(yan)究(jiu)院(yuan)根(gen)據(ju)社(she)會(hui)生(sheng)產(chan)需(xu)求(qiu)拓(tuo)展(zhan)研(yan)究(jiu)領(ling)域(yu),以(yi)理(li)論(lun)研(yan)究(jiu)促(cu)進(jin)方(fang)法(fa)學(xue)的(de)創(chuang)新(xin)。以(yi)應(ying)用(yong)方(fang)法(fa)學(xue)創(chuang)新(xin),催(cui)生(sheng)應(ying)用(yong)成(cheng)果(guo)的(de)實(shi)現(xian),用(yong)應(ying)用(yong)成(cheng)果(guo)轉(zhuan)化(hua)反(fan)哺(bu)基(ji)礎(chu)研(yan)究(jiu),使(shi)自(zi)主(zhu)創(chuang)新(xin)逐(zhu)步(bu)走(zou)上(shang)了(le)良(liang)性(xing)循(xun)環(huan)的(de)道(dao)路(lu)。”
持續創新:“核心競爭力”的金鑰匙

許嘉璐(前右)與陳小盟(後左)在工作中。
在強手如林的競爭中,北京大正語言知識處理研究院招兵買馬,廣納賢才,依托黃曾陽的HNC理論,在許嘉璐的精心指點下,潛下心來,埋頭HNC基礎理論研究和各項實驗,一幹就是8年。這8年,得到了慧眼識珠的中關村管委會和北京市委、市政府的大力支持。
八度燕來雁去,八度星回歲改,八度寒來暑住,八度春華秋實。
8年前,黃曾陽的理論還隻是一些公式和PC機上的初步模版演示。8年後,他已經是詩情畫意,收獲滿囊。他的專著《HNC(概念層次網絡)理論∶計算機理解語言研究的新思路》由清華大學出版社出版,概念層次網絡的研究,對語義文本、分詞等等的研究漸入佳境。黃曾陽也桃李滿枝,不少學子誌願投身到HNC理論這一具有自主知識產權的研究中,並不斷尋求新的創新與突破。
8年中,研究院一步一個腳印,捷報頻傳:
2001年6月,研究院成立半年後,HNC網wang絡luo信xin息xi智zhi能neng過guo濾lv器qi樣yang板ban機ji誕dan生sheng並bing進jin入ru中zhong試shi。年nian底di,過guo濾lv器qi開kai始shi試shi應ying用yong。它ta能neng有you效xiao地di識shi別bie文wen本ben信xin息xi內nei容rong,提ti高gao了le智zhi能neng與yu自zi動dong識shi別bie能neng力li,對dui網wang絡luo中zhong流liu動dong的de海hai量liang電dian子zi文wen本ben信xin息xi進jin行xing目mu標biao搜sou索suo與yu追zhui蹤zong。這zhe一yi成cheng果guo,使shi我wo國guo在zai信xin息xi語yu言yan知zhi識shi處chu理li領ling域yu的de國guo際ji競jing爭zheng中zhong占zhan據ju領ling先xian地di位wei。
2003年4月,“HNC信息智能過濾器”以其卓越的品質通過公安部計算機信息係統安全產品質量檢測,5月,取得公安部頒發的《計算機信息係統安全產品銷售許可證》,6月,取得國家版權局頒發的軟件著作權登記證書。
2004年,“HNC信息智能過濾器”獲得北京市科委頒發的軟件企業認定和軟件產品登記認定。
2005年,研究院參與承擔的“中文信息處理應用基礎研究”課題,順利通過國家高新技術研究發展計劃(863計劃)驗收,HNC開始形成了具有原始創新特點的理論與技術體係。
2007年,研究院承擔了國家科技支撐計劃“中文信息處理應用研究與係統開發”課題的研發。
2008年5月,工業和信息化部公布:大正研究院的“花季護航”上網管理軟件,中標“綠色上網過濾軟件產品一年使用權及相關服務采購”項目,成為國內相關領域軟件產品中惟一入選文字過濾產品……
8年來,大正研究院和北京師範大學中文信息處理研究所一起,先後承擔了包括國家重點科技支撐中文信息處理應用研究與係統開發項目(即原國家973計劃項目)、國家863計劃項目及中科院知識創新工程項目等科研任務。
8年來,大正研究院在國內外學術期刊發表論文60餘篇,取得了2項發明專利、17項計算機軟件著作權。
總結8年的創新實踐之路,研究院董事長陳小盟感慨良多。
陳小盟說:“思想與理念有多遠,創新之路就會有多遠。在大正研究院,我們提煉了這樣一條理念:HNC語言知識處理基地是一株大樹;HNC語言知識、HNC概念聯想網絡、以此為基礎吸收進來的其他理論應用成果、世界知識是它的根;建立在對語言的語義理解的基礎上,應用在計算機對語言信息的智能化處理的多個層麵是它的果實。”
按照許嘉璐的構想,研究院更像一個孵化器,在特殊機製催生下,HNC理(li)論(lun)好(hao)比(bi)種(zhong)子(zi),市(shi)場(chang)需(xu)求(qiu)好(hao)比(bi)土(tu)壤(rang),北(bei)京(jing)大(da)正(zheng)語(yu)言(yan)知(zhi)識(shi)處(chu)理(li)研(yan)究(jiu)院(yuan)的(de)基(ji)礎(chu)理(li)論(lun)研(yan)究(jiu)好(hao)比(bi)耕(geng)耘(yun),而(er)實(shi)用(yong)技(ji)術(shu)和(he)項(xiang)目(mu)則(ze)是(shi)陽(yang)光(guang)雨(yu)露(lu)下(xia)破(po)殼(ke)而(er)出(chu)的(de)新(xin)生(sheng)命(ming)。
黨的十七大以後,他們認真學習科學發展觀,對自主創新開始了新一輪的反思。經過總結經驗教訓,逐步達成共識:研究院的核心競爭力,來自持續不斷的自主創新;自主創新的動力來自市場需求。自主創新是一個科技、經濟一體化過程,是技術進步與應用創新共同作用催生的產物,從而對知識社會條件下以需求為導向、以人為本的創新模式更加堅定不移。
八年“潛伏”:贏得“紅杏枝頭春意鬧”

黃曾陽(中)在一次機器翻譯研討會上。
黑格爾說過:“要是沒有熱情,世界任何偉大事業都不會成功。”
作為HNC基礎研究課題的重要承擔單位之一和成果轉化基地,大正語言知識處理研究院、大正語言知識處理科技有限公司彙集了一大批莘莘學子。他們甘於奉獻,耐得住寂寞。許嘉璐說:“在IT界員工的收入一般是可觀的,而且跳槽早已司空見慣,‘大正’deshouruzhinengshuoshizhongdengshuizhun,dandaozheligongzuodexuezimenhenshaobaoyuan。dajiamomogengyun,wusifengxian,jiushiweilerangjuyouzizhuchuangxindejishunenggouzhuozhuangchengchang,jiushiweiletigaoguojiadekejiruanshili。”
自主創新激發出蓬蓬勃勃的活力,HNC基(ji)礎(chu)理(li)論(lun)研(yan)究(jiu)猶(you)如(ru)一(yi)株(zhu)青(qing)翠(cui)欲(yu)滴(di)的(de)新(xin)苗(miao),一(yi)旦(dan)破(po)土(tu)而(er)出(chu),就(jiu)呈(cheng)現(xian)出(chu)日(ri)新(xin)月(yue)異(yi)的(de)景(jing)象(xiang)。自(zi)主(zhu)創(chuang)新(xin)不(bu)斷(duan)推(tui)動(dong)著(zhe)科(ke)研(yan)成(cheng)果(guo)的(de)產(chan)業(ye)化(hua)進(jin)程(cheng),隨(sui)著(zhe)基(ji)礎(chu)理(li)論(lun)研(yan)究(jiu)的(de)深(shen)化(hua),“大正”的係列產品脫穎而出。
在推出HNC信息智能過濾器後,研究院又針對家庭、學校、網吧、企事業單位等不同用戶群推出係列產品,形成豐富的產品線。值得稱道的“花季護航”上網管理軟件,剛剛出爐就炙手可熱,被全國婦聯“百萬家庭護苗工程”確定為指定產品。“花季護航”shangwangguanliruanjian,yunyongteyoudeyuyipandingjishu,nenggouzidongpandingshibiexinxidebaobianyi,duihuangsebaoliheisedengbuliangxinxijinxingyouxiaodefangzhiyuguolv。hailiangneirongshenzhaheguanlixitong——自動審查軟件,是針對海量內容難於搜索、難於管理,人工審核費時費力等問題而開發的一款自動審查出版內容的軟件,讓計算機模擬人腦,在“理解”的基礎上判斷文本內容,有效地解決了誤審核的問題,提高了審核的準確度。
與此同時,北京大正語言知識處理研究院還麵對漢語加快走向世界的客觀需求,開發推出了創新、實用、大眾化的“漢語之聲”網站,用戶可以在漢語之聲網站享受學習漢語、體驗中國文化、訂購中國文化產品等專業服務。
麵對果實累累的今天,許嘉璐說:“自(zi)主(zhu)創(chuang)新(xin)是(shi)實(shi)現(xian)民(min)族(zu)複(fu)興(xing)的(de)不(bu)竭(jie)動(dong)力(li),中(zhong)華(hua)民(min)族(zu)要(yao)自(zi)立(li)於(yu)世(shi)界(jie)民(min)族(zu)之(zhi)林(lin),要(yao)展(zhan)翅(chi)騰(teng)飛(fei),就(jiu)要(yao)不(bu)斷(duan)提(ti)升(sheng)科(ke)技(ji)軟(ruan)實(shi)力(li),依(yi)靠(kao)自(zi)主(zhu)創(chuang)新(xin)變(bian)中(zhong)國(guo)製(zhi)造(zao)為(wei)中(zhong)國(guo)創(chuang)造(zao)。要(yao)在(zai)自(zi)主(zhu)創(chuang)新(xin)中(zhong)出(chu)成(cheng)果(guo)、出人才。北京大正語言知識處理研究院開發HNC基礎理論技術,並通過自主創新取得了初步成果,這僅僅是一個嚐試。相信我們國家會有大批類似HNC這樣的自主知識產權理論和技術誕生,也相信會有大批北京大正語言知識處理研究院式的IT企業脫穎而出。”
來源:光明日報