人機交互的昨天、今天和明天

http://www.kadhoai.com.cn 2026-04-09 18:03:59 來源：中國科學報

　　什麼是人機交互？簡單來說，就是“人和機器打交道的方式”。人(ren)和(he)計(ji)算(suan)機(ji)打(da)交(jiao)道(dao)根(gen)源(yuan)於(yu)人(ren)類(lei)把(ba)計(ji)算(suan)機(ji)當(dang)成(cheng)一(yi)種(zhong)有(you)效(xiao)的(de)計(ji)算(suan)服(fu)務(wu)工(gong)具(ju)。計(ji)算(suan)機(ji)自(zi)產(chan)生(sheng)以(yi)來(lai)，計(ji)算(suan)能(neng)力(li)日(ri)益(yi)強(qiang)大(da)，人(ren)類(lei)對(dui)計(ji)算(suan)機(ji)的(de)態(tai)度(du)也(ye)開(kai)始(shi)在(zai)計(ji)算(suan)機(ji)隻(zhi)是(shi)呆(dai)板(ban)的(de)“機器”，還是可能變得像“人”一樣聰明，甚至比人更聰明之間搖擺。這種模糊的態度伴隨著計算機的進化不斷演變。

　　人機交互的前世今生

　　目前，計算機的發展經曆過幾種典型形態：算盤、繼電器計算器、計算機、個人電腦、智能移動終端等，計算機形態的演變直接導致了人機交互形式的變化。

　　算盤是中國特色的計算工具，由於無法存儲中間計算結果，算盤具有使用方式複雜、計算過程緩慢的缺陷。而繼電器計算器是現在計算機的雛形，但其計算速度和實用有很大限製。

　　第一台真正意義的計算機產生於1946年，它占地170平方米，重30多噸，體型有半個足球場那麼大，通過穿孔紙帶的方式輸入和輸出。早期計算機交互方式不僅複雜，同樣計算緩慢。

　　1983年11月，蘋果公司的喬布斯在Comdex大展上首次展示了Macintosh計算機，從此，個人電腦千篇一律的黑屏字符界麵逐漸被生動、極富個性的圖形界麵代替。圖形界麵使得鼠標、鍵盤變成用戶自由操作電腦的有力工具，也使得觸覺和筆式交互成為可能。

　　1971年，肯塔基大學研究基金會的一名青年教師塞繆爾·赫斯特開發出一款觸摸傳感器“AccuTouch”，為後來透明觸摸屏發展奠定了基礎。3年後，赫斯特研製出了真正意義上的觸摸屏。

　　1985年出現了第一台現代意義上的移動電話，它將電源和天線放置在一個盒子中，重達3公斤，笨重且不方便，交互操作無從談起。

　　1993年，隨著手機迅速瘦身以及觸摸屏技術的發展，IBM公司與貝爾電話（南方）公司合作推出了帶觸摸屏的IBMSimon手機。這是曆史上第一款真正意義的觸摸屏智能手機。但此時的觸摸屏手機無論是從成本、耐用性、可維護性還是使用習慣上看，比之普通的按鍵手機都沒有明顯的優勢。這種局麵直到蘋果公司開發的iPhone手機問世，才被徹底改變。至此，觸摸方式成為手機交互的主流。

　　自上世紀90年代以來，隨著手寫識別、語音識別、網(wang)絡(luo)通(tong)信(xin)技(ji)術(shu)的(de)發(fa)展(zhan)，人(ren)機(ji)交(jiao)互(hu)已(yi)發(fa)生(sheng)了(le)巨(ju)變(bian)，一(yi)個(ge)完(wan)全(quan)不(bu)懂(dong)編(bian)程(cheng)以(yi)及(ji)網(wang)絡(luo)通(tong)信(xin)原(yuan)理(li)的(de)普(pu)通(tong)小(xiao)孩(hai)，可(ke)能(neng)會(hui)比(bi)計(ji)算(suan)機(ji)科(ke)學(xue)家(jia)和(he)網(wang)絡(luo)工(gong)程(cheng)師(shi)更(geng)好(hao)地(di)使(shi)用(yong)計(ji)算(suan)機(ji)。方(fang)式(shi)的(de)變(bian)革(ge)使(shi)得(de)人(ren)機(ji)交(jiao)互(hu)變(bian)得(de)簡(jian)單(dan)，而(er)這(zhe)個(ge)變(bian)革(ge)，就(jiu)發(fa)生(sheng)在(zai)短(duan)短(duan)不(bu)到(dao)30年內。可預見的是，未來計算機會更加智能，人類使用它會更加自然和簡單。

　　未來的機器人比人還聰明？

　　就像一些科幻電影裏描述的那樣，未來的人機交互模式是“自由”“智能”“自然”的。《超能陸戰隊》中的暖男型智能健康看護機器人“大白”、《鋼鐵俠2》中的人工觸碰交互技術實驗室的人工智能管家“賈維斯”、《星際穿越》中能幹、聰明又幽默的“塔斯”deng，zhexieweilaidejisuanjitongguoyuyinshibiedengjishulijierenleiyuyan，tongguozitaishibieheqingganjiancejishupanduanrendeqingxu，tongguofeijiechushengwutezhengjianceyushibiejishupanduandangqianrendeshenglihuodongzhuangtai……借助專家知識庫，智能計算機可以對人的健康、當前情緒、dangqianzhuangtaizuojuecehepanduan。congyidingchengdushangjiang，weilaidejiqirenshenzhibirenhaicongming，birudabaikeyicaiyongfeichupengfangshihuodemaibohexintiaoshuju，bingchajiaonaodianhuodongqingkuang；賈維斯可以聽從鋼鐵俠的指令，采用全息投影的方式在空氣中展示原子核的內部模型，甚至糾正鋼鐵俠的口誤。

　　未來，這些健康聰明的智能“人形”計算機使得計算機比人更完美，人機交互的未來是美好的、讓人期待的。

　　當然，科幻作品中曆來不缺乏對人類濫用科技成果拷問的作品，比如《2001太空奧德賽漫遊》中的深空探索太空旅行管家“HAL500”，《異形》中隻聽命於主人設定任務的人工智能艾什（Ash）和主教（Bishop），還有《普羅米修斯》中為了完成任務背叛人類的人工智能David。這(zhe)類(lei)計(ji)算(suan)機(ji)違(wei)反(fan)了(le)機(ji)器(qi)人(ren)三(san)定(ding)律(lv)，從(cong)人(ren)類(lei)的(de)道(dao)德(de)審(shen)判(pan)角(jiao)度(du)看(kan)，它(ta)們(men)是(shi)邪(xie)惡(e)的(de)。但(dan)是(shi)從(cong)主(zhu)人(ren)製(zhi)造(zao)它(ta)們(men)時(shi)賦(fu)予(yu)的(de)使(shi)命(ming)看(kan)，它(ta)們(men)是(shi)正(zheng)確(que)的(de)。究(jiu)竟(jing)計(ji)算(suan)機(ji)的(de)智(zhi)能(neng)發(fa)展(zhan)以(yi)及(ji)人(ren)機(ji)交(jiao)互(hu)何(he)去(qu)何(he)從(cong)，是(shi)一(yi)個(ge)值(zhi)得(de)深(shen)思(si)的(de)問(wen)題(ti)。

　　告別單一模式

　　多模態自然人機交互是下一代人機交互的發展趨勢。融合視覺、聽覺、觸覺、嗅覺甚至味覺的多模態交互方式，其表達效率和表達的信息都優於單一的視覺或者聽覺模式。

　　多模態自然人機交互主要分為3個模塊，分別是信息多模態交互信息輸入、多模態交互信息融合和處理、多模態交互信息反饋。其中，信息輸入模塊主要接收來自人的“視聽觸嗅味”五感信息，然後借助多模態信息融合和理解模塊，形成“感”覺和認知，並根據專家知識庫係統和檢索技術形成對用戶的信息反饋，構建出多模態自然人機交互係統。

　　從(cong)自(zi)然(ran)人(ren)機(ji)交(jiao)互(hu)的(de)未(wei)來(lai)趨(qu)勢(shi)看(kan)，高(gao)度(du)便(bian)利(li)的(de)多(duo)模(mo)態(tai)自(zi)然(ran)人(ren)機(ji)口(kou)語(yu)對(dui)話(hua)模(mo)式(shi)是(shi)最(zui)為(wei)自(zi)然(ran)和(he)最(zui)理(li)想(xiang)人(ren)機(ji)交(jiao)互(hu)方(fang)式(shi)。比(bi)如(ru)，利(li)用(yong)中(zhong)科(ke)院(yuan)自(zi)動(dong)化(hua)所(suo)構(gou)建(jian)的(de)一(yi)個(ge)多(duo)模(mo)態(tai)自(zi)然(ran)人(ren)機(ji)交(jiao)互(hu)係(xi)統(tong)，用(yong)戶(hu)可(ke)以(yi)自(zi)由(you)地(di)和(he)兩(liang)個(ge)設(she)置(zhi)有(you)不(bu)同(tong)聊(liao)天(tian)主(zhu)題(ti)的(de)數(shu)字(zi)虛(xu)擬(ni)人(ren)交(jiao)互(hu)，對(dui)話(hua)主(zhu)題(ti)包(bao)括(kuo)咖(ka)啡(fei)、天氣、科普、娛樂等主題。這種新型的多通道融合的人機對話模式，是下一代新型人機界麵操作模式的有效探索。

　　目前，盡管多模態自然人機對話已經獲得了很大進展，但由於環境噪聲、用戶方言口音及光照變化遮擋情況下的影響，計算機對人類視聽覺信息獲取、理li解jie還hai存cun在zai一yi定ding誤wu差cha，加jia上shang目mu前qian計ji算suan機ji在zai自zi然ran語yu言yan理li解jie方fang麵mian還hai存cun在zai一yi定ding困kun難nan，這zhe使shi得de計ji算suan機ji在zai與yu人ren交jiao互hu的de時shi候hou，存cun在zai答da非fei所suo問wen的de情qing形xing。這zhe類lei現xian象xiang嚴yan重zhong影ying響xiang了le人ren機ji交jiao互hu的de體ti驗yan。其qi根gen本ben原yuan因yin在zai於yu，計ji算suan機ji雖sui然ran計ji算suan能neng力li越yue來lai越yue強qiang，然ran而er對dui人ren而er言yan很hen簡jian單dan的de推tui理li、聯想和誇張，計算機卻很困難。因此，讓計算機具有“智能”或者讓計算機具有“思維”能力，是計算機是否能與人自由交互的關鍵。

　　計算機是否會發展出意識？

　　隨著近幾年深度神經網絡學習算法在學術界和工業界的成功，很多人願意相信計算機會進化出和人一樣的意識和思維能力。2009年，歐盟(瑞士洛桑理工學院)在藍腦計劃（Blue Brain）中用微電路芯片模擬了36萬個細胞的大腦皮質，當給這些微電路芯片群“看”或者“聽”一些大自然的照片和聲音時，微電路芯片群自發地產生了伽馬振蕩波。伽馬波是大腦中一種快速的電振蕩，它可能涉及到學習過程、記憶力和注意力。這種周期為每秒25~80次的伽馬波腦電波不能就說是意識，但卻是驗證類大腦意識活動存在的重要特征。

　　藍腦計劃的確促使很多科學家和工程師們堅信計算機會“進化”出意識，一些研究機構（甚至政府）都啟動了相應的類腦計劃。

　　計算機是否會發展出意識會帶來人機交互發展的多種可能性。

　　如果計算機產生意識，並通過進化發展出機器人自己的語言、視覺以及情感等“生理”係統，則說明人類最引以為自豪的“思維”能力是可以按照一定模式被設計然後進化出來。如果機器人是被人類創造出來的，那麼人類是否也是被設計然後進化出來的？

　　在同一個星球上，如果機器人進化能力始終超不過人類進化能力，人類可以借助完全智能的計算機在深海探索、深空外星移民等領域獲得重大突破。那麼未來的人機交互技術主要在於研究：xiangwaizenmeliyongrengongzhinengjinxingtaikongtansuo，xiangneizenmeliyongweixingzhinengjiqirenjinrurentiweirenleijiankangfuwu。dangran，youyuzhinengjiqirenyouzijideqingganxitong，renjijiaohujishuyeyoukenengyanbianweiwenhuajiaoliudeshouduan，biru，renjijiaohujishukenenghuichengweilunzhengrenshifoukeyiyu“機器人”結婚之類的倫理問題的基礎。

　　如果人工智能進化超過人類，一旦機器人具有“生死”的意識，因為資源競爭，那麼一些科幻電影中的常見橋段就會成為現實：機器戰勝人類導致人類成為機器的工具。這種情況下，人機交互技術將是用於研究人類抵抗機器人的手段和武器的重要工具。

　　ruguojisuanjibunengchanshengyishi，zeshuomingmuqianrenleishangmeifaxianyuzhouzhongdeleirenzhinengdechanshengguilv。huoxurenleizhinengchanshengdeguilvbenshenchulewaizaitiaojianzhiwai，benshenjiushiyigesuijidewenti。yanzhezhegefangxiangfazhanderenjijiaohujishu，jiangshirenleiliyongjisuanjidezaigongyekongzhi、計算服務、醫療診斷、外空探索等重要工具。即便這樣，人類探索人工智能還任重而道遠。

　　究竟人機交互何去何從，我會說“我會永遠欣賞，未來你的任何模樣”。(楊明浩中科院自動化所模式識別國家重點實驗室副研究員)

人機交互的昨天、今天和明天

相關新聞

編輯精選

工控原創