http://www.kadhoai.com.cn 2026-04-09 03:12:30 來源:二十一世紀商業評論
2011年剛結束,CNN預測2012年的十大科技趨勢中,與自然用戶界麵相關的技術發展趨勢占據三席,觸屏電腦名列榜首,聲控技術和體感技術分列六、七位。人機交互的再一次變革就發生在你身邊。
你能想象身體是計算機的輸入設備嗎?
體溫、脈搏、肌(ji)肉(rou)都(dou)是(shi)向(xiang)計(ji)算(suan)機(ji)傳(chuan)遞(di)指(zhi)令(ling)的(de)信(xin)號(hao),佩(pei)戴(dai)於(yu)手(shou)臂(bi)上(shang)端(duan)的(de)傳(chuan)感(gan)器(qi)能(neng)收(shou)集(ji)肌(ji)肉(rou)信(xin)號(hao),再(zai)通(tong)過(guo)肌(ji)點(dian)信(xin)號(hao)識(shi)別(bie)器(qi)解(jie)讀(du)手(shou)勢(shi)動(dong)作(zuo),從(cong)而(er)識(shi)別(bie)手(shou)掌(zhang)和(he)手(shou)指(zhi)點(dian)擊(ji)在(zai)皮(pi)膚(fu)上(shang)的(de)信(xin)號(hao),向(xiang)計(ji)算(suan)機(ji)傳(chuan)遞(di)無(wu)線(xian)信(xin)號(hao),進(jin)而(er)控(kong)製(zhi)電(dian)腦(nao),這(zhe)就(jiu)是(shi)肌(ji)肉(rou)-計算機界麵,研究人員將它命名為“帶有生理感知的自然用戶界麵”。
這(zhe)個(ge)略(lve)顯(xian)生(sheng)疏(shu)的(de)長(chang)短(duan)語(yu)是(shi)自(zi)然(ran)用(yong)戶(hu)界(jie)麵(mian)的(de)一(yi)種(zhong)新(xin)形(xing)態(tai),雖(sui)然(ran)自(zi)然(ran)用(yong)戶(hu)界(jie)麵(mian)並(bing)不(bu)是(shi)新(xin)鮮(xian)事(shi)物(wu),但(dan)它(ta)的(de)流(liu)行(xing)足(zu)以(yi)改(gai)變(bian)你(ni)和(he)機(ji)器(qi)互(hu)動(dong)方(fang)式(shi),隨(sui)著(zhe)自(zi)然(ran)用(yong)戶(hu)界(jie)麵(mian)應(ying)用(yong)的(de)廣(guang)度(du)和(he)深(shen)度(du)的(de)擴(kuo)展(zhan),人(ren)機(ji)交(jiao)互(hu)的(de)技(ji)術(shu)革(ge)命(ming)必(bi)將(jiang)引(yin)發(fa)一(yi)場(chang)新(xin)的(de)科(ke)技(ji)產(chan)業(ye)變(bian)革(ge)。
早期的自然用戶界麵是命令行界麵和圖形用戶界麵的補充。早在1970年代起,多位美國計算機學家進行了手勢、多duo點dian觸chu摸mo係xi統tong的de實shi驗yan,而er彼bi時shi正zheng是shi命ming令ling行xing界jie麵mian和he和he圖tu形xing用yong戶hu界jie麵mian的de時shi代dai,用yong戶hu需xu要yao借jie助zhu鍵jian盤pan輸shu入ru指zhi令ling,或huo者zhe用yong鼠shu標biao點dian擊ji圖tu形xing下xia達da命ming令ling讓rang機ji器qi完wan成cheng相xiang應ying的de動dong作zuo。
而在自然用戶界麵,用戶下達的指令是日常的行為,例如,手指觸碰圖標開啟程序;與機器對話下達口頭命令,如開機、關機、跳轉窗口等;圖標隨著手指而移動……總的來說,自然用戶界麵利用手勢、機器推斷和意識情景以及豐富的3D環境讓計算變得更簡單、便捷,讓用戶的體驗變得更加直觀。
IBM的科學家曾在2007年預測,5年後,人們不再需要密碼。在沒有傳統字符密碼的環境中,生物識別變得尤為重要,如指紋識別、視網膜識別、人臉識別。
人臉識別技術的基礎技術已經得到較成熟的發展,在公安、安防領域實現了較為廣泛的應用。網易的最新研究則實現了基於互聯網的人臉識別應用,人臉的錄入、掃描、匹配工作均可通過互聯網來完成。未來,你可能像《霹靂嬌娃》中女戰士在進入密室時那樣輸入郵箱、遊戲賬戶的密碼——通過人臉或者視網膜的匹配登錄。網易稱這項技術將有望在2012年上半年投入到網易郵箱登錄上,“人臉識別技術不存在將軍令、手機密碼等傳統密碼使用中常出現的遺失、被盜的難題。”網易杭州研究院副總監汪源說,“用戶可以選擇傳統的字符和人臉兩種密碼登錄郵箱。”
相比指紋識別、視網膜識別,人臉識別技術在密碼保護領域有先天不足。雖然理論上說,配備超級計算機和超高清圖像設備後,人臉識別精準度能達到99.9%,但現實條件很可能是室內光線、普通計算機和攝像頭的組合。如果僅核對臉部圖像是否匹配,一張照片就能破解密碼了。
但(dan)人(ren)臉(lian)識(shi)別(bie)技(ji)術(shu)在(zai)其(qi)他(ta)商(shang)業(ye)領(ling)域(yu)和(he)社(she)交(jiao)媒(mei)體(ti)應(ying)用(yong)中(zhong)的(de)前(qian)景(jing)廣(guang)闊(kuo)。三(san)電(dian)株(zhu)式(shi)會(hui)社(she)和(he)岡(gang)穀(gu)株(zhu)式(shi)會(hui)社(she)研(yan)製(zhi)了(le)一(yi)款(kuan)最(zui)新(xin)自(zi)動(dong)販(fan)賣(mai)機(ji),一(yi)旦(dan)顧(gu)客(ke)靠(kao)近(jin)機(ji)器(qi),人(ren)臉(lian)識(shi)別(bie)係(xi)統(tong)將(jiang)自(zi)動(dong)分(fen)析(xi)顧(gu)客(ke)的(de)容(rong)貌(mao)來(lai)判(pan)定(ding)顧(gu)客(ke)的(de)年(nian)齡(ling),並(bing)播(bo)放(fang)適(shi)合(he)該(gai)年(nian)齡(ling)層(ceng)的(de)廣(guang)告(gao)。自(zi)動(dong)販(fan)賣(mai)機(ji)2.0版將會推向北美市場。
語音識別技術是也人機交互應用中的重要一環。人機對話的前提在於語音識別技術——語(yu)音(yin)識(shi)別(bie)和(he)語(yu)義(yi)識(shi)別(bie)。語(yu)音(yin)識(shi)別(bie)即(ji)是(shi)機(ji)器(qi)捕(bu)捉(zhuo)到(dao)用(yong)戶(hu)的(de)話(hua)語(yu),並(bing)將(jiang)其(qi)在(zai)後(hou)台(tai)轉(zhuan)化(hua)成(cheng)計(ji)算(suan)機(ji)語(yu)言(yan),而(er)語(yu)義(yi)識(shi)別(bie)則(ze)是(shi)讓(rang)計(ji)算(suan)機(ji)聽(ting)懂(dong)用(yong)戶(hu)所(suo)表(biao)達(da)的(de)含(han)義(yi)。語(yu)音(yin)識(shi)別(bie)技(ji)術(shu)中(zhong)的(de)兩(liang)個(ge)難(nan)點(dian)在(zai)於(yu)提(ti)高(gao)準(zhun)確(que)度(du)和(he)實(shi)現(xian)人(ren)工(gong)智(zhi)能(neng)。
UC優視研發出一款適用於手機的語音瀏覽器,它能減少用戶在使用手機瀏覽網頁時的輸入動作,而把語言作為指令,包括前進、語言搜索、跳轉網頁等。
但通常人們說的同一個詞語能表達多個含義。“讓機器在不同的場景下識別語義是語言識別係統的難點所在。”UC優視產品總監鄭叢威說,“這就是人工智能需要解決的問題。”在現階段,人工智能是基於對用戶的使用習慣進行統計分析的結果而達到的智能。
但如何讓瀏覽器理解用戶所說的指令是搜索相關網頁,還是跳轉到相應的網站呢?UC優視對用戶使用UCweb瀏(liu)覽(lan)器(qi)的(de)習(xi)慣(guan)進(jin)行(xing)統(tong)計(ji)分(fen)析(xi),並(bing)選(xuan)用(yong)概(gai)率(lv)最(zui)大(da)的(de)結(jie)果(guo)作(zuo)為(wei)語(yu)音(yin)瀏(liu)覽(lan)器(qi)的(de)指(zhi)令(ling)。而(er)遇(yu)到(dao)語(yu)音(yin)瀏(liu)覽(lan)器(qi)無(wu)法(fa)識(shi)別(bie)的(de)場(chang)景(jing),瀏(liu)覽(lan)器(qi)會(hui)出(chu)現(xian)多(duo)個(ge)選(xuan)項(xiang)共(gong)用(yong)戶(hu)選(xuan)擇(ze),這(zhe)時(shi)用(yong)戶(hu)還(hai)是(shi)需(xu)要(yao)手(shou)勢(shi)等(deng)其(qi)他(ta)操(cao)作(zuo)。
2007年Google為了測試、改進其語音搜索技術,發布了免費的語音搜索服務。百度在2008年效仿Google公開測試了“百度語音搜索”的電話業務,但最終沒有普及。2009年,Google便發布了中文版的語音搜索軟件,運用於諾基亞塞班操作平台,但一直沒有得到更廣泛應用。
事實上,移動互聯網的快速發展是手機領域人機交互興起的催化劑。受限於手機屏幕的尺寸,語音識別、語音搜索逐漸成為手機人機交互的新寵。在智能手機領域,UC語音瀏覽器僅是數目龐大的推廣語音識別的軟件之一,Siri的發布,掀起了人機對話的熱潮,騰訊QQ、微信等即時通訊工具都具備了語音識別功能。為了省去用戶在不到5英寸的小屏幕上打字的麻煩,韋伯斯特詞典、有道詞典都配備了語音識別功能。鄭叢威預計語音識別和語音搜索的市場前景相當廣闊,UC在2012年第一季度正式發布UC語音瀏覽器後,20%的用戶會選擇替代目前使用的版本。
除了語音、人臉識別,捕捉人們的動作是自然用戶界麵的另一個重點領域。遊戲終端設備已經在這一領域取得突破,Kinect遊戲終端實現了人臉識別、手勢、動作等綜合自然用戶界麵技術。2010年11月4日微軟發布Kinect的60天內,Kinect累計銷售800萬台,總銷量突破1000萬台,足可見其受歡迎程度。
自然用戶界麵讓人們甩掉鼠標和鍵盤玩遊戲成為可能,這無疑挑逗著玩家的好奇心。
智能遊戲終端發布後,市場普遍認為Kinectkeyishixiangengduodejiazhi。youyujiqikeyibuzhuobingfanyingyonghuzhitidongzuo,yanjiurenyuankeyicaokongjiqirenjinxingkexueyanjiu,lirudaitizijijinruweixiandeshiguxianchangjinxingcaozuo。erTop Shop莫斯科旗艦店則打起了智能試衣鏡的主意,用戶隻需要站在屏幕前,點擊對應的商品,就可以“試穿”所有的衣服、鞋子,借助這一應用,服裝電子商務能夠得到更好的展示機會。
自然用戶界麵強調用戶通過語言、手勢、動作,而不是鍵盤、鼠標操控計算機,以此來標榜“自然”。但不得不注意的是,自然用戶界麵也可能會帶來一些“不自然”的結果。
將(jiang)捕(bu)捉(zhuo)到(dao)的(de)動(dong)作(zuo)傳(chuan)遞(di)到(dao)計(ji)算(suan)機(ji),再(zai)由(you)計(ji)算(suan)機(ji)反(fan)映(ying)在(zai)屏(ping)幕(mu)上(shang)的(de)時(shi)滯(zhi)引(yin)起(qi)了(le)用(yong)戶(hu)的(de)不(bu)滿(man),智(zhi)能(neng)遊(you)戲(xi)終(zhong)端(duan)機(ji)的(de)反(fan)應(ying)速(su)度(du)和(he)鼠(shu)標(biao)的(de)反(fan)應(ying)速(su)度(du)還(hai)是(shi)有(you)一(yi)定(ding)的(de)差(cha)距(ju)。而(er)一(yi)些(xie)對(dui)力(li)道(dao)、jiaoduyaoqiuyangedeyingyongchanghezhong,liru,yuanchengyiliaoshoushu,ziranyonghujiemiansuotigongdetiyanhaiyouhendadetishengkongjian。ciwai,rengongzhinengdeyanjiuhaichuyugongsigeziweiyingdefensanjieduan,yejiushigegegongsidetongjijieguocunzaichayi,quefayigetongyiderengongzhinengbiaozhun,zhekenenghuichengweizhiyueyejiejishujingzhunhuadeyinsuzhiyi。
“自然用戶界麵在目前還處於‘點’的突破階段,要實現‘麵’上的廣泛應用尚需假以時日。”鄭叢威說。
但毋庸置疑,自然用戶界麵將會成為未來技術發展的主流。