http://www.kadhoai.com.cn 2026-04-07 14:51:08 來源:中國自動化學會專家谘詢工作委員會

給你1張4歲小女孩的照片,再讓你從電腦屏幕上看20個女孩跳舞唱歌,每個女孩隻出現3秒鍾。你能從中找出長大後畫著濃妝、戴著美瞳,甚至可能整容過的她嗎?
1月6日,江蘇衛視《最強大腦》就以“匆匆那年”為主題,上演了中國版的首次人機對決:31.02秒就可記憶一副無規則撲克牌的人類代表王峰,迎戰百度人工智能機器人“小度”。雙方先比拚人臉識別——僅憑一張童年照認出十幾年後的少女,包括一對雙胞胎;第二局,則要從30張畢業照中,即約1500個花生米大小的頭像中,根據長大後的男生照片找出兒時的他。
同“Master”橫掃人類圍棋大師一樣,人工智能再一次戰勝了人類。百度大腦如何分辨長大後的雙胞胎?它和Master哪個更厲害?它還擁有哪些神奇的功能?《經濟日報》記者就此采訪了百度大腦的技術團隊,得出迄今為止最靠譜的答案。
小度認出了長大後的雙胞胎之一,人類沒有
都說“女大十八變”,比賽中,選手王峰表示,自己主要看嘴角、耳朵的相似度。在他眼裏,長幼兩張人臉被分解成一個個相似的五官形狀,此中除了運用人類的記憶力、推理能力,還有人類的本能。
“千百萬年進化過程中,人腦進化出一個專門的區域負責人臉識別(簡稱FFA)。”百度首席科學家吳恩達被戲稱為小度的“爸爸”,他舉例說,“一個3歲的孩子看見媽媽時,不管媽媽是微笑、生氣,睜著眼、閉著眼,長頭發、短頭發,穿什麼衣服,孩子都可以輕易認出這是媽媽”。
但dan是shi,人ren腦nao為wei何he一yi瞬shun間jian就jiu能neng完wan成cheng人ren臉lian識shi別bie,至zhi今jin全quan世shi界jie的de科ke學xue家jia也ye說shuo不bu清qing背bei後hou的de原yuan理li。因yin此ci,小xiao度du對dui人ren臉lian的de識shi別bie不bu是shi模mo仿fang人ren腦nao,而er是shi更geng多duo基ji於yu數shu據ju分fen析xi和he深shen度du學xue習xi。
在人工智能“眼裏”,它看見的不是一個圖形,而是一些按數字1和0記錄的像素點。因此,機器會把人臉分為很多個小方塊來識別。根據眼睛、眉毛、鼻子等器官的特征及其相互之間的幾何位置關係,計算總結出這些點,最終構成了一張人臉。
如(ru)果(guo)要(yao)辨(bian)認(ren)這(zhe)張(zhang)人(ren)臉(lian)是(shi)誰(shui),機(ji)器(qi)還(hai)要(yao)提(ti)取(qu)麵(mian)部(bu)特(te)征(zheng)進(jin)行(xing)特(te)征(zheng)建(jian)模(mo),與(yu)需(xu)要(yao)對(dui)比(bi)的(de)人(ren)臉(lian)比(bi)較(jiao)後(hou),根(gen)據(ju)相(xiang)似(si)程(cheng)度(du),對(dui)人(ren)臉(lian)的(de)身(shen)份(fen)信(xin)息(xi)進(jin)行(xing)判(pan)斷(duan)。一(yi)旦(dan)人(ren)的(de)麵(mian)貌(mao)發(fa)生(sheng)任(ren)何(he)變(bian)化(hua),哪(na)怕(pa)隻(zhi)是(shi)輕(qing)微(wei)仰(yang)頭(tou),燈(deng)光(guang)變(bian)換(huan),機(ji)器(qi)都(dou)需(xu)要(yao)重(zhong)新(xin)計(ji)算(suan)一(yi)遍(bian)。
據百度深度學習實驗室主任林元慶介紹,“為做到盡量精確,在百度的技術中,我們會在人臉上取72個點,最後通過神經網絡計算,得到128維特征,每一維特征是人臉上的某種特點,比如獅子鼻”。
至於如何從72個點的信息裏總結出128種特征,並將每種特征與人臉的特點一一對應,這是由深度學習從海量數據裏自動學到的。換句話說,工程師並不知道這種特征究竟是“獅子鼻”,還是別的某種甚至沒有詞彙形容的特征。
計算機辨認人臉原本就非常困難,但在《最強大腦》的舞台上,又增加了時間跨度。現場嘉賓、北(bei)京(jing)大(da)學(xue)心(xin)理(li)學(xue)係(xi)教(jiao)授(shou)魏(wei)坤(kun)琳(lin)解(jie)釋(shi)說(shuo),成(cheng)長(chang)中(zhong)的(de)人(ren)臉(lian)變(bian)化(hua)極(ji)大(da),一(yi)個(ge)人(ren)一(yi)輩(bei)子(zi)連(lian)身(shen)份(fen)證(zheng)都(dou)要(yao)換(huan)好(hao)幾(ji)次(ci)。對(dui)於(yu)人(ren)類(lei)來(lai)說(shuo),可(ke)以(yi)依(yi)靠(kao)整(zheng)體(ti)神(shen)態(tai)、氣質等無法言說的因素去主觀猜測,但機器不會猜,隻能根據深度學習得來的規律計算。
據林元慶介紹,為了備戰,團隊2個月裏讓小度看了200萬個人的2億張照片,並輔以少量有時間跨度的照片。經過“訓練”,小度自己總結出了一種不為人所知的人臉隨年齡變化的規律。
在遇到蜜蜂少女隊的雙胞胎時,人類和人工智能的差別就顯示出來了:姐jie妹mei花hua長chang大da後hou外wai表biao幾ji乎hu一yi模mo一yi樣yang,連lian姐jie妹mei倆liang自zi己ji都dou分fen辨bian不bu出chu舊jiu照zhao片pian裏li的de人ren是shi誰shui,王wang峰feng用yong肉rou眼yan也ye無wu法fa辨bian別bie她ta們men的de五wu官guan特te征zheng。但dan是shi,在zai人ren工gong智zhi能neng的de計ji算suan方fang式shi下xia,雖sui然ran她ta們men的de麵mian部bu骨gu骼ge極ji其qi相xiang似si,差cha別bie特te別bie細xi微wei,總zong還hai是shi有you一yi點dian區qu別bie。最zui終zhong,小xiao度du計ji算suan出chu,其qi中zhong一yi位wei跟gen老lao照zhao片pian裏li的de小xiao姑gu娘niang有you72.98%的相似度,另一位有72.99%,差距僅為萬分之一。
百度大腦認臉和Master下棋,哪個更難?
很巧合,在百度大腦參加最強大腦比賽的幾乎同一時間,曾經橫掃國際象棋界的阿爾法狗改名Master,重出江湖,以60場連勝頂尖圍棋手的傲人成績,震驚了全世界。
這也讓不少人好奇:如果Master和百度大腦比賽,誰輸誰贏?
“很遺憾,這很可能將是一個永遠沒有答案的問題。”林元慶解釋說,因為百度大腦和Master學習的是兩種完全不同的技能:小度的強項是生活服務,比如人臉識別和語音識別,從來沒有學過下棋。Master目前似乎也隻會下棋,不會辨別人臉。
那麼,對人工智能來說,認臉和下棋,哪個更難?
從本質上說,百度大腦和Master都不是記憶和推理的高手,而是數學大師,隻不過一個算棋局的概率,一個算人臉相似的概率。
國際象棋、weiqidengqileishijisuanmeiyibuhuidailaidegailvbianhua,jisuannenglihesuanfayueqiang,yuenengzhaogudaohoumianjushidebianhua。weikunlinrenwei,renleibushanchangluojiyunsuan,yinci,zhiyoushaoshurenjingyuxiaqi,dingjiangaoshougengshifengmaolinjiao。erqie,renleinaoliyouxian,jishishinieweipingzaidianfengshiqi,yezhinengzaijubuduojisuanjigehuihe,wufakaolvmeiyibuduiquanpanzhanjudeyingxiang。
但邏輯運算是電腦的強項,它每次落子,都可以考慮對全局的影響。這也是為什麼聶衛平等圍棋大師會覺得Master不按常理下棋的原因。因為在某些時候,計算全局和計算局部的結果是不同的。
反過來,感知和運動是人類擅長的,機器卻不擅長。機器無法理解雨打芭蕉的美,爬個樓梯也很費力,特別是台階的高度、坡度、光照條件等參數無法預知時,機器人很難像人一樣流暢地爬樓梯。
“同樣,推理辨識長大後的人臉,不是簡單的信息匹配和分類問題,而是從模糊複雜的信息中抽象出規律的問題。”魏坤琳說,“基於極少非結構化的信息來學習推理,這恰恰是人腦擅長的。我們把這些要素都設計到了最強大腦舞台上的挑戰當中”。
因此,《最強大腦》科學顧問團首席顧問、北京師範大學心理學院院長劉嘉在首次媒體看片會上,曾正麵回應道,“小度從計算上的難度來講,甚至可能會超過Master”。
但魏坤琳不完全讚同。他反複強調這種難易比較隻是“可能”,“因為,人工智能對不同認知功能有自身的難易評判,我們不能用人的直覺去作這個評判。這就像蘋果和橘子,不能比”。
我們不怕汽車比人跑得快,為什麼要畏懼機器比人聰明?
這場比賽還有一個細節——麵對小度,曾經展現出超強記憶力、辨識力的人類選手都不敢應戰,場麵一度尷尬。在評委們的鼓勵下,有3位選手帶著點悲壯的感覺主動請戰,稱“即使必輸無疑,也要維護戰隊和個人尊嚴”。
選手們的畏懼折射出當下人們對人工智能的恐懼心理。最強大腦的選手在記憶力、識別能力等方麵都極其出類拔萃。他們在人類最擅長的領域,被最不擅長此項活動的機器打敗,其衝擊大於當年的AlphaGo,再次引發了“人工智能威脅論”。
“恐懼未知,這是人的正常心理。”魏坤琳覺得,新技術出現時都會造成恐慌,汽車、火車、計算機剛問世都有人害怕。他認為,大多數人其實是擔心自己被人工智能替代,“人(ren)工(gong)智(zhi)能(neng)的(de)出(chu)現(xian),可(ke)能(neng)讓(rang)很(hen)多(duo)一(yi)般(ban)智(zhi)力(li)活(huo)動(dong)甚(shen)至(zhi)專(zhuan)業(ye)人(ren)員(yuan)的(de)工(gong)作(zuo)受(shou)到(dao)威(wei)脅(xie)。但(dan)是(shi),有(you)些(xie)工(gong)作(zuo)被(bei)取(qu)代(dai)了(le),新(xin)的(de)工(gong)作(zuo)又(you)產(chan)生(sheng)了(le),人(ren)類(lei)整(zheng)體(ti)的(de)失(shi)業(ye)率(lv)不(bu)一(yi)定(ding)會(hui)上(shang)升(sheng)”。
實際上,從人類生活的質量來說,有了人工智能的輔助,大家的生活變得更“智能”了,自動駕駛、家居機器人、專業決策輔助,這都是前人無法想象的生活。
在(zai)比(bi)賽(sai)現(xian)場(chang),嘉(jia)賓(bin)就(jiu)提(ti)出(chu),小(xiao)度(du)可(ke)以(yi)幫(bang)助(zhu)父(fu)母(mu)尋(xun)找(zhao)失(shi)散(san)多(duo)年(nian)的(de)孩(hai)子(zi),幫(bang)助(zhu)公(gong)安(an)機(ji)關(guan)搜(sou)尋(xun)偶(ou)然(ran)被(bei)攝(she)像(xiang)頭(tou)拍(pai)到(dao)的(de)犯(fan)罪(zui)分(fen)子(zi)。從(cong)商(shang)業(ye)化(hua)的(de)角(jiao)度(du),百(bai)度(du)的(de)人(ren)臉(lian)識(shi)別(bie)已(yi)經(jing)在(zai)浙(zhe)江(jiang)烏(wu)鎮(zhen)景(jing)區(qu)閘(zha)機(ji)得(de)到(dao)應(ying)用(yong),可(ke)滿(man)足(zu)每(mei)年(nian)千(qian)萬(wan)人(ren)次(ci)的(de)遊(you)客(ke)使(shi)用(yong)。還(hai)有(you)一(yi)些(xie)國(guo)產(chan)手(shou)機(ji)也(ye)在(zai)接(jie)洽(qia),希(xi)望(wang)使(shi)用(yong)百(bai)度(du)的(de)人(ren)臉(lian)識(shi)別(bie)技(ji)術(shu)。
而且,人工智能還可以做很多事情。比如小度不僅會辨別人臉,對人類語音的辨別率也能達到97%;小度還可以聲情並茂地輸出語句,基本可以代替忙碌的媽媽給孩子們講故事。在智慧醫療、文物挽救、在線個性化教育等方麵,人工智能大有可為。因此,近年來,微軟、Facebook、IBM、穀歌、亞馬遜都投入巨資研發人工智能。在最近的消費電子展(CES 2017)上,各大廠商都帶來了自己的人工智能。
但(dan)是(shi),再(zai)強(qiang)的(de)人(ren)工(gong)智(zhi)能(neng)都(dou)是(shi)人(ren)類(lei)智(zhi)慧(hui)的(de)結(jie)晶(jing)。機(ji)器(qi)隻(zhi)能(neng)做(zuo)人(ren)教(jiao)給(gei)它(ta)的(de)東(dong)西(xi),也(ye)無(wu)法(fa)理(li)解(jie)人(ren)類(lei)的(de)感(gan)情(qing)。比(bi)如(ru)小(xiao)度(du)判(pan)斷(duan)出(chu)雙(shuang)胞(bao)胎(tai)的(de)存(cun)在(zai),給(gei)出(chu)了(le)兩(liang)個(ge)概(gai)率(lv)。因(yin)為(wei)兩(liang)個(ge)數(shu)字(zi)太(tai)過(guo)接(jie)近(jin),在(zai)它(ta)的(de)係(xi)統(tong)中(zhong)無(wu)法(fa)抉(jue)擇(ze),最(zui)終(zhong)還(hai)是(shi)吳(wu)恩(en)達(da)幫(bang)它(ta)挑(tiao)選(xuan)了(le)概(gai)率(lv)稍(shao)高(gao)的(de)那(na)一(yi)張(zhang)。
rengongzhinengyaoweixiedaorenlei,haiyouhenyuandejuli。yexujiuxiangwangfengshuode,renhejiqibushididuideguanxi,suiranzhecitashugeilerengongzhineng,danzheqishidaibiaorenleidekejiyoujinleyibu。
看待中國人工智能應理性自信
若 瑜
《經濟日報》,2017年1月16日
百度的人工智能機器人“小度”戰勝了擁有超強記憶力、推理能力的人類選手,跟Master戰勝人類棋手後得到的讚歎相比,它收獲的主要禮物不是點讚,而是口水。
不能否認,百度公司近年來在商業模式上的爭議連累了它。但另一種情緒更值得警惕:不少人毫無根據地認為,中國做不出這樣的人工智能技術,隻要穀歌的Master出馬,就能秒殺小度。
這(zhe)般(ban)妄(wang)自(zi)菲(fei)薄(bo),完(wan)全(quan)忽(hu)視(shi)了(le)中(zhong)國(guo)在(zai)人(ren)工(gong)智(zhi)能(neng)領(ling)域(yu)的(de)進(jin)步(bu),也(ye)傷(shang)害(hai)了(le)那(na)些(xie)默(mo)默(mo)付(fu)出(chu)的(de)從(cong)業(ye)人(ren)員(yuan)。在(zai)此(ci)必(bi)須(xu)鄭(zheng)重(zhong)聲(sheng)明(ming),中(zhong)國(guo)的(de)人(ren)工(gong)智(zhi)能(neng)真(zhen)的(de)很(hen)強(qiang)!
早在去年9月,美國《財富》雜誌就發表文章,將百度與穀歌、微軟、Facebook並列為全球四大AI巨頭,介紹了他們在人工智能領域的布局以及深度學習技術的進展。
比如,在人臉識別技術兩個最為權威的國際評測FDDB與LFW中,“小度”背後的百度大腦都獲得了第一名的佳績,並在LFW中得到99.77%的準確率。此外,百度的語音識別、無人車、百度翻譯等技術也相當先進。
在語音識別方麵,我國還有另一家世界頂尖企業——科大訊飛。他們的語音識別已經連續11年蟬聯全球語音合成大賽的第一名。特別是2016nian,zaizhongduoguojidingjianyanjiujigouhechanyejiequanbucanjiadeqiantixia,kedaxunfeibujinnaxiaquanqiudiyi,haishiquanqiuweiyibayingyuhechengzuodaolechaoguoputongrenshuohuashuipingdejishu。
科大訊飛的機器翻譯也取得了突破性進展。2014年,他們首次參加國際口語機器翻譯評測比賽(iwslt),即在漢英和英漢兩個翻譯方向中以顯著優勢獲得第一。而此前的10屆比賽,漢翻英都是日本研究機構全球第一,英譯漢都是美國機構全球第一。訊飛終結了這一曆史,並在2015年、2016年連續保持全球第一。
近年來,麵對國家“一帶一路”的重大戰略,訊飛又推出了麵向“一帶一路”的多語種翻譯,可以做到漢語、英語、維語、藏語、日語和韓語等10多個語種的同步翻譯。
此外,阿裏巴巴、騰teng訊xun也ye有you人ren工gong智zhi能neng平ping台tai。毫hao不bu誇kua張zhang地di說shuo,在zai這zhe一yi波bo人ren工gong智zhi能neng浪lang潮chao中zhong,中zhong國guo首shou次ci跟gen世shi界jie巨ju頭tou站zhan在zai了le同tong一yi起qi跑pao線xian,在zai某mou些xie領ling域yu甚shen至zhi處chu於yu領ling先xian位wei置zhi。
同時,百度、阿裏、騰訊等國內企業發展多年,在國人大數據方麵的積累,是海外企業無法比擬的。而大數據就是人工智能成長的“糧食”,沒有海量數據,再好的算法也無用武之地。
無論從技術實力還是數據儲備上看,中國在人工智能領域都已經處於全球第一梯隊。去年,美國人工智能企業Spare5的CEO在zai給gei當dang選xuan總zong統tong特te朗lang普pu的de信xin中zhong就jiu強qiang調tiao,人ren工gong智zhi能neng是shi一yi場chang競jing賽sai,中zhong國guo已yi加jia入ru到dao這zhe場chang角jiao逐zhu當dang中zhong,其qi人ren工gong智zhi能neng技ji術shu以yi及ji商shang業ye化hua產chan品pin落luo地di愈yu發fa成cheng熟shu,以yi此ci提ti醒xing特te朗lang普pu要yao加jia大da對dui人ren工gong智zhi能neng領ling域yu的de重zhong視shi和he投tou入ru。
看看,部分人還在質疑中國人工智能究竟有多少幹貨的時候,世界已經把中國放在了聚光燈下,仔細掂量著這個最具分量的對手。
當然,當前中國的人工智能距離完美還有漫漫長路,在技術突破、政策環境、平台支撐、人才培養上還有大量工作要做。
2016年5月,我國出台了《“互聯網+”人工智能三年行動實施方案》,提出了加快建設文獻、語音、圖像、視頻、地(di)圖(tu)等(deng)多(duo)種(zhong)類(lei)數(shu)據(ju)的(de)海(hai)量(liang)訓(xun)練(lian)資(zi)源(yuan)庫(ku)和(he)基(ji)礎(chu)資(zi)源(yuan)服(fu)務(wu)公(gong)共(gong)平(ping)台(tai),建(jian)設(she)支(zhi)撐(cheng)超(chao)大(da)規(gui)模(mo)深(shen)度(du)學(xue)習(xi)的(de)新(xin)型(xing)計(ji)算(suan)集(ji)群(qun),建(jian)立(li)完(wan)善(shan)產(chan)業(ye)公(gong)共(gong)服(fu)務(wu)平(ping)台(tai)等(deng)具(ju)體(ti)措(cuo)施(shi)。2016年12月出台的《“十三五”國家戰略性新興產業發展規劃》,也提出加快人工智能支撐體係建設,推動人工智能技術在各領域應用。
可以預計,未來5到10年nian是shi全quan球qiu新xin一yi輪lun科ke技ji革ge命ming和he產chan業ye變bian革ge從cong蓄xu勢shi待dai發fa到dao群qun體ti迸beng發fa的de關guan鍵jian時shi期qi,人ren工gong智zhi能neng將jiang是shi其qi中zhong改gai變bian人ren類lei生sheng活huo方fang式shi的de重zhong要yao力li量liang。希xi望wang國guo人ren對dui中zhong國guo的de人ren工gong智zhi能neng多duo一yi點dian理li性xing,多duo一yi點dian自zi信xin,多duo一yi點dian支zhi持chi,讓rang科ke技ji更geng好hao地di服fu務wu生sheng活huo。