鄭方:謝謝主持人,也感謝主辦方邀請我。今天的主題是安全,尤其是智慧安全,剛才幾位專家已經(jīng)從多角度介紹了安全方面的問題。我想智慧要體現(xiàn)人工智能,語音是人工智能的一個主要研究方向之一,所以今天我就想在語音這個角度來看看安全有一些什么問題值得關(guān)注,有一些什么樣的應(yīng)用可以去從事,所以我的題目是在無線互聯(lián)環(huán)境下訪問控制安全的最佳解決方案,訪問控制像邵先生也介紹了,安全認(rèn)證方面身份認(rèn)證是重要的一個方面之一。
今天我的介紹分為這么幾個方面,第一是介紹現(xiàn)在的狀況,第二是安全所面臨的挑戰(zhàn),之后給大家介紹一下解決方案,最后介紹一下聲紋識別應(yīng)用的領(lǐng)域,最后我介紹一下得意音通的研發(fā)思考研究以及新的問題。
今天這個時代應(yīng)該說有兩大特點帶給了大家非常顯著的特色,第一是無線,你可以說在任何地方都可以有無線網(wǎng),WiFi或者是4G,第二是智能終端,我們的手機(jī)隨處都是,我們的穿戴式設(shè)備都很多,這兩個就帶來了很多新的機(jī)遇,當(dāng)然也會帶來新的問題。我們看看涉及在演變過程中有什么樣的過程,我們最早的手機(jī)是用來通話的,后來我們發(fā)現(xiàn)它可以作為個人助理,再發(fā)展是作為掌上電腦,功能更全了.
現(xiàn)在的手機(jī)是什么呢?現(xiàn)在的手機(jī)已經(jīng)是你的一個器官了,一個不可分割的器官,每個人不無時無刻拿著手機(jī),丟不下、忘不掉。這是它變化的過程
我們看看手機(jī)用戶的情況,可以看出手機(jī)用戶現(xiàn)在已經(jīng)達(dá)到了很大的規(guī)模,我們只看智能手機(jī)的用戶,2015年第二季度已經(jīng)達(dá)到了6億,這個量是非常可觀的。如果說加上各種手機(jī)都在一起的話,這已經(jīng)是12已接近13億的規(guī)模了,是非常大的一個量。
我們用這個來做什么?我覺得有三個方面,比如說上網(wǎng)瀏覽網(wǎng)頁。第一個是入口,比如說移動設(shè)備和數(shù)據(jù)中心,往往是通過手機(jī)跟數(shù)據(jù)中心聯(lián)絡(luò),跟銀行聯(lián)絡(luò),從而實現(xiàn)一些交易。第二是它也是一個個人的數(shù)據(jù)中心,你的通訊錄、照片和所謂的隱私數(shù)據(jù)都在手機(jī)里,電腦里不一定有手機(jī)全。尤其是現(xiàn)在再加上一些云,可以把你的數(shù)據(jù)同步到云上面。所以你的手機(jī)更是這樣的,這是它的一些主要的功能。
我們就是要將手機(jī)這個應(yīng)用里,最典型的以這個為例子來說一下為什么訪問安全很重要,也就是支付。最近手機(jī)支付是非常火的,為什么呢?
因為它很方便,我們看一下銀聯(lián)在15年做的移動支付安全的調(diào)查,有手機(jī)支付、網(wǎng)銀支付、快捷支付、賬戶余額支付等。這都是跟移動相關(guān)的,我們看手機(jī)支付占了82%的用戶的喜歡的比例。非常高,第二名不到40%。當(dāng)然其實他們還有一個調(diào)查,有時候用戶不敢用,為什么不敢用呢?大概有60%、70%的人覺得不安全,所以不敢用,當(dāng)然看的例子也多了。
看數(shù)據(jù)來說話,用手機(jī)用戶的總體的狀況這里面有三個,一個是網(wǎng)上支付,一個是電話支付,一個是移動支付,這三個方面,移動支付具有非常快速的增長的速度。它是379.06%的增長速度,一年翻了一翻還要多。2014年相對于2013年只有134%,當(dāng)然也是最高的,所以總的來說它增長的速度是非常快的。但我們說都是方便,最大的特點就是方便,這個世界上沒有免費(fèi)的午餐,它就會帶來一些問題,我稱之為方便性帶來的安全問題或者說安全隱患,很多利用網(wǎng)絡(luò)的釣魚、移動互聯(lián)網(wǎng)的惡意程序等等,就可以攻入到各種計算機(jī)里面,包括了移動設(shè)備里,所以這是一個非常嚴(yán)重的問題。
這是一個統(tǒng)計的報告,360的安全統(tǒng)計,2012年新增手機(jī)惡意軟件是17萬多款,同比增長是接近2000%,年增長率是用倍而不是說一個小的比例來的,所以很可觀。2013年手機(jī)支付的病毒開始集中出現(xiàn),這個未來的延展性是很大的,我們能知道它現(xiàn)在就是非常快的,所以手機(jī)支付、網(wǎng)購都是黑客進(jìn)攻的重點,都涉及到錢,有錢就會無利不起早。
手機(jī)是否安全?手機(jī)并不安全如果大家關(guān)注3·15晚會你們會看到中間做了一些實驗,你只要在一個公共場合把手機(jī)連上一個沒有密碼的WiFi信息就沒有了,很短的時間就被竊取了,一兩秒的窗口就可以獲得所有人的,所以這是一個非常可怕的現(xiàn)象,但我們很多人其實沒有這個意識,我們都圖方便。
這是我大概找了一下網(wǎng)上講的安全漏洞導(dǎo)致的案件,大家可以看有很多。這個安全問題究竟是什么問題呢?這個問題是身份認(rèn)證的的問題,我稱之為網(wǎng)絡(luò)安全里面的最后一厘米,為什么叫最后一厘米呢?我們的存儲安全、計算安全和防火墻等的傳輸都做得非常不錯。但是,等到最后人和網(wǎng)絡(luò)交互的時候,靠的是在無線互聯(lián)的情況下手機(jī)和人這個地方不是一致的,所謂的人機(jī)不一致的問題就出現(xiàn)了。
我可以拿著你手機(jī),我只要能拿到你的手機(jī),所有都可以解決,密碼可以召回,動態(tài)碼都沒有用。這個一致性的問題我稱之為最后的一厘米,它很關(guān)鍵,而這最后一厘米其實就是遠(yuǎn)程的身份認(rèn)證,它是一個關(guān)鍵,沒有它很多問題都是不是解決的。
什么來解決這個問題?我認(rèn)為生物特征識別是最好的解決方案。我們看看身份認(rèn)證經(jīng)歷過幾個發(fā)展的過程,總的來說是三個階段,第一個是最簡單的密碼口令,你知道什么,天王蓋地虎、寶塔震河妖,這個你知道不好解決。第二,鑰匙、U盾、IC卡是通過已有的東西相對比口令要高一點安全級,可是容易丟,別人也可以把它拿走。這些都不是很好的,利用人工智能來解決問題的最佳解決方案是什么?就是你是誰用自己來證明,我的身份干嗎需要別人來證明呢?上帝創(chuàng)造一個人就是唯一的。沒有任何兩個人是相同的,這是一個最好的解決途徑。
當(dāng)然可以看到,它的安全級別三個階段是不斷地增高可是實現(xiàn)的難度也是在不斷增高的。有科學(xué)家對這個問題也做了預(yù)測,美國預(yù)測未來110年科技發(fā)展的基本的情況,第七條說口令和密碼已經(jīng)就不存在了,取代的是視網(wǎng)膜掃描、心跳和聲音識別的技術(shù),IBM說5年就能實現(xiàn)了,不用等那么久,是不是呢?大家可以想像,2012年加5年是2017年有沒有實現(xiàn)呢?又提到了視網(wǎng)膜、心跳和聲音這三種不同的識別方式,科學(xué)家為什么用了這三條?
什么叫生物特征,我們客觀地分成兩類,一類是指紋、人臉、虹膜、指靜脈、掌紋包括DNA,我們稱之為心理特征。它是相對來講不變的,人的生下來基本就不變。
第二是行為特征,比如說步態(tài)、走路、簽名、擊鍵行為也不一樣,這些特征大家都了解比較多,其實科學(xué)家也做了一些比較,他們通過易用性、接受程度、處理速度、成本等各個不同的領(lǐng)域都做了一些比較,發(fā)現(xiàn)他們其實有很多的地方有一些特點,各有優(yōu)勢。
這是2008年美國的一組科學(xué)家做的比較,可以看到這是一個DET曲線,你不需要了解太多,你只需要這個曲線靠近原點越近這個系統(tǒng)越好就行了,因為這代表的是錯誤率。這里面有人臉、指紋、手、虹膜、掌靜脈、指靜脈還有聲音等等,指靜脈是最好的。紫的那條線是聲紋,次之。
科學(xué)家做了一個127頁的技術(shù)報告,通過嚴(yán)格的理論的推導(dǎo)和證明,最后是給出了這個數(shù)據(jù),可以說是顛覆了平常的一些想法,我們平時覺得最好的是指紋,當(dāng)然DNA里面沒有列,應(yīng)該是差不多接近0點的地方。
我們看看他講的有沒有道理,其實有道理,因為有些特征存在被攻擊的問題,生物特征本來是為了解決安全的問題,結(jié)果自身出現(xiàn)了安全問題,這就是很可怕的事。尤其用戶比較害怕的是我的指紋、我的人臉被系統(tǒng)放在一個數(shù)據(jù)中心,別人黑客攻了之后可以用數(shù)據(jù)干任何事情,這是非常可怕的。
這里面出現(xiàn)了虹膜,2015年就出現(xiàn)了,指紋這個就更多了,當(dāng)時河南考生代考事件就是用指模代考。人臉?biāo)固垢4髮W(xué)的一個研究小組做的Face2Face可以模擬出來,我只要有小布什左下角的圖片,上面的人模仿,機(jī)器讓我搖腦袋,合成了以后右上角就搖了,你讓我張嘴便模擬出來就可以長了,就可以進(jìn)入這個系統(tǒng),這是非常可怕的。
但我想要報告給大家的是,語音唯一一個有最多優(yōu)勢的特征,為什么?
今天我給大家匯報一下,語音型號是一個形簡豐的語音信號,它就是一個一維信號,可是含有的信息非常多。比如說說的語言的種類,你的口音、你說的內(nèi)容,說話人的性別,你的情感還有說話人的身份,當(dāng)然還有在這個會場或者是在地鐵或者是高鐵等很多信息都在里面。
這么多信息在里面,如果把信息綜合在一起就可以發(fā)現(xiàn),有助于進(jìn)行精準(zhǔn)的身份認(rèn)證,可以把語音結(jié)合起來,防止錄音,可以把情感識別和身份識別結(jié)合起來防止被要挾。
我昨天剛看了一個新聞,人用刀逼著人輸入密碼,但如果用聲紋可以檢測你是否恐懼,是的話可以給中心一個信號,而且第二個好處是由于形簡意豐可以做出語音平臺,給張三轉(zhuǎn)1000塊錢可以識別出是業(yè)務(wù),可以說是轉(zhuǎn)1000塊錢,意圖可以知道我是自愿的,可以完成身份,最后所有都做完了完成銀行的轉(zhuǎn)賬,其他任何一種特征是什么樣的方式呢?
下拉菜單把轉(zhuǎn)賬的金額放進(jìn)去,認(rèn)證你的身份一系列的東西,到最后發(fā)現(xiàn)時間過得很長了。基于語音的特點我們提供一個解決方案,把現(xiàn)在的動態(tài)碼技術(shù)和語音結(jié)合起來,當(dāng)你需要身份認(rèn)證的時候我會發(fā)一個碼隨機(jī)的,防止你錄音,有了碼之后說出來,如果都對這個就過了,如果有一個不對就不讓你過了,如果把聲音錄起來,這是不可能的。這個獲得了2013年語音創(chuàng)新新產(chǎn)品的稱號,這是語音聯(lián)盟的。
它有一些什么特點?第一是便宜,所有的手機(jī)都有麥克風(fēng),傳輸也便宜,因為只需要傳音頻不需要傳視頻。第二,錄音人家不反感,如果人臉識別會覺得語音送走了,說數(shù)字什么數(shù)字都可以,我不用說家庭住址,快速、邊界、安全,業(yè)績隨機(jī)性可以做到安全,當(dāng)然現(xiàn)在可以防止錄音攻擊,把數(shù)字都弄下來之后切。
切完了之后拼,如果有錄音的痕跡也可以檢測出來,另外是做到業(yè)務(wù)相關(guān),統(tǒng)一語音平臺,就是一句話解決所有問題。可以看到用這樣的一個方案它的優(yōu)點是非常多的,有的時候單一的手段不安全,這也是一些銀行客戶提出來的,說也有可能有馬失前蹄”的問題出現(xiàn)。
我們可以提供多種生物特征結(jié)合,也就是說跟人臉結(jié)合,加上唇語,我們說要把你的內(nèi)容跟口型的唇語都對上去,加上語音識別的內(nèi)容對上去,所以雙勝利特征、雙防偽來認(rèn)證,這樣就更好了。
我們覺得運(yùn)用這個可以很好地提供身份認(rèn)證的解決方案。基于這樣一種思考,我們清華大學(xué)還有得意音通做了產(chǎn)品。核心有動態(tài)碼的專利、技術(shù)、需要、快速算法,在它周圍我們添加了一些功能性的,比如說錄音重放的檢測,自學(xué)習(xí)人的聲音和人臉,然后結(jié)合場景業(yè)務(wù)相關(guān)的應(yīng)用,統(tǒng)一的語音平臺結(jié)合情感進(jìn)行真實意圖的檢測,指紋與聲紋結(jié)合,聲指融合,指紋與人臉結(jié)合,我們都完成的相關(guān)的技術(shù)的開發(fā),并在實際中得到了應(yīng)用。
我給大家簡單匯報聲紋識別可以在哪些地方有用可以想像,有人的地方就會有應(yīng)用,現(xiàn)在發(fā)現(xiàn)任何人、任何時間、任何地點,真是這樣,因為移動互聯(lián)網(wǎng)的存在和智能終端的存在,隨時隨地用APP打開都可以應(yīng)用。
第一個應(yīng)用是金融系統(tǒng),跟錢相關(guān)的,,九幾年就已經(jīng)有了,國內(nèi)也是有,我們零幾年已經(jīng)有了這樣的系統(tǒng),這是建設(shè)銀行做的。原來在電話銀行,自從14年4G拍照發(fā)放了以后,無線互聯(lián)的普遍之后,手機(jī)銀行也在增長,工行和建行都是接近兩個億的手機(jī)銀行用戶數(shù)。今年6月份、9月份建設(shè)銀行的手機(jī)用戶已經(jīng)突破了2億,達(dá)到了這么大的規(guī)模,所以應(yīng)用的空間非常大。
第二,社保的生存認(rèn)證,吃空餉的非常多。車聯(lián)網(wǎng)也是一個很大的趨勢,但我在網(wǎng)上可以控制別的地方的汽車,異地的控制,所以非常可怕。汽車的保有量有很多的應(yīng)用空間,這是列了一些,實際上還有更多的應(yīng)用。
最后,簡單地介紹一下得意音通,我們是清華入股的公司,也和清華大學(xué)建立了聯(lián)合實驗室,我們在進(jìn)行產(chǎn)學(xué)研結(jié)合的時候構(gòu)建了立體的架構(gòu),這是合作產(chǎn)學(xué)研的架構(gòu),既有入股也有聯(lián)合實驗室,產(chǎn)品經(jīng)過長時間大規(guī)模的應(yīng)用,建行在手機(jī)銀行用這樣一個手機(jī)系統(tǒng)的時候花了一年半的時間做應(yīng)用,最后發(fā)現(xiàn)是可行的。
我給大家報告一個數(shù)據(jù),非常讓我感到鼓舞的,我作為生存識別和語音識別方面接近30年的時間,覺得沒有白做,我們大概用了一個月的時間,一個月的增長相當(dāng)于一年的增長。建行已經(jīng)放開了使用,大家可以體驗一下。
我們和銀聯(lián)做了生物特征的實驗平臺,也有很多合作的銀行,我們國家信息中心這個解決就是電子政務(wù)里進(jìn)行遠(yuǎn)程的簽審。和中國移動做的移動指紋、聲紋的平臺,公安領(lǐng)域也做了很多,有很多的專利,但在標(biāo)準(zhǔn)方面我們做了很多的工作。
中國的第一個標(biāo)準(zhǔn)是由我們來負(fù)責(zé)起草的,在2008年發(fā)布,公安部的標(biāo)準(zhǔn)我們參與了很多。金融領(lǐng)域的標(biāo)準(zhǔn)正在制定,為什么美國科學(xué)家做預(yù)測的時候提到了三種特征,第一是講到了聲紋的優(yōu)勢和特點,所以在央行制定標(biāo)準(zhǔn)的時候,唯一的生物特征的標(biāo)準(zhǔn)是聲紋。
當(dāng)然現(xiàn)在國家正在考慮做一些聲紋庫的建設(shè)工作,這是14項聲紋相關(guān)的標(biāo)準(zhǔn),尤其是中間要建庫,以后每個人從有身份證的時候就要留起來。當(dāng)然信標(biāo)委和智能設(shè)備的標(biāo)準(zhǔn)都在做。從研究應(yīng)用標(biāo)準(zhǔn)化等各個方面都打開了局面,所以我認(rèn)為生物特征識別應(yīng)用的時代已經(jīng)到來。
謝謝各位!