压在透明的玻璃上c-国产精品国产一级A片精品免费-国产精品视频网-成人黄网站18秘 免费看|www.tcsft.com

驗(yàn)證碼的未來:扒一扒reCAPTCHA的那些事

reCAPTCHA的誕生及意義

CMU(卡耐基梅隆大學(xué))設(shè)計了一個名叫reCAPTCHA的強(qiáng)大系統(tǒng),讓電腦去向人類求助。具體做法是:將OCR(光學(xué)自動識別)軟件無法識別的文字掃描圖傳給世界各大網(wǎng)站,用以替換原來的驗(yàn)證碼圖片;那些網(wǎng)站的用戶在正確識別出這些文字之后,其答案便會被傳回CMU。

reCAPTCHA是利用CAPTCHA的原理(CAPTCHA的中文全稱是全自動區(qū)分計算機(jī)和人類的圖靈測試),借助于人類大腦對難以識別的字符的辨別能力,進(jìn)行對古舊書籍中難以被OCR識別的字符進(jìn)行辨別的技術(shù)。也就是說,reCAPTCHA不僅可以反spam(垃圾郵件),而且同時還可以幫助進(jìn)行古籍的數(shù)字化工作(可以稱為人工OCR)。

每次reCAPTCHA會顯示兩個單詞讓人來識別,其中一個是需要用戶識別的難認(rèn)詞,另外一個是答案已知的真正的CAPTCHA 詞。軟件將能夠正確識別CAPTCHA詞的用戶看作是人類,當(dāng)CAPTCHA 詞被正確識別出來后,程序會紀(jì)錄用戶對無法閱讀的詞的回答并將其添加到它的數(shù)據(jù)庫中。這樣就完成了一次人工的OCR識別。過程如圖1.

20150312044212864

為了改善軟件的精確性, reCAPTCHA 會將最困難的詞發(fā)送給多個用戶并挑選其中有相同答案的作為正確的答案。據(jù)說準(zhǔn)確率能夠達(dá)到99%。用戶每使用一次這個程序,實(shí)際上就是在幫助數(shù)字重現(xiàn)1908年《紐約時報》上的某一頁,或者其它古書中的一頁,這對考古學(xué)具有重大的意義。

下面是一個在使用reCAPTCHA進(jìn)行注冊驗(yàn)證的網(wǎng)站實(shí)例(圖2):

20150312044152331

reCAPTCHA被Google收購

reCAPTCHA在 2009 年被 Google 收購。之后國外陸續(xù)有一些網(wǎng)站的 reCAPTCHA 的驗(yàn)證碼內(nèi)容發(fā)生了變化,所顯示的不再僅僅是古籍文字,而是還有照片——照片的一側(cè)顯示的是大家熟悉的扭曲的文字,另一側(cè)則是模糊的數(shù)字,這些數(shù)字無疑就是街道地址,Google 的一位發(fā)言人介紹說,該系統(tǒng)并不局限于街道地址,街道名稱甚至交通標(biāo)志也會被包含進(jìn)去。圖例如圖3.

20150312044133876

Google 讓reCAPTCHA 里顯示 Google 街景的圖片。這樣經(jīng)常會從街景里提取如街道名稱和交通標(biāo)志等數(shù)據(jù),向 Google 地圖里添加商鋪地址和位置等有用信息。

新版reCAPTCHA–noCAPTCHA

Google在2014.12.03發(fā)表了一篇文章《Are you a robot?Introducing “No CAPTCHA reCAPTCHA”》

文章開始講述傳統(tǒng)驗(yàn)證碼的方式令“真正人類”頭疼,且研究表明現(xiàn)在的人工智能技術(shù)已經(jīng)能夠解決99.8%的驗(yàn)證碼,因此扭曲的文本驗(yàn)證方式可能不是一個可靠的方法。

新的reCAPTCHA被Google稱作沒有驗(yàn)證碼的驗(yàn)證碼(”No CAPTCHA reCAPTCHA”),他讓用戶只需要簡單的勾選就可以確認(rèn)你是真實(shí)用戶而非惡意機(jī)器人,操作非常簡單。

noCAPTCHA只提供了一個復(fù)選框,里面寫著“我不是機(jī)器人”。當(dāng)你打鉤之后,谷歌就能利用“風(fēng)險分析引擎”進(jìn)行一系列無縫檢查,以此來判斷你是否是真人。

20150312044111691

如果noCAPTCHA認(rèn)為你是真人,那就不用再做什么了,這確實(shí)很容易。如果noCAPTCHA認(rèn)為你不是真人,它就會要求你填一個傳統(tǒng)的CAPTCHA字符串或更先進(jìn)的字符串,比如從一組圖片中挑選出正確的圖片。

20150312044025994 20150312044040952 20150312044052242

noCAPTCHA的產(chǎn)品經(jīng)理薛特(Vinay Shet)探討了改良版服務(wù)背后的技術(shù),他說復(fù)選框聽起來雖然很簡單,但是背后確實(shí)很復(fù)雜。新的風(fēng)險分析引擎在用戶點(diǎn)擊復(fù)選框之前、之中和之后都會關(guān)注用戶參與度來決定你是否是真人。

薛特說,風(fēng)險分析引擎使用了機(jī)器學(xué)習(xí)技術(shù),這種技術(shù)使用了很多的策略,知道普通用戶看起來是什么樣的,這樣下次就知道該檢查些什么了。

現(xiàn)在還不是所有人都能使用新版noCAPTCHA,只有一小部分用戶能夠使用它,想使用新版noCAPTCHA的大部分體驗(yàn)的開發(fā)者要想把它使用到他們的產(chǎn)品中必須使用新的API。目前,Snapchat、WordPress和Humble Bundle和cloud9等也正在測試新系統(tǒng)noCAPTCHA。

下面是cloud9注冊時使用noCAPTCHA的截圖:

20150312043943273 20150312044005342

總結(jié)

reCAPTCHA不僅是一種驗(yàn)證碼服務(wù),同時也是一項(xiàng)具有重要意義的文化工程。被Google收購之后,reCAPTCHA內(nèi)容也更加豐富?,F(xiàn)在的noCAPTCHA似乎要將人類從“萬惡的驗(yàn)證碼”時代解放,更加注重用戶體驗(yàn),讓真正的人類使用更加方便,讓機(jī)器注冊更加困難。

文章來源:FreeBuf黑客與極客(FreeBuf.COM)

 

上一篇:小漏洞大影響:來看看希爾頓酒店官網(wǎng)的CSRF漏洞

下一篇:谷歌正為Gmail開發(fā)PGP端到端加密技術(shù)