推廣 熱搜: 集成  系統集成  弱電  軟件  kvm  服務器  思科  視頻會議  拼接  SFP 

驗證碼ocr 技術介紹

   日期:2015-12-28     瀏覽:41    評論:0    
核心提示:你把日期、起始站、乘客等資料填好,把12306賬號、密碼給我;在我發你的淘寶店拍下加價的錢,刷到票后,把賬號密碼給你。在QQ群中搜索火車票,會出現上百個結果,

“你把日期、起始站、乘客等資料填好,把12306賬號、密碼給我;在我發你的淘寶店拍下加價的錢,刷到票后,把賬號密碼給你。”在QQ群中搜索“火車票”,會出現上百個結果,《國際金融報》記者隨機選擇添加了一位名為“春節火車票”的黃牛。

  這位黃牛自詡,“自家刷票成功率是百分之百”,但是反復提醒,“不能指定車次。”

  “往年都能指定車次,為何今年不行?”記者追問。

  “12306改版有很多限制,票沒有以往好刷。”黃牛坦言,“圖形驗證碼難,對我們來說也難。”

  圖形驗證碼,不僅令黃牛犯難,也讓部分購票者犯難,“樣式繁多、圖片模糊、單選變多選。”其實,圖形驗證碼軟件設計師也難,“太簡單了,防搶票軟件效果差;太難了,普通購票者用戶體驗差。”

  關于春運火車票,多方正遭遇驗證碼難度之惑。

  購票者之惑:

  驗證碼咋這么難

  因樣式繁多、圖片模糊、單選變多選等原因,12月7日到12月8日,12306驗證碼的搜索指數猛增7倍

  一票難求,是春運常態。為抵制黃牛,鐵路部門今年蠻拼:手機雙向核驗,還有圖形驗證碼。

  “自11月26日發售春運第一天車票起,截至12月9日(預售臘月二十八日火車票),鐵路部門共發售車票1.3億張,同比增長9%,近九成通過網絡訂票成功。”

  12306購票系統的后臺監控大廳顯示屏上,即時顯示著鐵路總公司和中國鐵道科學研究院兩個生產中心的實時運行數據。這些數據包括網站、手機APP的實時登錄人數,購票支付情況、車站取票情況等,“其中,12306網站共發售車票7813萬張,同比增加1532萬張,占售票總量比例由去年同期的54.6%上升至60.1%。除網購車票渠道比例上升外,手機APP發售車票14天共銷售3536萬張,占售票總量比例由去年同期的13.5%上升至27.2%。”

  不過,部分購票網友表示,驗證碼清晰度不高,導致放票時間連續選錯,從而錯過了購票。

  “樣式繁多、圖片模糊、單選變多選……”新版圖形驗證碼因網友吐槽毫無預兆的火了。360搜索指數趨勢圖顯示,從12月7日到12月8日,12306驗證碼的搜索指數猛增7倍。

  春運火車票開售,12306購票系統的圖形驗證碼成了“吐槽對象”,“12306的驗證碼已經擊敗了全國99%的購票者,我已經找不到回家的路了!”、“驗證碼都跟醫生寫病歷似的,你是瘋兒我是傻,纏纏綿綿看不清!”

  國家信息中心專家委員會主任、研究員寧家駿認為,12306的圖形驗證碼的初衷是好的,但對給用戶造成的困難事先估計不足。

  一位門戶網站的程序員告訴《國際金融報》記者,驗證碼的目的就是為了證明,購票者是人,不是機器,不是一個程序。所以從這個角度來說,提高機器識別的難度是有必要的,但是降低用戶在輸入驗證碼時候的成功率,確實不利于用戶體驗的提升。

  開發者之惑:

  防黃牛與好用怎么平衡

  互聯網的驗證碼正變得越來越難以識別,如何做到既防了黃牛,又讓購票者有較佳的用戶體驗,是驗證碼開發者的難題

  驗證碼,是“全自動區分計算機和人類的圖靈測試”的簡稱。圖靈測試是通過計算機回答人類提出的一系列問題來鑒別對方是人還是機器,而驗證碼則是一場機器向人提問的“反圖靈測試”。

  隨著計算機技術的進步,驗證碼被設計得越來越難,主要的驗證方式有文字、圖片、語音,移動互聯網App方面還有手勢密碼驗證及信令交互認證方式等,諸如支付寶錢包和QQ都推出了手勢密碼。

  西安電子科技大學副教授高海昌告訴記者,目前,驗證碼主要包括文本驗證碼、語音驗證碼、圖形驗證碼,應用最為廣泛是的文本驗證碼,而安全性最高的則是圖形驗證碼。目前有些用戶數量級不大的網站已不使用文本或圖片驗證碼,而是用短信驗證,這也是一種很好的替代方式。

  驗證碼有用嗎?

  “當然是有用。”上述程序員很肯定的告訴記者,“沒有驗證碼,任何一個有大學本科計算機基礎的學生都能盜號。在防止機器暴力行為方面,驗證碼功不可沒。”

  驗證碼的圖案、文字或數字,大多扭曲變形。之所以這么設計,是為了避免被光學字元識別之類的計算機程序自動辨識,“驗證碼要的就是復雜性與無序性,還要有高濃度的噪音背景,對比度、可識別度都不能太高,因為機器比你聰明多了,你能輕易看清的,機器早就識別出來了。”

  斯坦福大學的一項研究發現,近兩年來,互聯網的驗證碼正變得越來越難以識別,并且每個網站平均有1/5的人,因為復雜的驗證碼而離開網站。

  北京郵電大學網絡技術研究院教授馬嚴認為,雖然有些驗證碼難度較大,但對于防控搶票軟件有一定效果。

  最常見的驗證碼是字母和數字組成的四位驗證碼,這類驗證碼,搶票軟件和瀏覽器采用非正常手段是可以自動識別。“字母和數字組成的四位驗證碼,在人眼識別需要2秒的情況下,機器僅用0.1秒就能識別。在高峰時段,相隔這樣的時間,也會造成旅客買不到票。”朱建生表示,“為了防范搶票軟件的自動識別,我們對圖片做出微調、旋轉、切割的處理,這樣做主要是為了方便旅客購票和打擊搶票軟件中尋找平衡。”

  獵豹瀏覽器移動工程師李鐵軍告訴記者,目前有一些刷票軟件每秒鐘數次提交刷新頁面或購票等請求,會給12306網站帶來沉重的流量壓力,尤其是在購票高峰時段,而難以輕易識別的圖形驗證碼,能有效防止高頻的刷票。

  一位鐵路集團總公司工作人員告訴記者,升級驗證碼系統的必要性是毋庸置疑的,這是12306網站與黃牛以及搶票軟件之間的一場持久的博弈戰。如果沒有防御性較強的驗證碼系統,黃牛可以憑借搶票軟件隨意地大量地占據車票資源。

  黃牛之惑:

  低成本和高技術能兼得嗎

  升級的驗證碼,極大地提高了黃牛的搶票成本,但是面對求票者出的高價中介費,一些“技術黃牛”還是會不遺余力地破解驗證碼數據

  搶票軟件導致購票難是個老問題。

  從最早的數字、字母驗證碼,到加減法、閃爍變形字母、干擾線變形字母驗證碼,再到今年推出的圖片驗證碼,12306購票網站不斷升級驗證碼的“段位”,五年六代版本。

  前述鐵路集團總公司工作人員告訴記者,從12306網站推出網絡購票功能以來,12306與各種搶票軟件之間的“博弈”就沒有停歇過。搶票軟件的興起雖然滿足了部分消費者購票的需求,但也成為了網絡黃牛黨的牟利工具。

  “部分購票者習慣性將矛頭指向12306網站,認為是其無能,導致黃牛黨的有乘可機。其實,在井噴式客流造成的巨大訪問量和信息處理量時,購票網站在保證正常運行的同時,堵塞各種流氓軟件的侵襲,非易事。”前述門戶網站程序員說,12306一直以來不斷補漏洞,升級系統,依然抵擋不住眾多“技術黃牛”在利益驅使下病毒性攻擊。

  據悉,鐵路部門曾求助商業網站巨頭的工程師,但無法解決,短時期內,12306只能在不斷修補漏洞中維護公平的購票秩序。

  從技術上講,復雜的圖形驗證碼,提升了自動識別的技術門檻,但其圖片質量較差,再加上有一些生僻且容易混淆的圖片以及不合適的圖片處理,造成用戶體驗較差。一位360工作人員分析認為,客觀來說,12306復雜驗證碼確實對打擊黃牛起到了一定的作用,例如其對部分驗證碼進行模糊顆粒化處理,可以防止黃牛采用專用搶票軟件來刷票。

  對此,鐵道部門及時回應。中國鐵道科學研究院電子計算技術研究所副所長朱建生明確表態,“在春運返程訂票高峰前,將對驗證碼中數萬張圖片進行優化,提高圖片分辨率,確保用戶體驗。”

  根據12306網站后臺監測及統計數據顯示,今年預售春運車票以來,放票時段圖形驗證碼的一次識讀正確率約為70%,非放票時段更高。

  據記者了解,12306官網推出的圖形驗證碼,確實攔截了一部分技術黃牛。但是,有消息稱,“圖形驗證碼推出沒多久后,就有人竊取了圖形驗證碼后臺數據庫,并建立“打碼平臺”以繞過圖形驗證碼這一環節。據悉目前其打碼平臺的打碼識別率已超過80%。黃牛每打碼一次,需付1分-5分不等的費用,給打碼平臺。黃牛每購買一張票,通常需要打碼十幾二十次,有的甚至打碼上百次。”

  “打碼”指的是人工識別驗證碼。即有專業的識別驗證碼的人工團隊,配合軟件進行刷票工作——軟件負責常規的操作步驟,人工團隊負責識別驗證碼,人工團隊為外掛機器人服務。這種方式最早源于游戲產業,為了攔截游戲外掛登陸,設了驗證碼,這時就有一撥人建立了平臺,每天的工作就是識別各種驗證碼后,將結果反饋給平臺。這種平臺就被稱為打碼平臺。

  梆梆安全創始人闞志剛坦言,實際測試表明,如果采集樣本數據足夠大,確實有破解圖形驗證碼的可能性,一旦圖形驗證碼被黃牛破解,他們就可以繼續刷票,“雖然圖形驗證碼在識別上增加了難度,但破解難度上并沒有革命性的改變。”

  無獨有偶,360瀏覽器近日宣布,已全面攻破12306驗證碼,實現了全自動識別技術,并首次公布了581種12306圖形驗證碼大數據。對此,為12306系統提供圖形驗證碼服務的杭州微觸科技有限公司負責人宋超在接受媒體采訪時坦言,圖片的數量不是一個固定的數字,是不斷動態增替的過程,會不斷通過用戶的使用數據來更新。

  市場之惑:

  供需結構之困如何解

  需求決定市場,不管 12306怎么升級驗證碼,總改變不了火車票供應不足的局面,單憑技術問題解決不了火車票供需結構之困

  不可否認,各式驗證碼,增加了黃牛黨的刷票難度。從實際效果來看,近兩年的春運車票購買難題,也從“有票買不到”逐步轉向了網絡容量不足、不熟悉網絡購票操作等技術問題。事實上,12306網站開發者從用戶這里得到的反饋,一直是“差評多于好評”。

  山東大學教授王忠武認為,鐵路部門如能轉換思路,充分發揮市場在資源配置中的決定性作用,或可以緩解12306網站“逢節必癱”、口水滿天的尷尬。

  歸根結底,搶票軟件導致購票難是個老問題,但是不是最大的問題。最突出的矛盾是,火車票供需結構問題。

  一位互聯網行業創業人士認為,當前技術更新換代太快,單純地“拼技術”并不是出路。必須承認的是,需求決定市場,不管12306怎么升級驗證碼,總改變不了火車票供應不足的局面,在利益驅動下,搶票軟件自然會不停地升級??梢哉f,單憑技術問題解決不了這一難題。

  多位專家都認為,鐵道部門在“防火防盜防搶票”之余,應將重點放在科學調配運量、不斷提升鐵路運力方面,“單靠技術手段始終還是治標不治本,不斷地換代驗證碼形式或不停地尋找和升級購票軟件,也許一時有效,但終究會被技術團隊破解,畢竟火車票供不應求的現實軟肋才是問題的根本。”

  鐵路部門相關負責人也表示,提高鐵路運力是最終化解供需矛盾的重要方向。今年春運,鐵路部門每天開行旅客列車3488對,比2015年春運增長14.5%。其中,圖定旅客列車3048對,春運增開旅客列車440對。

  前述鐵道部門工作人員認為,如今鐵道部門應該把精力集中在提高火車的運力以及提升旅客滿意度與服務質量上,12306網站用戶體驗的提升也用作為工作重點,比如保證旅客的個人信息安全、提高網站承載能力、優化購票流程、確保支付安全等。

  值得一提的是,為確保2016年鐵路春運安全、維護廣大旅客合法權益,除了技術層面阻止黃牛刷票,鐵路公安機關集中開展為期百日的“獵鷹-2016”戰役,嚴厲打擊倒賣車票違法犯罪活動。截至目前,各地破獲倒票案件71起,抓獲倒票人員85名,繳獲車票及訂票憑證6214張、假票及空白票版12078張。據記者了解,此次行動于今年11月26日啟動,至明年3月4日結束。行動期間,各地鐵路警方加強售票廳、退改簽窗口等區域的巡查;公布有獎舉報電話,激發社會各方參與打票積極性;聯合客運部門嚴格落實實名制驗證進站、進出站通道口子管理和身份證原件改簽、退票等制度,嚴查“冒用身份證、票進站”等行為。

 
打賞
 
更多>同類資訊
0相關評論

 
推薦資訊
點擊排行
?
網站首頁  |  付款方式  |  版權隱私  |  使用協議  |  聯系方式  |  關于我們  |  網站地圖  |  排名推廣  |  廣告服務  |  RSS訂閱  |  違規舉報  |  京ICP備11008917號-2  | 
 
porn视频在线观看