相較于指紋識別、人臉識別的火熱,或許大家對聲紋識別還是相對陌生的。但其實在生活中,聲紋識別應(yīng)用已經(jīng)展開,如在微信的賬號登錄中就有一種通過聲紋識別登錄的方式,用戶通過讀某一串數(shù)字與事先錄入的該串數(shù)字的聲紋進行對比,判斷是否為同一個人,驗證通過即可登錄。公安機關(guān)也用聲紋識別來對重點人員進行布控,一旦捕捉到相關(guān)聲紋信息,馬上采取相關(guān)措施。
目前,隨著聲紋識別技術(shù)的不斷提高,相關(guān)熱度也在上漲,未來潛力巨大!那么,關(guān)于聲紋識別,你了解多少呢?今天小編就帶你來了解下聲紋識別!
什么是聲紋識別?聲紋跟指紋一樣,具備唯一性,一般情況下難以被模仿。而聲紋識別技術(shù)就是通過提取身份特征信息和聲紋特征,再把聲信號轉(zhuǎn)換成電信號,用計算機通過相關(guān)算法進行比對識別的技術(shù)。其關(guān)鍵技術(shù)有以下兩點:
1、語音特征參數(shù)提取技術(shù)
簡單來講就是要從講話人的語音中提取出特定器官結(jié)構(gòu)、行為習慣的特征參數(shù)。這項參數(shù)的特點是較為穩(wěn)定,不會隨時間或環(huán)境的變化發(fā)生太明顯的改變,且不易模仿、具備較強的抗噪性。這點其實很好理解,每個人由于語音器官的差異導(dǎo)致了不同的發(fā)音習慣,其語音特征是難以被輕易模仿的。
2、模式匹配識別判斷技術(shù)
該技術(shù)實施的第一步是要獲取跟講話人個性相關(guān)的特征參數(shù),再根據(jù)一定的準則,將未識別的特征參數(shù)與模型庫中訓(xùn)練好的模型進行特征匹配,最終根據(jù)相似度得出最匹配的結(jié)果并進行輸出。其中在模型匹配中常用到的幾種模型有矢量化模型、隨機模型、神經(jīng)網(wǎng)絡(luò)模型等。
得益于人工智能機器學習技術(shù)的成熟,以及傳感器、麥克風、通信信道等技術(shù)的進步,聲紋識別雖然不能確保100%識別出欺詐,但成功率仍然較高。
聲紋識別的優(yōu)勢與劣勢
聲紋識別相對其他生物特征識別有什么優(yōu)劣勢,除了聲紋識別以外,常見的生物特征有指紋、掌紋、人臉、虹膜、視網(wǎng)膜等。生物特征代表了每個人固有的特點,它具有普遍性、唯一性、穩(wěn)定性和不易復(fù)制性等。
與其他這些生物特征相比,聲紋主要有以下三方面的優(yōu)勢:
1、非接觸、易接受:
聲紋由于其非接觸性是可以用于遠程領(lǐng)域的生物識別技術(shù)。另外蘊含聲紋特征的語音獲取方便、自然。在采集過程中涉及到的用戶個人隱私信息較少,因此更容易被使用者接受。
2、成本低:
語音采集裝置成本低廉,使用簡單,一個麥克風即可,在使用通訊設(shè)備(如電話、手機)時更無需額外的錄音設(shè)備。
3、偽造難:
聲紋信息必須是活體采集,可使聲紋口令動態(tài)變化而無需擔心密碼遺忘、丟失和竊取問題,防止錄音假冒。
當然,聲紋也有其自身的劣勢,聲紋特征的穩(wěn)定性不夠,受附著語音長短、內(nèi)容、采集信道及環(huán)境、包括說話人自身身體情況影響,自動識別效果不及指紋等生物特征。
聲紋識別與語音識別有何不同?
說到這里你或要問,語音識別和聲紋識別都是聲音的識別,它們又有什么關(guān)系?兩者一樣嗎?其實聲紋識別和語音識別在原理上是一樣的,都是通過對采集到的語音信號進行分析和處理,提取相應(yīng)的特征或建立相應(yīng)的模型,然后據(jù)此做出判斷,屬于人工智能智能語音研究方向。但二者的根本目的,提取的特征、建立的模型是不一樣的。
語音識別的目的:識別語音的內(nèi)容。并以電腦自動將人類的語音內(nèi)容轉(zhuǎn)換為相應(yīng)的文字或者執(zhí)行相關(guān)的指令,如語音輸入文字、智能音響等。
聲紋識別的目的:識別說話人的身份。又稱說話人識別,是生物識別技術(shù)的一種。
語義識別的目的:對語音識別出來的內(nèi)容進行語義理解和糾正,比如同聲翻譯機。
目前,在智能語音領(lǐng)域,語音識別賽道各家水平差距不大,為了避免同質(zhì)化競爭,許多公司選擇從“聲紋識別”切入,也因此成為新的藍海市場。近期進行的聲紋識別國際賽事-VoxSRC比賽上,包括IDLab、字節(jié)跳動、昆山杜克大學、西北工業(yè)大學、思必馳、聯(lián)想集團等國內(nèi)外高校、研究機構(gòu)和企業(yè)都來參加比賽。通過網(wǎng)上搜索也可以看到華為云、科大訊飛、騰訊云、國音智能、中科昊音、聲揚科技、靈云等一批優(yōu)秀的聲紋識別企業(yè)。
聲紋識別應(yīng)用于哪些領(lǐng)域?
目前來說,聲紋識別技術(shù)在公安和金融領(lǐng)域比較受青睞。
公安領(lǐng)域:聲紋識別可以用于重點人員布控、偵查破案、反電信欺詐、治安防控、司法鑒定、審訊室建設(shè)、網(wǎng)絡(luò)身份認證等。
1)重點人員布控——建立重點人員聲紋數(shù)據(jù)庫,在110接警、重點區(qū)域范圍、重大活動期間等,一旦發(fā)現(xiàn)重點人員、黑名單人員聲紋信息,即進行預(yù)警,有效進行事前預(yù)防。在建立重點人員聲紋數(shù)據(jù)庫時,需要先對聲紋進行采集,目前在公安領(lǐng)域主要是標準聲紋采集。
2)偵查破案——利用聲紋識別技術(shù)海量篩查優(yōu)勢,進行“案查人”、“人查案”、“案查案”與“人查人”等多種排查方式,縮小偵查范圍,提高辦案效率,公安領(lǐng)域要求聲紋數(shù)據(jù)庫的聲紋比對系統(tǒng)能夠提供1:N大庫檢索比對,同時要支持千萬庫容建設(shè)。
3) 反電信詐騙——利用聲紋鑒定技術(shù)對電信詐騙等案件中的涉案語音進行個體、團伙的識別,確定犯罪嫌疑人身份,為偵查破案、案件訴訟提供技術(shù)支撐。
4)治安防控——利用“語種識別”、“內(nèi)容識別”、“聲紋特征識別”等聲紋綜合分析技術(shù),對重點人員進行布控,一旦出現(xiàn)立即進行關(guān)注控制。
5)身份認證——在監(jiān)獄親情電話應(yīng)用中,通過采集犯人家屬的聲紋信息,可有效鑒別家屬身份的合法性。在司法社區(qū)矯正應(yīng)用中,通過識別定位手機位置和呼叫對象說話聲音的個人特征,系統(tǒng)就可以快速的自動判斷被監(jiān)控人是否在規(guī)定的時間出現(xiàn)在規(guī)定的場所,有效地解決人機分離問題。
金融領(lǐng)域:聲紋識別技術(shù)主要可以用于以下幾個場景:
1) 登錄、支付場景——采用聲紋識別技術(shù),自動匹配用戶個人身份信息,完成登陸、支付的身份驗證,一般采用文本相關(guān)的方式,既8位隨機動態(tài)數(shù)字串或者固定文本。
2)業(yè)務(wù)核身——采用聲紋識別技術(shù),在業(yè)務(wù)溝通中完成用戶身份核驗,在自動匹配業(yè)務(wù)辦理的信息,進行比對,完成業(yè)務(wù)辦理的身份核驗,一般采用文本無關(guān)方式,如開卡開戶。
3) 信貸場景——采用聲紋識別技術(shù),在信審環(huán)節(jié)對用戶身份進行識別,并查驗是否為黑中介(黑名單用戶),完成信審身份審核,采用文本無關(guān)的方式。
4)金融反洗錢——采用聲紋識別技術(shù),在判定出疑似洗錢行為后對用戶進行電話遠程身份驗證以及自動對用戶信息核對,完成可疑用戶身份核驗,采用文本無關(guān)的方式。
其實聲紋識別技術(shù)現(xiàn)在很廣泛的應(yīng)用公安司法、軍隊國防領(lǐng)域中,我國的天網(wǎng)系統(tǒng)里也有著聲紋識別的存在,這極大的保障了我們?nèi)粘I钪械陌踩?br />
原標題:關(guān)于聲紋識別 這些你知道嗎?
昵稱 驗證碼 請輸入正確驗證碼
所有評論僅代表網(wǎng)友意見,與本站立場無關(guān)