移動端


當(dāng)前位置:興旺寶>資訊首頁> 技術(shù)前沿

阿里聯(lián)手中科院研發(fā)“聽音識人”技術(shù)被CVPR收錄

2021-03-25 15:47:12來源:TechWeb 閱讀量:168 評論

分享:

  近日,中科院和阿里安全的研究者讓AI掌握通過聲音找到“主人”的任務(wù)。經(jīng)驗證,相較于人類67%的正確率,AI的準(zhǔn)確率接近90%。在“1對N”的匹配實驗中,AI還能對聲音歸屬人臉的“可能性”進行排序。
 
  該技術(shù)是一種自適應(yīng)的學(xué)習(xí)框架,用來挖掘和學(xué)習(xí)人臉與聲音的潛在聯(lián)系,該論文研究成果隨即也被CVPR 2021接收。
 
  現(xiàn)有研究表明,人臉和聲音受到年齡、性別、生理結(jié)構(gòu)、語言習(xí)慣等共同因素的影響,兩者的聯(lián)系強烈而復(fù)雜多樣。該研究*作者、中科院計算所博士研究生溫佩松介紹,中科院和阿里安全的研究團隊將公開數(shù)據(jù)集中兩種類型的數(shù)據(jù)在共享空間中表示,從而達(dá)到跨模態(tài)匹配的目的,在學(xué)習(xí)策略上利用了數(shù)據(jù)集的局部和全局信息,提高了模型的學(xué)習(xí)效率和效果。
 
  通俗來看,即聲音可能是音頻格式,人臉是圖片格式,兩類信息以不同的格式存儲,難以比較,所以研究者將聲音和人臉“翻譯”成了同一種格式的信息,讓AI模型可以對兩種信息之間的關(guān)聯(lián)自行學(xué)習(xí)。AI學(xué)會了兩種信息的關(guān)聯(lián)性之后,就能幫聲音找到人臉,或者幫人臉找到聲音。因此,AI的這項技能不僅可以“聽音識人”,還能“見人知聲”。
 
  溫佩松介紹,該研究進行了三類實驗,*種,給定一段聲音和僅含有一張正確人臉的若干張人臉圖片,AI匹配聲音和人臉的正確率*可達(dá)87.2%;第二種,給定一段聲音和一張人臉,詢問AI這是否屬于同一個人,準(zhǔn)確率*可達(dá)87.2%;第三種,給定一段聲音和含有若干張正確人臉的圖片,要求AI把所有人臉排序,使得正確的人臉盡可能靠前,AI也能準(zhǔn)確完成任務(wù)。該實驗在公開測試集上一共測試了20076張人臉和21850段音頻,AI的表現(xiàn)都令人驚喜。
 
  在相同的任務(wù)上,如果待鑒別對象不限制性別,人類判斷的準(zhǔn)確率達(dá)81.3%,在限制性別的情況下,準(zhǔn)確率僅為57.1%,性別因素對AI的影響卻非常小,準(zhǔn)確率依然如上述結(jié)果,高于人類。
 
  據(jù)阿里安全圖靈實驗室*算法專家華棠介紹,該技術(shù)后續(xù)將在內(nèi)容安全和賬戶安全領(lǐng)域探索應(yīng)用,對抗偽造類視頻攻擊,保護用戶財產(chǎn)和信息安全。“有些人利用偽造視頻試圖騙過認(rèn)證系統(tǒng),AI的這項技能將進一步驗證聲音與相應(yīng)真人是否匹配,防范欺詐,守護安全。”華棠說,這也是讓AI在提升安全水位上有更多用武之地。
 
  原標(biāo)題:阿里聯(lián)手中科院研發(fā)“聽音識人”技術(shù)被CVPR收錄
 
版權(quán)與免責(zé)聲明:1.凡本網(wǎng)注明“來源:興旺寶裝備總站”的所有作品,均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-興旺寶合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來源:興旺寶裝備總站”。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。 2.本網(wǎng)轉(zhuǎn)載并注明自其它來源(非興旺寶裝備總站)的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點或和對其真實性負(fù)責(zé),不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個人從本網(wǎng)轉(zhuǎn)載時,必須保留本網(wǎng)注明的作品第一來源,并自負(fù)版權(quán)等法律責(zé)任。 3.如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。
我來評論

昵稱 驗證碼

文明上網(wǎng),理性發(fā)言。(您還可以輸入200個字符)

所有評論僅代表網(wǎng)友意見,與本站立場無關(guān)

    相關(guān)新聞
    • AI技術(shù)魔力有多大?將讓半導(dǎo)體制造業(yè)“變天”

      隨著AI技術(shù)的迅猛發(fā)展,AI+半導(dǎo)體已成業(yè)內(nèi)繞不開的一個話題,但在半導(dǎo)體行業(yè)“變天”之時,如何抓住突破口?
      2024-11-24 14:09:36    18209
      半導(dǎo)體制造業(yè)AI技術(shù)
    • 臺風(fēng)普拉桑來襲 AI技術(shù)應(yīng)用助力氣象監(jiān)測

      近年來,隨著人工智能技術(shù)的迅速發(fā)展,氣象科學(xué)家們開始借助深度學(xué)習(xí)和機器學(xué)習(xí)算法來提升大氣預(yù)測的準(zhǔn)確性。
      2024-09-20 14:00:26    122
      AI技術(shù)氣象監(jiān)測
    • VisionChina(上海)2024特色活動等你來探!

      作為國內(nèi)外機器視覺領(lǐng)域的全品類展示平臺,VisionChina(上海)機器視覺展將全面呈現(xiàn)機器視覺系統(tǒng)及其核心部件和插件的前沿科技與創(chuàng)新成果。
      2024-06-25 14:09:31    137
      機器視覺AI技術(shù)