移動(dòng)端


當(dāng)前位置:興旺寶>資訊首頁> 產(chǎn)品新聞
閱讀排行 更多
企業(yè)直播 更多
推薦展會(huì) 更多

星火再進(jìn)化,科大訊飛智駕方案新鮮出爐

2023-11-01 08:31:14來源:蓋世汽車 閱讀量:105 評論

分享:

導(dǎo)讀:以數(shù)據(jù)驅(qū)動(dòng)為開發(fā)模式的自動(dòng)駕駛發(fā)展階段,大模型賦能自動(dòng)駕駛在車端、云端實(shí)現(xiàn)端到端的平臺管理,在數(shù)據(jù)采集標(biāo)注、仿真、算法優(yōu)化等各個(gè)層面賦能自動(dòng)駕駛發(fā)展,科大訊飛這類的大模型AI廠商,或?qū)⒂瓉頃r(shí)代機(jī)遇。

  “從ChatGPT發(fā)布至今短短不到一年的時(shí)間,人工智能企業(yè)、大模型廠商以及社會(huì)各界風(fēng)起云涌,在不到一年時(shí)間內(nèi),我們欣喜地看到,大模型正日益深入地跟每個(gè)人息息相關(guān)。”在10月20日舉辦的2023科大訊飛全球1024開發(fā)者大會(huì)上,科大訊飛董事長劉慶峰感嘆到。
 
  ChatGPT的出現(xiàn)引爆了一場人工智能的狂歡,各方勢力紛紛下場,開啟“百模大戰(zhàn)”。今年5月6日,訊飛星火認(rèn)知大模型V1.0發(fā)布時(shí),科大訊飛定下了今年的三個(gè)發(fā)展目標(biāo):6月9日,突破開放式問答、多輪對話能力明顯提升、數(shù)學(xué)能力再升級;8月15日,代碼能力升級以及多模態(tài)交互能力提升;10月24日,實(shí)現(xiàn)通用模型對標(biāo)ChatGPT,并在教育、醫(yī)療等領(lǐng)域做到業(yè)界領(lǐng)先。
 
  10月24日,科大訊飛如期交出成績單。訊飛星火認(rèn)知大模型V3.0正式發(fā)布,在文本生成、語言理解、知識問答、邏輯推理、數(shù)學(xué)能力、代碼能力以及多模態(tài)能力方面都有所提升。
 
  此外,訊飛聯(lián)合行業(yè)龍頭共同發(fā)布12個(gè)行業(yè)大模型,加速產(chǎn)業(yè)落地。其自主創(chuàng)新的大模型算力平臺已經(jīng)啟動(dòng)。訊飛聯(lián)合昇騰生態(tài)共同發(fā)布“飛星一號”大模型算力平臺,并啟動(dòng)對標(biāo)GPT-4的更大參數(shù)規(guī)模的星火大模型訓(xùn)練。
 
  此次開發(fā)者大會(huì)上,劉慶峰定下了一個(gè)新目標(biāo):2024年上半年,訊飛星火將實(shí)現(xiàn)對標(biāo)GPT-4。在劉慶峰看來,這不僅僅是一個(gè)簡單的技術(shù)對標(biāo)問題,“我們要走出自己的技術(shù)路線,走出自己的產(chǎn)業(yè)方向,形成自己完整的生態(tài)。從這個(gè)角度來說,大模型時(shí)代的序幕才剛剛拉開!”劉慶峰說到。
 
  而對于汽車行業(yè)來說,大模型上車的步伐也才剛剛拉開。
 
  訊飛智駕方案新鮮出爐
 
  人們對于大模型賦能汽車的想象空間主要集中在幾個(gè)方面:一是伴隨著大模型在深度理解、邏輯推理、情感捕捉等方面的進(jìn)步,打造類人的座艙交互體驗(yàn)。二是依托大模型,通過多模態(tài)融合等人工智能技術(shù),進(jìn)一步助力智能駕駛發(fā)展。此外,還有大模型會(huì)帶來更廣泛的應(yīng)用生態(tài),以及促進(jìn)“軟件定義汽車”的發(fā)展等。
 
  10月24日,科大訊飛同步召開以“釋放想象力·智能新出行”為主題的智能汽車新品發(fā)布會(huì),會(huì)上,科大訊飛發(fā)布了基于訊飛星火V3.0的座艙、音效、智駕三大方向的產(chǎn)品升級。
 
  大模型的理解、推理、表達(dá)和多模態(tài)知識學(xué)習(xí)等能力給自動(dòng)駕駛帶來了更多新的技術(shù)思路,基于訊飛星火認(rèn)知大模型,科大訊飛發(fā)布了兩款行泊一體智駕解決方案——智駕STD和智駕PRO,配備增強(qiáng)型高速NOA(HNOA)、記憶行車和記憶泊車等功能。
 
  對于大模型如何提升自動(dòng)駕駛能力,行業(yè)還在探索初期,在科大訊飛看來,大模型利用海量數(shù)據(jù)以及駕駛領(lǐng)域知識的強(qiáng)化,可以用于自動(dòng)駕駛場景數(shù)據(jù)以及駕駛策略的生成,并支持以交互的方式增強(qiáng)對基礎(chǔ)駕駛模型的理解。
 
  基于此,科大訊飛自研了從深度學(xué)習(xí)訓(xùn)練到模型調(diào)優(yōu)量化、模型推理部署的全棧工具鏈,并打造了智駕應(yīng)用開發(fā)框架和中間件,支撐跨平臺算法快速移植,以及自研4D重建與自動(dòng)標(biāo)注系統(tǒng)提升標(biāo)注的效率和質(zhì)量。
 
  星火大模型將從技術(shù)架構(gòu)層面賦能BEV+transformer智駕感知大模型的研發(fā),意圖解決智能駕駛當(dāng)前存在的感知不精準(zhǔn)、決策不智能、長尾不收斂三大技術(shù)難題。
 
  據(jù)訊飛介紹,通過統(tǒng)一的BEV+Transformer網(wǎng)絡(luò),可以實(shí)現(xiàn)多模態(tài)、多任務(wù)、長時(shí)序4D感知等能力。此外,科大訊飛還開發(fā)了基于機(jī)器學(xué)習(xí)的超聲波感知算法應(yīng)用,提升感知準(zhǔn)確性和泛化性。
 
  重感知正成為當(dāng)下推動(dòng)高階輔助駕駛快速落地的一大趨勢,視覺感覺的技術(shù)也在加速發(fā)展。機(jī)器視覺是科大訊飛2030Top計(jì)劃的核心,在自動(dòng)駕駛對視覺依賴越來越強(qiáng)的今天,科大訊飛依托在機(jī)器視覺方面的積累和投入打造智駕方案。
 
  科大訊飛智能汽車事業(yè)部副總經(jīng)理李衛(wèi)兵認(rèn)為,視覺感知技術(shù)能夠加速智能駕駛落地,具有輕地圖、重感知、低成本、快落地等特點(diǎn)。
 
  科大訊飛的兩款智駕方案,其中智駕STD算力為15TOPS,憑借6個(gè)攝像頭、5個(gè)毫米波雷達(dá)和12個(gè)超聲波雷達(dá),能夠?qū)崿F(xiàn)基礎(chǔ)ADAS、自動(dòng)泊車(APA)、高速NOA、記憶泊車等在內(nèi)的32項(xiàng)功能點(diǎn)。智駕PRO算力為50TOPS,硬件方案為11個(gè)攝像頭、5個(gè)毫米波雷達(dá)和12個(gè)超聲波雷達(dá),支持的功能點(diǎn)達(dá)40項(xiàng)。
 
  AI算法研發(fā)能力、完整的數(shù)據(jù)閉環(huán)云平臺、工程技術(shù)能力等,是科大訊飛行泊一體智駕解決方案的支撐,科大訊飛在此基礎(chǔ)上打造車云一體的智駕研發(fā)體系。
 
  具體來看,科大訊飛通過算法迭代提供基礎(chǔ)設(shè)施支撐和數(shù)據(jù)服務(wù),打造功能平臺為安全研發(fā)優(yōu)化神經(jīng)網(wǎng)絡(luò)推理提供數(shù)據(jù),保證其模型的訓(xùn)練的效率和訓(xùn)練的質(zhì)量。同時(shí)科大訊飛將會(huì)增建百輛規(guī)模的算法研發(fā)測試數(shù)據(jù)回流的開發(fā)平臺等。
 
  在智駕領(lǐng)域,科大訊飛除提供行泊一體智駕解決方案外,另有四大服務(wù):采集服務(wù)、數(shù)據(jù)服務(wù)、標(biāo)注服務(wù)、訓(xùn)練服務(wù)。
 
  以數(shù)據(jù)標(biāo)注為例,自動(dòng)駕駛所需標(biāo)注的數(shù)據(jù)類型呈現(xiàn)多樣化,數(shù)據(jù)數(shù)量也在呈現(xiàn)指數(shù)級的提升。然而,目前普遍存在的問題是標(biāo)注數(shù)據(jù)的準(zhǔn)確性較低及綜合成本較高。
 
  用人工標(biāo)注的數(shù)據(jù)去訓(xùn)練云端大平臺,再用訓(xùn)練過后的云端大平臺去協(xié)助進(jìn)行自動(dòng)標(biāo)注,結(jié)合少量的質(zhì)檢和人工調(diào)整,能生成更多的標(biāo)注數(shù)據(jù),形成正向循環(huán),逐步用來提升感知大模型的自動(dòng)標(biāo)注的程度和效果,并進(jìn)一步的降低成本??拼笥嶏w自研4D重建與自動(dòng)標(biāo)注系統(tǒng),以提升標(biāo)注效率和質(zhì)量。
 
  “未來我們結(jié)合大模型的精準(zhǔn)的識別能力,數(shù)據(jù)挖掘能力和強(qiáng)大的生成能力,進(jìn)一步豐富我們的仿真場景,構(gòu)建更接近現(xiàn)實(shí)的仿真環(huán)境,以大幅提升我們算法的迭代效率,支撐整個(gè)智駕系統(tǒng)的快速高效的進(jìn)化。”李衛(wèi)兵說到。
 
  李衛(wèi)兵指出,智能汽車這個(gè)新物質(zhì)的本質(zhì)需求在不斷的進(jìn)化。要能夠做到全生命周期的持續(xù)迭代OTA,需要Tier 1方案提供商有強(qiáng)大的技術(shù)實(shí)力,堅(jiān)定的長期戰(zhàn)略。在李衛(wèi)兵看來這也不是一般的小公司能夠做得到。
 
  以數(shù)據(jù)驅(qū)動(dòng)為開發(fā)模式的自動(dòng)駕駛發(fā)展階段,大模型賦能自動(dòng)駕駛在車端、云端實(shí)現(xiàn)端到端的平臺管理,在數(shù)據(jù)采集標(biāo)注、仿真、算法優(yōu)化等各個(gè)層面賦能自動(dòng)駕駛發(fā)展,科大訊飛這類的大模型AI廠商,或?qū)⒂瓉頃r(shí)代機(jī)遇。
 
  大模型與智能座艙,碰撞出更多火花
 
  大模型在智能座艙領(lǐng)域的應(yīng)用已有一些產(chǎn)品出現(xiàn),科大訊飛將訊飛星火V3.0與智能座艙進(jìn)一部結(jié)合,面向多樣化的汽車使用場景,推出星火座艙OS、星火汽車APP和星火座艙域控三大產(chǎn)品,支持實(shí)時(shí)檢索,可以實(shí)現(xiàn)插件化調(diào)度,并集成了多模態(tài)生成的能力,目的是為合作伙伴提供自主可控、組件化、更開放的座艙解決方案。
 
  大模型上車的一個(gè)典型應(yīng)用是助力實(shí)現(xiàn)對話式交互,為車輛的駕駛出行、導(dǎo)航、娛樂等環(huán)節(jié)提供強(qiáng)大的支持,使駕駛員和車輛之間的交流更為自然流暢。這種新型的交互方式正在改變著人們對于汽車智能座艙的認(rèn)知。
 
  科大訊飛介紹到,在過去,人們常常將車機(jī)屏幕視為車內(nèi)的一個(gè)平板電腦,然而,隨著對話式交互的出現(xiàn),人們開始意識到汽車智能座艙可以提供更多的可能性。
 
  據(jù)悉,星火座艙OS包括星火汽車助理和星火場景應(yīng)用兩大部分,語音合成MOS>4.6,大模型業(yè)務(wù)貫穿支持十輪以上的上下文語義繼承,新增實(shí)時(shí)檢索能力。借力大模型賦能,星火座艙OS打造了多個(gè)沉浸式的使用場景,并支持自定義,一句話生成復(fù)雜場景,觸達(dá)200+車控動(dòng)作。
 
  至于星火汽車APP則是圍繞用車場景打造的多樣化大模型車端應(yīng)用,涵蓋用車顧問、兒童故事、口語陪練、心靈SPA、旅行伙伴等等。
 
  座艙體驗(yàn)的很大組成部分在于其內(nèi)容、應(yīng)用生態(tài),科大訊飛除了基于其自研的兒童教育、K12教育、音娛資源、聽見會(huì)議以及訊飛翻譯五大自建生態(tài)資源外,訊飛星火大模型賦能的智能座艙已經(jīng)與支付寶、咪咕文娛、騰訊音樂、喜馬拉雅、高德、火山引擎、雷石、能鏈、喜泊客等九家企業(yè)開展了深度生態(tài)合作,以滿足車主多元化需求。此外,科大訊飛智能座艙還與百余家企業(yè)生態(tài)積極合作,期望以豐富全面的軟件生態(tài)賦能智能座艙。
 
  星火座艙域控是科大訊飛打造的智能化AI底座,面向行業(yè)輸出兼容核心AI算法的“核心板”,基于全棧的座艙AI算法和結(jié)合芯片的異構(gòu)算法優(yōu)勢實(shí)現(xiàn)芯算融合,SOC算力消耗降低10%。
 
  科大訊飛智能汽車事業(yè)部副總裁和衛(wèi)民表示,是否具備AI算力或NPU加速能力是座艙域控開發(fā)的核心競爭力。“我們的目標(biāo)是基于星火座艙域控方案,可以提供給Tier 1或車企一個(gè)平臺,讓其可以開發(fā)自己的差異化應(yīng)用,讓大家以最小的資源,最快的時(shí)間,更好的做產(chǎn)品的差異化。”和衛(wèi)民說到。
 
  車載音效,還有更多玩法
 
  作為駕駛場景下最安全和高效的交互方式,聽覺感官在車內(nèi)備受關(guān)注,用戶對汽車場景下的聽感品質(zhì)要求逐漸提高,對高級別車載音響系統(tǒng)的需求也在持續(xù)增長,
 
  特別是隨著自動(dòng)駕駛技術(shù)的發(fā)展,人們在車?yán)锩娴木Ρ会尫懦鰜?,有更多的機(jī)會(huì)可以去學(xué)習(xí)、工作、娛樂和休息。現(xiàn)在智能座艙的發(fā)展,有很多應(yīng)用場景與音效息息相關(guān),諸如K歌、會(huì)議、看視頻等,要想打造沉浸式的體驗(yàn),車載音效的設(shè)計(jì)也必須與時(shí)俱進(jìn),從單一維度向多維度發(fā)展,從單一場景向多場景延伸。
 
  這為汽車音效品牌實(shí)現(xiàn)智能化提供了新的機(jī)遇。當(dāng)下無論是新老品牌都在積極推動(dòng)著智能化產(chǎn)業(yè)升級。
 
  科大訊飛在智能音效領(lǐng)域算是老玩家了,其認(rèn)為車載音頻系統(tǒng)的發(fā)展可分為三個(gè)階段:第一個(gè)階段,1930-1984年,是基礎(chǔ)音效階段,包含收音機(jī)、磁帶機(jī)等產(chǎn)品;第二個(gè)階段,1994-2016年,環(huán)繞音效體驗(yàn)階段,涵蓋模擬功放、數(shù)字功放等產(chǎn)品;第三個(gè)階段,2021年往后,車載音頻系統(tǒng)開始進(jìn)入多維表達(dá)與全場景覆蓋的階段,標(biāo)志性產(chǎn)品便是智能音效管理系統(tǒng)。
 
  科大訊飛給汽車智能音效也做了一個(gè)分級,與自動(dòng)駕駛類似,從L1到L5,對應(yīng)著從基礎(chǔ)音效、基礎(chǔ)功能到身臨其境的極致體驗(yàn)。
 
  兩年前,科大訊飛在廣州發(fā)布了提供16個(gè)以上通道、20個(gè)以上揚(yáng)聲器的智能車載音頻系統(tǒng),開始進(jìn)入L3階段。此次,科大訊飛有發(fā)布了支持24個(gè)通道、30個(gè)以上揚(yáng)聲器,具有更強(qiáng)大的AI技術(shù)加持的新一代音頻管理系統(tǒng)。
 
  為了適配不同級別的車型,科大訊飛推出了靈活的軟硬一體平臺,分別是iFlySound STD平臺、iFlySound PRO平臺、iFlySound PLUS平臺。其iFlySound Plus 24ch功放硬件平臺,將基于應(yīng)用場景的交互、聽感、內(nèi)容、顯示與車控深度融合。
 
  據(jù)介紹,在硬件層面,iFlySound Plus24ch功放硬件平臺使用高性能浮點(diǎn)DPS,擁有最高2GHZ*2的高速音頻處理加速器和128通道數(shù)字音頻處理能力,可以獲得24bit 96kHz的HD Audio支持,并且兼容未來E-E架構(gòu)。同時(shí),科大訊飛在保證性能的前提下,降低了硬件的尺寸和重量,實(shí)現(xiàn)“小型化輕量化”。
 
  在軟件算法層面,基于科大訊飛自研技術(shù),當(dāng)前已具備3D環(huán)繞、聲場分區(qū)、車內(nèi)交流償、車載K歌和大模型音效等多個(gè)音效算法。以此為基礎(chǔ),科大訊飛推出了基于持續(xù)豐富的聲音庫、聲浪庫、音效庫、功能庫的訂閱模式。
 
  論大模型如何提升音效體驗(yàn),科大訊飛做出一些嘗試。在調(diào)音層面,科大訊飛基于大模型聲學(xué)理論體系實(shí)現(xiàn)人機(jī)耦合,端云協(xié)同AI調(diào)音,基于iFlyDSP GUI工具,無需代碼更改,可以快速完成定制需求,價(jià)值全自研MCU基礎(chǔ)軟件架構(gòu),可使跨平臺代碼復(fù)用度超70%,基于此適配不同定位和級別的車型。
 
  “未來,我們可以通過車內(nèi)設(shè)備來采集整車的環(huán)境,上傳到云端,在云端的話我們會(huì)有深度學(xué)習(xí)的大模型,能夠?qū)囕d環(huán)境進(jìn)行深入分析,并且結(jié)合車型本身的音效綜合定位來進(jìn)行自動(dòng)化調(diào)音,可以完成調(diào)音師70%以上的技術(shù)性工作,確保在降低成本、提高效率情況下,滿足調(diào)音流程的標(biāo)準(zhǔn)化。”科大訊飛蘇研院常務(wù)副院長、科大訊飛汽車事業(yè)部副總經(jīng)理支洪平說到。
 
  據(jù)悉,當(dāng)前,科大訊飛車載音效產(chǎn)品已獲得國內(nèi)13家主流車企平臺化項(xiàng)目定點(diǎn),合作車型超過30款。
 
  結(jié)語
 
  在智能汽車領(lǐng)域,“大模型上車”已經(jīng)成為一種趨勢,它將為智能座艙、自動(dòng)駕駛帶來更多的智能化、個(gè)性化、高效化的特點(diǎn),提升用戶的使用體驗(yàn)。
 
  隨著技術(shù)的不斷進(jìn)步和應(yīng)用場景的不斷擴(kuò)展,“大模型上車”將會(huì)為智能汽車產(chǎn)業(yè)的發(fā)展和創(chuàng)新帶來更加廣闊的空間和機(jī)遇。
 
  更深層次的是,大模型將不僅聚焦具體的車端應(yīng)用體驗(yàn),而是賦能整個(gè)汽車產(chǎn)業(yè)鏈條的發(fā)展,無論是生產(chǎn)、研發(fā)、營銷、售后等環(huán)節(jié),都有所助力,現(xiàn)在才只是剛剛開始。
版權(quán)與免責(zé)聲明:1.凡本網(wǎng)注明“來源:興旺寶裝備總站”的所有作品,均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-興旺寶合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來源:興旺寶裝備總站”。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。 2.本網(wǎng)轉(zhuǎn)載并注明自其它來源(非興旺寶裝備總站)的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)或和對其真實(shí)性負(fù)責(zé),不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個(gè)人從本網(wǎng)轉(zhuǎn)載時(shí),必須保留本網(wǎng)注明的作品第一來源,并自負(fù)版權(quán)等法律責(zé)任。 3.如涉及作品內(nèi)容、版權(quán)等問題,請?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。
我來評論

昵稱 驗(yàn)證碼

文明上網(wǎng),理性發(fā)言。(您還可以輸入200個(gè)字符)

所有評論僅代表網(wǎng)友意見,與本站立場無關(guān)

    相關(guān)新聞