為進(jìn)一步深化人工智能等數(shù)字技術(shù)在生態(tài)環(huán)境領(lǐng)域的應(yīng)用,江蘇省環(huán)保集團(tuán)監(jiān)測(cè)監(jiān)控公司聯(lián)合清華大學(xué)大數(shù)據(jù)研究中心開展產(chǎn)學(xué)研用一體化創(chuàng)新攻關(guān),研發(fā)生態(tài)環(huán)境大語(yǔ)言模型智能AI助手模型系統(tǒng),并在省生態(tài)環(huán)境廳、南京市生態(tài)環(huán)境局開展前期試用,推進(jìn)產(chǎn)學(xué)研用一體化創(chuàng)新研發(fā)。
問(wèn)題導(dǎo)向
需求指引破解文本利用“老難題”
長(zhǎng)期以來(lái),生態(tài)環(huán)境領(lǐng)域文本大數(shù)據(jù)由于其結(jié)構(gòu)多變、邏輯性強(qiáng)等特點(diǎn)導(dǎo)致傳統(tǒng)機(jī)器學(xué)習(xí)手段難以對(duì)其進(jìn)行有效的數(shù)據(jù)整合及信息提取。一是分析挖掘“難”,各類分析報(bào)告、溯源報(bào)告文本數(shù)據(jù)的關(guān)鍵信息提取與結(jié)構(gòu)化,往往需要投入大量的人力分析,耗時(shí)耗力;二是快速檢索“難”,實(shí)際工作中難以快速?gòu)拇罅康恼呶募?、?guī)范制度、法律條文中查找具體條目;三是綜合利用“難”,文本材料的深度挖掘以及信息匹配往往需要耗費(fèi)大量人力。
針對(duì)以上問(wèn)題,監(jiān)測(cè)監(jiān)控公司基于新興的大語(yǔ)言模型技術(shù),開展了生態(tài)環(huán)境領(lǐng)域智能問(wèn)答助手技術(shù)研發(fā),應(yīng)用文本向量嵌入、非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)以及檢索增強(qiáng)生成等技術(shù),將2000余份生態(tài)環(huán)境專業(yè)文本資料分類建立了9個(gè)專題知識(shí)庫(kù),以此增強(qiáng)大語(yǔ)言模型在生態(tài)環(huán)境領(lǐng)域的知識(shí)儲(chǔ)備,使用戶可以通過(guò)直觀的對(duì)話方式對(duì)資料庫(kù)中的文本數(shù)據(jù)進(jìn)行查詢、分析和再加工,完成信息檢索、報(bào)告生成、綜合分析等實(shí)際業(yè)務(wù)功能。
開放創(chuàng)新
校企聯(lián)動(dòng)提升核心技術(shù)“硬實(shí)力”
大語(yǔ)言模型是近年涌現(xiàn)出來(lái)的人工智能領(lǐng)域前沿技術(shù),監(jiān)測(cè)監(jiān)控公司結(jié)合行業(yè)垂直領(lǐng)域應(yīng)用實(shí)際需求,聯(lián)合清華大學(xué)大數(shù)據(jù)研究中心開展校企合作協(xié)同創(chuàng)新。項(xiàng)目開展期間,研發(fā)團(tuán)隊(duì)圍繞基礎(chǔ)模型選型、模型問(wèn)答準(zhǔn)確性優(yōu)化以及用戶服務(wù)系統(tǒng)開發(fā)等方面進(jìn)行技術(shù)攻關(guān),顯著提升了項(xiàng)目的技術(shù)水平及產(chǎn)品的成熟度。通過(guò)校企聯(lián)合開放式創(chuàng)新,加快了核心技術(shù)研發(fā)進(jìn)度。經(jīng)評(píng)審,項(xiàng)目獲評(píng)2023年清華大學(xué)大數(shù)據(jù)能力提升項(xiàng)目?jī)?yōu)秀團(tuán)隊(duì)。
數(shù)據(jù)安全
自主架構(gòu)筑牢敏感信息“防火墻”
生態(tài)環(huán)境領(lǐng)域數(shù)據(jù)具有一定的敏感性和保密性要求,用戶對(duì)數(shù)據(jù)安全的要求較高。研發(fā)團(tuán)隊(duì)在技術(shù)選型過(guò)程中,充分考慮系統(tǒng)的穩(wěn)定性和安全性。采用GLM架構(gòu)大語(yǔ)言模型作為推理基座,并結(jié)合非結(jié)構(gòu)化存儲(chǔ)及文本向量嵌入技術(shù)進(jìn)行二次開發(fā),系統(tǒng)實(shí)現(xiàn)全部用戶數(shù)據(jù)資料的可控訪問(wèn)及安全管理,可在非聯(lián)網(wǎng)、局域網(wǎng)和專網(wǎng)環(huán)境下運(yùn)行使用,杜絕用戶信息泄露,確保用戶數(shù)據(jù)安全。
目前,生態(tài)環(huán)境大語(yǔ)言模型智能AI助手模型系統(tǒng)仍在持續(xù)優(yōu)化和完善過(guò)程中,并同步在省生態(tài)環(huán)境廳、南京市生態(tài)環(huán)境局開展產(chǎn)品試用。后續(xù),監(jiān)測(cè)監(jiān)控公司研發(fā)團(tuán)隊(duì)將積極對(duì)接用戶需求,通過(guò)產(chǎn)品試用等方式持續(xù)收集用戶意見(jiàn),改進(jìn)產(chǎn)品性能,有效提升生態(tài)環(huán)境文本大數(shù)據(jù)分析利用能力,服務(wù)生態(tài)環(huán)境數(shù)字化和智能化治理。
版式:莊 遠(yuǎn)
審校: 吳亞兵
原標(biāo)題:產(chǎn)學(xué)研用融合共進(jìn)丨省生態(tài)環(huán)境監(jiān)測(cè)監(jiān)控有限公司推動(dòng)大語(yǔ)言模型在生態(tài)環(huán)境領(lǐng)域創(chuàng)新研發(fā)應(yīng)用
昵稱 驗(yàn)證碼 請(qǐng)輸入正確驗(yàn)證碼
所有評(píng)論僅代表網(wǎng)友意見(jiàn),與本站立場(chǎng)無(wú)關(guān)