為進一步深化人工智能等數(shù)字技術(shù)在生態(tài)環(huán)境領(lǐng)域的應(yīng)用,江蘇省環(huán)保集團監(jiān)測監(jiān)控公司聯(lián)合清華大學(xué)大數(shù)據(jù)研究中心開展產(chǎn)學(xué)研用一體化創(chuàng)新攻關(guān),研發(fā)生態(tài)環(huán)境大語言模型智能AI助手模型系統(tǒng),并在省生態(tài)環(huán)境廳、南京市生態(tài)環(huán)境局開展前期試用,推進產(chǎn)學(xué)研用一體化創(chuàng)新研發(fā)。
問題導(dǎo)向
需求指引破解文本利用“老難題”
長期以來,生態(tài)環(huán)境領(lǐng)域文本大數(shù)據(jù)由于其結(jié)構(gòu)多變、邏輯性強等特點導(dǎo)致傳統(tǒng)機器學(xué)習(xí)手段難以對其進行有效的數(shù)據(jù)整合及信息提取。一是分析挖掘“難”,各類分析報告、溯源報告文本數(shù)據(jù)的關(guān)鍵信息提取與結(jié)構(gòu)化,往往需要投入大量的人力分析,耗時耗力;二是快速檢索“難”,實際工作中難以快速從大量的政策文件、規(guī)范制度、法律條文中查找具體條目;三是綜合利用“難”,文本材料的深度挖掘以及信息匹配往往需要耗費大量人力。
針對以上問題,監(jiān)測監(jiān)控公司基于新興的大語言模型技術(shù),開展了生態(tài)環(huán)境領(lǐng)域智能問答助手技術(shù)研發(fā),應(yīng)用文本向量嵌入、非結(jié)構(gòu)化數(shù)據(jù)存儲以及檢索增強生成等技術(shù),將2000余份生態(tài)環(huán)境專業(yè)文本資料分類建立了9個專題知識庫,以此增強大語言模型在生態(tài)環(huán)境領(lǐng)域的知識儲備,使用戶可以通過直觀的對話方式對資料庫中的文本數(shù)據(jù)進行查詢、分析和再加工,完成信息檢索、報告生成、綜合分析等實際業(yè)務(wù)功能。
開放創(chuàng)新
校企聯(lián)動提升核心技術(shù)“硬實力”
大語言模型是近年涌現(xiàn)出來的人工智能領(lǐng)域前沿技術(shù),監(jiān)測監(jiān)控公司結(jié)合行業(yè)垂直領(lǐng)域應(yīng)用實際需求,聯(lián)合清華大學(xué)大數(shù)據(jù)研究中心開展校企合作協(xié)同創(chuàng)新。項目開展期間,研發(fā)團隊圍繞基礎(chǔ)模型選型、模型問答準(zhǔn)確性優(yōu)化以及用戶服務(wù)系統(tǒng)開發(fā)等方面進行技術(shù)攻關(guān),顯著提升了項目的技術(shù)水平及產(chǎn)品的成熟度。通過校企聯(lián)合開放式創(chuàng)新,加快了核心技術(shù)研發(fā)進度。經(jīng)評審,項目獲評2023年清華大學(xué)大數(shù)據(jù)能力提升項目優(yōu)秀團隊。
數(shù)據(jù)安全
自主架構(gòu)筑牢敏感信息“防火墻”
生態(tài)環(huán)境領(lǐng)域數(shù)據(jù)具有一定的敏感性和保密性要求,用戶對數(shù)據(jù)安全的要求較高。研發(fā)團隊在技術(shù)選型過程中,充分考慮系統(tǒng)的穩(wěn)定性和安全性。采用GLM架構(gòu)大語言模型作為推理基座,并結(jié)合非結(jié)構(gòu)化存儲及文本向量嵌入技術(shù)進行二次開發(fā),系統(tǒng)實現(xiàn)全部用戶數(shù)據(jù)資料的可控訪問及安全管理,可在非聯(lián)網(wǎng)、局域網(wǎng)和專網(wǎng)環(huán)境下運行使用,杜絕用戶信息泄露,確保用戶數(shù)據(jù)安全。
目前,生態(tài)環(huán)境大語言模型智能AI助手模型系統(tǒng)仍在持續(xù)優(yōu)化和完善過程中,并同步在省生態(tài)環(huán)境廳、南京市生態(tài)環(huán)境局開展產(chǎn)品試用。后續(xù),監(jiān)測監(jiān)控公司研發(fā)團隊將積極對接用戶需求,通過產(chǎn)品試用等方式持續(xù)收集用戶意見,改進產(chǎn)品性能,有效提升生態(tài)環(huán)境文本大數(shù)據(jù)分析利用能力,服務(wù)生態(tài)環(huán)境數(shù)字化和智能化治理。
版式:莊 遠(yuǎn)
審校: 吳亞兵
原標(biāo)題:產(chǎn)學(xué)研用融合共進丨省生態(tài)環(huán)境監(jiān)測監(jiān)控有限公司推動大語言模型在生態(tài)環(huán)境領(lǐng)域創(chuàng)新研發(fā)應(yīng)用
昵稱 驗證碼 請輸入正確驗證碼
所有評論僅代表網(wǎng)友意見,與本站立場無關(guān)