移動端


多模態(tài)地理科學大模型“坤元”發(fā)布 推動地理學與人工智能深度融合

2024-09-24 14:24:02來源:中國科學院自動化研究所 閱讀量:63 評論

分享:

導讀:大模型是指通過海量數(shù)據(jù)訓練的深度學習模型,具備強大的語言理解、信息生成和處理能力?!袄ぴ笔菍W⒂诘乩砜茖W的專業(yè)語言大模型,具備處理地理科學相關(guān)問題的專業(yè)能力。

  9月19日,中國科學院地理科學與資源研究所聯(lián)合中國科學院青藏高原研究所、中國科學院自動化研究所等單位研發(fā)的多模態(tài)地理科學大模型“坤元”(Sigma Geography)正式發(fā)布。
 
  大模型是指通過海量數(shù)據(jù)訓練的深度學習模型,具備強大的語言理解、信息生成和處理能力。“坤元”是專注于地理科學的專業(yè)語言大模型,具備處理地理科學相關(guān)問題的專業(yè)能力。研發(fā)團隊完成了地理學全譜系高質(zhì)量語料庫構(gòu)建、地理科學語言大模型構(gòu)建、地理科學研究智導平臺研發(fā)等工作,讓“坤元”具備“懂地理”“精配圖”“知人心”“智生圖”等特點,實現(xiàn)了地理專業(yè)問題解答、地理學文獻智能分析、地理數(shù)據(jù)資源查詢、地理數(shù)據(jù)挖掘分析、專題地圖繪制等功能。
 
  在“懂地理”方面,該團隊建立了涵蓋4大類、16小類的地理全學科語料庫,提供了320億詞元供大模型自監(jiān)督學習,制作了4萬余條高質(zhì)量地理學指令進行模型微調(diào)。與通用語言大模型相比,“坤元”更熟悉地理學的語言模式、專業(yè)術(shù)語和領(lǐng)域知識,并在地理學基準測試集上的準確性提升了31.3%。
 
  在“精配圖”方面,該團隊自主研發(fā)了面向多層次地圖信息的多模態(tài)檢索技術(shù)以及支持地理認知與圖形表達的知識推理技術(shù)。這些技術(shù)使得“坤元”能夠在解答地理學提問的同時,可以根據(jù)生成的文字答案檢索不同地理要素,并匹配地理景觀照片、專題地圖或示意圖表呈現(xiàn)給提問者。
 
  在“知人心”方面,該團隊創(chuàng)新性地提出了基于“認知啟航-應用智導-前沿研析”框架的用戶畫像精準判別與響應技術(shù),保證“坤元”能夠充分考慮地理知識愛好者、地理學專業(yè)學生和科研人員的地理科學知識體系認知和表達差異,以圖文共現(xiàn)的方式給出適配用戶知識結(jié)構(gòu)的地理學專業(yè)問題解答。
 
  在“智生圖”方面,該團隊基于“坤元”開發(fā)的科研助手,可以根據(jù)用戶指令完成概念理解、數(shù)據(jù)獲取、信息分析、制圖綜合等流程,生成用戶需要的專業(yè)地理圖表。
 
  “坤元”旨在拓寬普通大眾的地理視野,解放地理從業(yè)者的雙手,推動地理智能發(fā)展,賦能地理科學研究,加速重要地理科學發(fā)現(xiàn)。目前,“坤元”已支撐發(fā)表Nature子刊、The innovation、Earth’s Future等高水平學術(shù)論文10余篇。未來,研發(fā)團隊將推進地圖大模型與地理推理機研發(fā),以期讓地理科學語言大模型讀懂地圖;將打造地理科研協(xié)作大平臺,以期讓每個科學家和科研團隊都可以擁有專屬的地理大模型,并能夠與數(shù)百萬科學家通過共享數(shù)據(jù)、模型、研究思路等方式協(xié)同工作。
 
多模態(tài)地理科學大模型“坤元”
版權(quán)與免責聲明:1.凡本網(wǎng)注明“來源:興旺寶裝備總站”的所有作品,均為浙江興旺寶明通網(wǎng)絡有限公司-興旺寶合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應在授權(quán)范圍內(nèi)使用,并注明“來源:興旺寶裝備總站”。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責任。 2.本網(wǎng)轉(zhuǎn)載并注明自其它來源(非興旺寶裝備總站)的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點或和對其真實性負責,不承擔此類作品侵權(quán)行為的直接責任及連帶責任。其他媒體、網(wǎng)站或個人從本網(wǎng)轉(zhuǎn)載時,必須保留本網(wǎng)注明的作品第一來源,并自負版權(quán)等法律責任。 3.如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。
我來評論

昵稱 驗證碼

文明上網(wǎng),理性發(fā)言。(您還可以輸入200個字符)

所有評論僅代表網(wǎng)友意見,與本站立場無關(guān)

    相關(guān)新聞