我國研發(fā)的全球首個多模態(tài)地理科學大模型“坤元”近日在京發(fā)布。“坤元”由中國科學院地理科學與資源研究所、中國科學院青藏高原研究所、中國科學院自動化研究所等單位共同研發(fā)。
A geographic sciences multi-modal Large Language Model, the first of its kind in the world, was unveiled in Beijing. The model, named Sigma Geography, was developed by a team of researchers from the Institute of Geographic Sciences and Natural Resources Research, the Institute of Tibetan Plateau Research and the Institute of Automation, all under the Chinese Academy of Sciences, and other organizations.
【知識點】
多模態(tài)地理科學大模型“坤元”是專注于地理科學的專業(yè)語言大模型,具備“懂地理”“精配圖”“知人心”“智生圖”等特點,可實現(xiàn)地理專業(yè)問題解答、地理學文獻智能分析、地理數(shù)據(jù)資源查詢、地理數(shù)據(jù)挖掘分析、專題地圖繪制等功能,有望賦能地理科學研究,加速重大地理科學發(fā)現(xiàn)。
據(jù)介紹,研發(fā)團隊建立了涵蓋4大類、16小類的地理全學科語料庫,提供320億詞元供大模型自監(jiān)督學習,并制作了4萬余條高質(zhì)量地理學指令進行模型微調(diào)。相比通用語言大模型,“坤元”更熟悉地理學的語言模式、專業(yè)術(shù)語和領(lǐng)域知識。
“坤元”可以根據(jù)生成的文字答案檢索不同地理要素,并匹配地理景觀照片、專題地圖或示意圖表呈現(xiàn)給提問者;可以根據(jù)用戶指令完成概念理解、數(shù)據(jù)獲取、信息分析等流程,最終生成用戶需要的專業(yè)地理圖表;還能充分考慮不同類型用戶的地理知識結(jié)構(gòu)和表達差異,給出適配不同用戶的專業(yè)解答。
【函電賀詞】
當前,互聯(lián)網(wǎng)、大數(shù)據(jù)、云計算、人工智能、區(qū)塊鏈等新技術(shù)深刻演變,產(chǎn)業(yè)數(shù)字化、智能化、綠色化轉(zhuǎn)型不斷加速,智能產(chǎn)業(yè)、數(shù)字經(jīng)濟蓬勃發(fā)展,極大改變?nèi)蛞刭Y源配置方式、產(chǎn)業(yè)發(fā)展模式和人民生活方式。
New technologies such as the internet, big data, cloud computing, artificial intelligence and blockchain are undergoing profound changes; the digitalized, intelligent and green transformation of industries are accelerating; and the intelligent industry and digital economy are thriving. These have greatly changed the global allocation of factors and resources, industrial development models, and people's lifestyles.
——2023年9月4日,習近平致2023中國國際智能產(chǎn)業(yè)博覽會的賀信
【相關(guān)詞匯】
月球科學多模態(tài)專業(yè)大模型
professional, multimodal large language model for the field of lunar science
大數(shù)據(jù)
big data
中國日報網(wǎng)英語點津工作室(本文于“學習強國”學習平臺首發(fā))