2025-02-27
1月20日,Deep-Seek-R1模型正式發布,并同步開源模型權重。憑借遠低于行業平均成本的研發投入,多模態交互、低能耗運算、多語言適配等關鍵技術的突破,以及模型推理能力的極大提升,DeepSeek進一步加速人工智能應用的普及,迅速成為全球科技界關注的焦點。
激活人工智能在氣象監測、預報和服務中作用,也是近年來中國氣象局持續發力探索的重要領域。氣象專家發現,借助深度學習算法以及多頭潛在注意力(MLA)機制、混合專家模型(MoE)架構、強化學習(RL)、知識蒸餾等關鍵技術,DeepSeek能在高效處理衛星圖像、雷達數據和地面觀測數據,快速分析并提煉復雜關鍵氣象信息,壓減人工處理時間和降低成本,加速氣象預報智能化步伐,以及賦能精細氣象服務等方面發揮重要作用。可以說,DeepSeek等大語言模型為加速推進氣象服務智能化發展提供了一把關鍵“鑰匙”。
全流程賦能氣象數據信息
點擊進入氣象大數據云平臺“天擎”,2500余種氣象服務數據、2000余個數據要素、1000余個數據接口相繼呈現。
“用戶要找到自己所需要的數據或要素,選擇合適的接口調用服務等,往往要在網站上花時間熟悉說明文檔,所以我們開發了智能‘小助手’——ChatMUSIC。”何文春介紹,用戶只需通過自然語言對話,說出自己想要的數據,例如“獲取昨日全國范圍降水量最大的前10個站點數據”,ChatMUSIC便能馬上識別其需求,生成數據獲取代碼,同時提供數據樣例及可視化圖形。
ChatMUSIC是國家氣象信息中心(以下簡稱“信息中心”)探索人工智能氣象應用的一個縮影。而氣象信息領域有關大語言模型的部署,則可追溯至2023年7月。為支持國家氣象中心(中央氣象臺)等單位的生成式人工智能應用,信息中心陸續部署了智譜GLM、通義千問、書生浦語等大語言模型。2月8日,DeepSeek-R1 671B模型在中國氣象局氣象超算中心(和林格爾)完成本地化部署,將ChatMUSIC與DeepSeek對接,開始測試網頁對話交互應用。
“從目前的測試來看,DeepSeek具有較強的計算分析和模型優化能力,其在推理邏輯、自我反思以及對中文語言的語義理解和生成等方面質量更優。”何文春介紹,這樣的強推理模型對氣象數據全流程賦能具有重要意義,例如結合當前地球系統大數據平臺建設發展,DeepSeek可根據不同業務需求,通過互聯網在全球范圍內主動識別發現有價值的地球系統科學數據,并進行清洗處理。在數據存儲與服務方面,DeepSeek等大語言模型則能根據用戶訪問需求,合理規劃和動態調整各層級數據布局,以更簡潔、自然的方式優化用戶交互體驗,“大家可以使用自然語言代替界面操作和程序開發等方式使用數據資源。”何文春說。此外,DeepSeek在業務運維、政務辦公、安全風險研判等方面也具有很好的應用前景。
在地球系統科學研究中,代碼編寫和審查是關鍵環節之一,涉及復雜的技術學習和語法分析任務。以往,科研人員需耗費大量時間和精力編寫代碼,且人工審查代碼時難免出現疏漏。如今,DeepSeek等大語言模型可在其中發揮關鍵作用。
近日,中國氣象局地球系統數值預報中心(以下簡稱“數值預報中心”)通過DeepSeek-R1大模型輔助科研工作。“通過對海量代碼數據的學習,它能夠根據科研人員的自然語言描述,快速生成高質量代碼框架,涵蓋Python、Fortran等多種常用于地球科學研究的編程語言。”肖華東說,對于通常的數據處理和產品繪制代碼開發,只需通過交互方式依次輸入代碼的要求,DeepSeek-R1大模型就能迅速生成結構清晰的基礎代碼,科研人員在此基礎上進行微調即可,縮短了開發周期;在代碼審查方面,它能依據行業標準和常見錯誤模式,檢測出代碼中的語法錯誤、邏輯漏洞以及潛在的性能問題,并給出修改建議,提供詳盡和規范的代碼標注。
面對海量氣象數據的處理和加工,DeepSeek可促進天氣雷達、地基遙感等各類異構、多模態遙感觀測數據的高質量融合,幫助解決當前氣象監測數據獲取和處理中存在多源異構性、時空不一致性以及精度不足等問題。“我們還可以考慮通過智能算法優化觀測站點的選址和布局,如運用遺傳算法、模擬退火算法綜合考慮地形、人口密度、歷史災害記錄、城市功能區分布等因素。伴隨算法的完善改進,蒸餾專有的觀測站網布局模型,為科學規劃觀測站網提供支撐,進而提升探測效益。”雷勇介紹,通過構建面向裝備保障的自然語言模型,發展人工智能會話式遠程故障技術支持系統等,還將有效提升氣象觀測數據的運維保障效率。
除了在氣象數據各環節有應用價值外,DeepSeek在模型架構和優化、跨學科協作以及實際場景落地等方面的經驗也值得借鑒。
針對計算機系統各組成部件特性,DeepSeek開展了諸多精細的優化軟件設計開發。“這對于我們下一代數值預報模式的計算效率優化具有很好的參考借鑒意義,后續模式代碼的計算優化需更多考慮軟硬件協同,針對機器特性展開精巧設計。”陸其峰介紹,此外,還可在數值預報模式開發及各流程中應用DeepSeek模型的特色技術,如在觀測資料預處理、同化極小化算法、四維變分切線性伴隨方程求解、模式動力計算等環節精巧利用人工智能技術實現改進及融合,進而提高精度及計算效率。
多場景深化氣象預報服務
作為AI領域的一顆新星,DeepSeek也深刻影響著氣象服務的個性化升級、氣象災害預警能力的增強以及氣象服務與各行業的深度融合,為氣象預報和服務注入前所未有的動力。
去年6月,中國氣象局相繼發布“風清”“風雷”“風順”三個氣象專業領域預報預測大模型,完成了基于國產全球大氣再分析資料CRA-40、雷達觀測資料、風云衛星遙感資料的模型訓練和檢驗評估,進一步提升大氣運動、天氣現象的預報精度。對比來看,盡管目前DeepSeek等大語言模型無法直接提高氣象預報預測的準確率,“但氣象數據包含衛星云圖、雷達回波、地面觀測、數值模式輸出等多源異構數據,具有時空密集、高維度、多模態的特點,可以參考DeepSeek跨模態模型(如文本—圖像聯合訓練)技術,構建氣象領域的多模態融合端到端模型(如結合衛星圖像與數值預報數據),進而提升災害性天氣預報預測精度。”代刊說,我們也可以借鑒其MoE專家模型等架構,優化氣象預報大模型的多任務處理能力。
“氣象垂直行業模型的研發,是DeepSeek應用的一個重要方向。”王亞強指出,DeepSeek的開源特性與本地部署能力,使其能夠方便地應用于垂直行業模型的研發,同時避免數據泄露的風險。氣象垂直模型可為研究人員在推理診斷、問答服務、智能代理等方面提供新的助力,以及構建本地化氣象智能體,從而為氣象預報的精準化提供更加堅實的支撐。
此外,DeepSeek用到的模型訓練技術可以借鑒到氣象預報人工智能大模型的研發中。模型微調與知識蒸餾技術能將氣象物理模型中的有效信息提取出來,簡化為更高效、精準的計算模型,從而有效提升氣象預報大模型的預測能力與精度。知識蒸餾技術還能顯著降低大模型訓練的算力和存儲需求,提升模型訓練效率和精度,為氣象預報和服務提供更高效的解決方案。此外,強化學習技術的加入,可以為氣象預報大模型在環境氣象、交通氣象、農業氣象等領域的專業拓展提供支撐。
在智能氣象服務方面,國家氣象中心于2023年啟動了以“智腦”為核心的下一代天氣預報業務一體化平臺建設。通過基于大語言模型打造預報員智能體——“數字預報員助手”,預報員可以在天氣分析、模式診斷、預報研判和產品生成等環節實現效率的顯著提升。代刊介紹,該系統涵蓋聊天、知識庫問答、材料生成、翻譯和工具箱等模塊,初步實現了氣象專業知識檢索、與部分業務網站自動交互、歷史天氣個例檢索、預報服務材料生成等功能,將有效幫助預報員快速精準地獲取、處理、制作氣象信息和產品。
隨著技術發展和服務升級,氣象服務不僅僅是天氣預報的簡單輸出,個性化、精準化的氣象服務體系逐漸成為行業發展的新趨勢。王慕華認為,DeepSeek在深度推理技術方面的優勢,可以用來執行復雜的多步驟研究任務,有效提高氣象數據檢索的準確性和服務內容的生成質量。
與此同時,中國氣象局公共氣象服務中心已在“風和”氣象服務大模型中集成DeepSeek-R1,極大提升模型的深度推理能力。該模型依托智譜GLM和其他開源的通用大模型,結合大規模氣象書籍、氣象科普網站、氣象服務材料等專業氣象語料和知識庫,進行預訓練和微調,構建氣象服務垂域基座大模型。通過AI Agent平臺(一種以大語言模型為大腦驅動的系統),擴展接入權威氣象數據和氣象工具,構建基于“風和”的氣象服務智能體平臺,適應不同應用場景。通過技術創新,氣象服務不僅在精度和時效上得到顯著提升,更能與農業、交通、能源、旅游、健康等行業深度融合,為各行業發展提供更精確、更高效的氣象支撐,形成氣象服務智能應用新生態。
例如,在預警領域,“風和”+DeepSeek可以實現分眾化預警信息傳播和靶向發布,確保老人、殘障人士等特殊人群獲取氣象服務的公平性;在農業領域,“風和”+DeepSeek可以通過精準天氣預報和農事建議,幫助農民合理安排生產,優化農業效益……提升社會整體氣象服務的價值與影響力。
挑戰和機遇
DeepSeek的全面應用仍面臨著一些挑戰。大語言模型并非“開箱即用”,當前氣象部門構建智能應用的環境與現有業務的算法、插件、接口等開發資源尚未完全打通,且未建立起規則完善、標準統一、安全可靠的人工智能氣象語料庫。
眼下,各級氣象部門都在探索推進DeepSeek的應用。鄧鑫表示,信息中心正加快完善氣象人工智能基礎支撐技術平臺的建設,為用戶提供統一的大模型部署和一站式的智能應用開發環境,升級氣象大數據云平臺能力,提供數據、算力、算法、組件、接口、智能等統一支撐,確保穩定安全。
隨著人工智能技術的迅猛發展,氣象領域正在迎來深刻變革。然而,如何將這些前沿技術與氣象業務實際需求緊密結合,仍然是一個值得深入探討的課題。這要求氣象部門在積極推進技術應用的同時,更加審慎地思考如何注重多維度的合作與探索,確保模型能夠真正為氣象預報、氣候變化研究、災害響應等提供切實可行的解決方案,為氣象事業發展寫好“高質量”注解。