國產大模型最新進展,這次來自“國家隊”!
剛剛,全棧國產化生態大模型“九天智能基座”正式發布!
它由中國移動自研。包括萬卡算力、千億模型及百匯平臺三部分。
其中模型部分是九天自主研發的從算子到框架全棧國產訓練的千億參數大模型,能力達到GPT-4的90%水平。
以它為底座,已經布局17個細分領域行業大模型,覆蓋政務、醫療、辦公、金融風控、客服、代碼等行業。
算力方面,中國移動宣布年內將建成3個國產近2萬卡智算中心。此外,還發布了AI+5G新通話,AI+辦公等23個AI軟硬產品,AI+工業、AI+交通等20個行業應用。
沒想到,大模型“國家隊”進展已經如此迅速了。
自大模型趨勢開始,運營商等央企就開始將注意力集中到AI自研與行業落地上,為大模型國產自主化持續加碼。歷時一年多,成果開始不斷涌現。
那么,當下大模型“國家隊”進展究竟如何了?
來參考中國移動的最新發布。
“萬百千”智能基座發布
今年數字中國峰會上,中國移動發布的核心內容為1套“萬百千”智能基座、3大產業融通基地、N個AI+產品及應用。
其中,“萬百千”智能基座正是指“九天智能基座”,它由萬卡算力、千億參數模型及百匯平臺組成。
算力方面,中國移動將要建成智算網絡新集群。年內將投產3個近2萬卡超大規模單體智算中心和12個區域智算中心,廣泛升級1500個邊緣節點,將訓/推算力資源配比上升至1:10。建成的單體智算中心可為萬億、千億等超大參數模型訓練提供澎湃算力。
模型方面,九天基座大模型聚焦解決行業復雜系統智能化難題,實現行業定向增強、行業模態匹配、全棧國產化、安全可信等四大技術突破。
行業定向增強方面,在全球海量通識知識基礎上,模型針對通信、電力、運輸、能源等行業專業知識進行增強。成為國內預訓練行業數據占比最高的大模型,達10%。
行業模態匹配方面,九天獨創了結構化數據大模型,能夠更好面向千行百業處理復雜的產業結構化數據。同時構建了語音、視覺、文本等方面能力,可為不同行業提供所需的模態能力。
國產化方面,九天已實現數據構建、預訓練、微調、部署全鏈路核心技術自主創新,適配國產算力,實現全棧國產。
安全可信方面,九天已建立數據指令評估體系,同時加強數據處理和清洗、優化DPO算法、加強人類價值觀對齊,確保模型實現指令安全相應。九天是唯一通過雙備案的央企背景大模型,并獲得中國軟件測評中心安全測評的最高等級A級證書。
基于千億基座大模型,中國移動已研發工程設計、金融風控等17款行業大模型,未來還將布局40款自研行業大模型,賦能生產、生活、社會治理等創新升級。
平臺方面,匯聚平臺是一個鏈接大模型廠商和用戶的平臺。它已匯聚并開放超30個“自有+開源+生態”大模型、超20個高質量數據集,包含模型體驗、調優、部署、推理、評測全鏈條大模型開發工具,是一個大模型生產超級工廠。
一同亮相的三大產業融通基地,分別是訓練基地、評測基地和聯創基地,它們將助力大模型訓練更快、更好、應用落地更明確。
訓練基地優先開放內蒙千卡算力資源,年底開放萬卡算力資源;測試基地聯合賽迪,提供公正、優質大模型測評服務;產創基地開放北京、湖北、山東、福建,匯聚本地優質資源,可為本地央國企、頭部行業客戶、中小企業,提供AI+應用創新“試飛場”。
此外,依托中國移動AI技術的23款AI+產品及20個AI+DICT行業應用也一同亮相。比如,5G+AI新通話支持通話中實時轉寫、字幕翻譯;視頻彩鈴推出文生圖、文生音樂等功能。
以上就是此次中國移動帶來最新大模型進展。
實際上,不只是中國移動一家央企大力在大模型領域積極布局。不完全統計,幾大運營商、中國電科、國家電網、國投集團等央企都以不同方式完成入局。
為什么會出現這種現象?作為“國家隊”,它們又有哪些特別之處值得被關注?
為啥“國家隊”值得關注?
去年2月27日,國務院印發《數字中國建設整體布局規劃》。
其中重點提到,要夯實數字中國建設基礎,要全面賦能經濟社會發展,要強化數字中國關鍵能力,要優化數字化發展環境。
與此同時,ChatGPT掀起的大模型趨勢激流勇進。重視發展通用人工智能、把握人工智能等新科技革命浪潮,也被在幾次重要會議中提出。
在如此時代背景和發展要求下,運營商自然就走到了聚光燈下。
一方面,運營商有技術實力。
首先在算力方面,隨著“東數西算”工程啟動,運營商在建設算力網絡方面已悄然走在前列。
目前,我國運營商已經建立起全球規模最大的網絡。同時全國約50%以上的IDC(互聯網數據中心)都是由運營商提供。
云計算方面,IDC數據顯示,2023年下半年中國TOP5公有云IaaS廠商中有兩位都是運營商背景。比如移動云2023年收入已達833億元人民幣,同比增長率65.6%,在公有云服務市場位居國內第一陣營。
運營商先天具備網絡優勢,也進一步夯實其算力基礎。目前我國5G基站總數已達238.4萬個。
其次,運營商有數據優勢。
憑借此前與千行百業的合作,運營商已經積累了龐大業務數據,能夠快速構建稀缺數據集,更快訓出垂直行業大模型。而這些合作經驗也能讓運營商在實際合作中,更快推進技術落地。
同時,東數西算、東數西訓等工程的參與,也讓運營商構建了更靈活的數據流通能力。
最后,不少運營商在AI方面都有提前布局。
以中國移動為例,在2013年就成立了“九天”團隊,在機器視覺、語音、自然語言處理、網絡智能化等領域有多年技術積累。
另一方面,運營商也有身份優勢。
大模型趨勢是科技革命,也是全球競爭。隨著趨勢不斷發展,通用人工智能國產自主化越來越被重視。加之政務、交通等強調隱私保護的領域也在積極擁抱大模型,對數據安全的要求,都使得央企在競爭中具備獨特自身優勢。
這兩重優勢都讓大模型“國家隊”需要被重點關注。
更何況,“國家隊”的動向一定程度上反映國家對AI、大模型的重視程度,同時也能體現出我國大模型自研水平、國產自有化的能力。而且在落地上,央企更接近國民經濟骨干行業,比如通信、政務等,能更快促進我國整體生產力躍升。
不過隨著趨勢演進,“國家隊”成員之間的差距也在逐漸形成。比如帶來最新進展的中國移動,成為今年國家網信辦公布的已備案大模型清單中首家央企。
為什么是中國移動?它做對了什么?
為什么是中國移動?
過去1年里,中國移動完成了大模型領域的一系列發布。
去年世界人工智能大會上,中國移動在大模型領域的第一落子便是發布兩款行業大模型“九天·海算政務”和“九天·客服”。
幾個月后,中國移動又聯合多家央企發布“九天·眾擎基座大模型”。它主打融入各類專業知識,深度匹配行業需求。
今年早些時候,在國家網信辦公布的已備案大模型清單中,中國移動“九天自然語言交互大模型”名列其中。這是首個同時通過國家“生成式人工智能服務備案”和“境內深度合成服務算法備案”雙備案的央企大模型。目前已形成9B、13.9B、57B、千億等多種參數量版本,可靈活部署于云、邊、端不同場景。
以九天基礎大模型為基礎,中國移動已經推出了二十余個行業大模型,覆蓋政府治理、工業生產、民生服務和通信特色等領域,其中九天·客服大模型、九天·海算政務大模型等已經落地集團內外部客戶。
此外,中國移動還推出了一站式大模型開發平臺、大模型應用平臺(LLM Studio),面向個人及行業客戶提供從算力、數據、算法框架到研發工具的全棧人工智能服務。
梳理來看,中國移動的大模型戰略其實非常清晰:
依托自身技術積累及業務,形成從平臺、大模型及能力到規?;瘧玫娜娈a業級智能化服務能力。
據了解,中國移動原創性提出體系化人工智能(Holistic AI)技術,該技術具有AI服務大閉環、AI能力原子化重構、網絡原生和安全可信四大技術特征,通過體系化人工智能核心技術引擎,實現算力、網絡、人工智能能力全局統一調度和開放服務,從而構建了新型人工智能服務模式。
無疑,大模型浪潮這對于中國移動自身而言,是一次自我革新的機會,符合發展需求。運營商本身就是數字產業鏈條中的重要參與成員。如果不構建大模型能力,運營商只能“賣水”,在產業鏈中的話語權將可能逐漸被削弱。
對于國家而言,也需要中國移動這樣的運營商站出來,構建更加國有化的大模型能力。
在《數字中國建設整體布局規劃》中明確指出,要強化數字中國關鍵能力,構筑自強自立的數字技術創新體系,筑牢可信可控的數字安全屏障。
具體推進動作上,憑借扎實的技術積累,中國移動的步伐越走越快。
中國移動從11年前開始布局AI,長期關注CV、NLP等前沿AI領域技術,目前在內部建立了一支由馮俊蘭博士領軍的百人規模人工智能研發團隊。
馮俊蘭博士是IEEE Fellow、中國移動集團級首席科學家。于2001年在中國科學院獲得聲學博士學位,同年加入美國AT&T研究中心,曾任高級研究員、主任研究員,主要研究方向包括:語音識別、 語言理解和數據挖掘。
2013年9月加入中國移動研究院,一手帶出“九天”團隊。
目前,中國移動AI團隊發表國際頂會、頂刊論文150余篇,發明專利930項,頂級AI競賽TOP5獎項18項,主導了業界近九成網絡智能化領域國際標準。
同時在技術落地方面,中國移動也更加關注直接影響國民生活的領域。最新展示的行業大模型覆蓋醫療、辦公、物聯水利、網絡安全、社會綜合治理等領域。
數據顯示,九天”產品目前已服務超10億用戶、300家客戶、云邊端能力調用次數超9.6萬億,年賦能價值達41億元。
顯然,在輻射全社會、實現AI普惠、推進數字中國建設上,以中國移動為代表的“國家隊”正在異軍突起,它們在中國大模型浪潮中的地位將愈加不可取代。
而在這場波及全球的科技浪潮中,中國移動等運營商也在將中國的數字基建優勢進一步發揮釋放,為中國數字化建設提供獨有的一股驅動力。