中國(guó)10億參數(shù)規(guī)模以上大模型已發(fā)布79個(gè),集中在北京和廣東
發(fā)布時(shí)間:2023-05-28 18:41:56 文章來源:澎湃新聞
·據(jù)不完全統(tǒng)計(jì),目前中國(guó)10億參數(shù)規(guī)模以上的大模型已發(fā)布79個(gè),14個(gè)省市/地區(qū)都在開展大模型研發(fā),主要集

·據(jù)不完全統(tǒng)計(jì),目前中國(guó)10億參數(shù)規(guī)模以上的大模型已發(fā)布79個(gè),14個(gè)省市/地區(qū)都在開展大模型研發(fā),主要集中在北京和廣東,其中北京38個(gè)大模型,廣東20個(gè)大模型。中國(guó)大模型中,已有半數(shù)以上大模型開源,高校/科研機(jī)構(gòu)是開源主力。

·北京、江蘇、廣東、上海等是大模型人才相對(duì)較多的地區(qū),為大模型研發(fā)提供關(guān)鍵智力要素支撐。但人才總量仍然稀缺,大模型具有較高門檻,需要高素質(zhì)AI人才,目前各地大模型人才數(shù)量均不充足。

中國(guó)10億參數(shù)規(guī)模以上的大模型已發(fā)布79個(gè),主要集中在北京和廣東。


(資料圖片僅供參考)

5月28日,在2023中關(guān)村論壇平行論壇之一的人工智能大模型發(fā)展論壇上,中國(guó)科學(xué)技術(shù)信息研究所所長(zhǎng)趙志耘發(fā)布《中國(guó)人工智能大模型地圖研究報(bào)告》,目前中國(guó)10億參數(shù)規(guī)模以上的大模型已發(fā)布79個(gè),主要集中在北京和廣東,其中北京38個(gè)大模型,廣東20個(gè)大模型。中國(guó)大模型中,已有半數(shù)以上大模型開源,高校/科研機(jī)構(gòu)是開源主力。

2017年谷歌發(fā)布的Transformer網(wǎng)絡(luò)結(jié)構(gòu)是大模型發(fā)展的源頭技術(shù),自此以后大模型技術(shù)在自然語(yǔ)言理解、計(jì)算機(jī)視覺、智能語(yǔ)音等方面都取得了標(biāo)志性的技術(shù)突破,在模型精度、通用性和泛化能力等方面都實(shí)現(xiàn)了跨越式發(fā)展。ChatGPT又進(jìn)一步激發(fā)了語(yǔ)言大模型爆發(fā)式涌現(xiàn),也吸引了大量研發(fā)團(tuán)隊(duì)投入到通用視覺、多模態(tài)等更多大模型研發(fā)方向。趙志耘表示,僅用5年多時(shí)間,大模型技術(shù)已形成龐大技術(shù)群,衍生出涵蓋各種參數(shù)規(guī)模、各種技術(shù)架構(gòu)、各種模態(tài)、各種場(chǎng)景的大模型家族。

從全球大模型發(fā)展態(tài)勢(shì)來看,美國(guó)谷歌、OpenAI等機(jī)構(gòu)不斷引領(lǐng)大模型技術(shù)前沿,歐洲、俄羅斯、以色列等越來越多的研發(fā)團(tuán)隊(duì)也在投入到大模型的研發(fā)中。從全球已發(fā)布的大模型分布來看,中國(guó)和美國(guó)大幅領(lǐng)先,超過全球總數(shù)的80%,美國(guó)在大模型數(shù)量方面始終居全球最高,中國(guó)從2020年進(jìn)入大模型快速發(fā)展期,目前與美國(guó)保持同步增長(zhǎng)態(tài)勢(shì)。

在中國(guó)大模型的發(fā)展態(tài)勢(shì)中,趙志耘表示,據(jù)不完全統(tǒng)計(jì),到目前為止中國(guó)10億參數(shù)規(guī)模以上的大模型已發(fā)布79個(gè),14個(gè)省市/地區(qū)都在開展大模型研發(fā),主要集中在北京和廣東,其中北京38個(gè)大模型,廣東20個(gè)大模型。在模型領(lǐng)域分布上,自然語(yǔ)言處理仍是目前大模型研發(fā)最活躍的重點(diǎn)領(lǐng)域,其次是多模態(tài)領(lǐng)域,在計(jì)算機(jī)視覺和智能語(yǔ)音等領(lǐng)域的大模型還較少。在研發(fā)主體分布上,大學(xué)、科研機(jī)構(gòu)、企業(yè)等不同創(chuàng)新主體都在參與大模型研發(fā),學(xué)術(shù)界和產(chǎn)業(yè)界之間的聯(lián)合研發(fā)仍不足?!敖衲暌詠泶竽P陀兄焖侔l(fā)展的態(tài)勢(shì),但我們同時(shí)也觀察到了合作收縮的趨勢(shì),接下來需要注意。”

與此同時(shí),算力-模型匹配度高,公共算力發(fā)展迅速。北京、廣東、浙江、上海等地的大模型數(shù)量最多,這四個(gè)地方也是近三年人工智能服務(wù)器采購(gòu)數(shù)量最高的地區(qū)。各地也在通過提供公共算力方式補(bǔ)充快速增長(zhǎng)的人工智能算力需求,為大模型研發(fā)提供更多算力支持。

人才也是人工智能的重要支柱。北京、江蘇、廣東、上海等是大模型人才相對(duì)較多的地區(qū),為大模型研發(fā)提供關(guān)鍵智力要素支撐。但人才總量仍然稀缺,大模型具有較高門檻,需要高素質(zhì)AI人才,目前各地大模型人才數(shù)量均不充足。

“通過大模型的論文發(fā)布,我們可以看到中國(guó)大模型的學(xué)術(shù)影響力正在逐步形成。從區(qū)域影響力來看,北京、廣東、上海三地?zé)o論是論文數(shù)量還是論文引用量都在國(guó)內(nèi)最高?!壁w志耘表示,清華大學(xué)與阿里和百度聯(lián)合開發(fā)的CogView模型論文引用數(shù)最高。但與國(guó)外領(lǐng)先大模型的學(xué)術(shù)影響力相比差距仍然較大。

從開源創(chuàng)新生態(tài)上看,中國(guó)大模型中,已有半數(shù)以上大模型開源,北京、廣東、上海三地開源數(shù)量和開源影響力均居國(guó)內(nèi)前三。高校/科研機(jī)構(gòu)是開源主力,“清華大學(xué)的ChatGLM-6B、復(fù)旦大學(xué)的MOSS以及百度的文心系列大模型開源影響力最高?!壁w志耘表示。

中國(guó)大模型的產(chǎn)業(yè)化應(yīng)用沿著兩條路徑發(fā)展,第一種是通用類大模型持續(xù)拓展應(yīng)用領(lǐng)域,文心一言、通義千問、紫東太初、星火認(rèn)知等中國(guó)一批通用化大模型正在快速發(fā)展,打造跨行業(yè)通用化人工智能能力平臺(tái),其應(yīng)用行業(yè)正在從辦公、生活、娛樂向醫(yī)療、工業(yè)、教育等加速滲透。第二種是垂直領(lǐng)域?qū)I(yè)類大模型不斷深化落地,一批針對(duì)生物醫(yī)藥、遙感氣象等垂直領(lǐng)域的專業(yè)大模型發(fā)揮其領(lǐng)域縱深優(yōu)勢(shì),提供針對(duì)特定業(yè)務(wù)場(chǎng)景的高質(zhì)量專業(yè)化解決方案。

倡導(dǎo)加強(qiáng)資源和研發(fā)力量的統(tǒng)籌,促進(jìn)大模型有序發(fā)展。

針對(duì)大模型發(fā)展的不足,趙志耘提出4點(diǎn)建議與展望:

一是加強(qiáng)資源和研發(fā)力量的統(tǒng)籌,促進(jìn)大模型有序發(fā)展。通過加強(qiáng)智算中心、超算中心、云計(jì)算中心等計(jì)算資源的統(tǒng)籌,制定公共數(shù)據(jù)共享目錄和共享規(guī)則,推動(dòng)數(shù)據(jù)分級(jí)分類有序開放。

二是加快基礎(chǔ)研究和技術(shù)創(chuàng)新,提升學(xué)術(shù)和開源影響力。大模型技術(shù)仍處于發(fā)展初期,潛在的基礎(chǔ)理論和技術(shù)創(chuàng)新空間巨大。通過蒸餾、量化等小型化技術(shù)實(shí)現(xiàn)模型“瘦身”,為大模型小型化、綠色化發(fā)展提供技術(shù)支撐。進(jìn)一步加強(qiáng)產(chǎn)學(xué)研合作,鼓勵(lì)大模型開源開放,也將加速大模型技術(shù)進(jìn)步。

三是強(qiáng)化大模型發(fā)展中的場(chǎng)景牽引作用,打造大模型標(biāo)桿項(xiàng)目。以行業(yè)專有訓(xùn)練數(shù)據(jù)集為基礎(chǔ),打造金融、醫(yī)療、電力等領(lǐng)域的專業(yè)大模型,在特定業(yè)務(wù)場(chǎng)景實(shí)現(xiàn)高質(zhì)量應(yīng)用突破,也希望通過應(yīng)用場(chǎng)景和應(yīng)用數(shù)據(jù)反向促進(jìn)大模型技術(shù)迭代升級(jí)。

四是強(qiáng)化國(guó)際合作,積極參與全球人工智能治理。以負(fù)責(zé)任的態(tài)度共同推動(dòng)大模型的治理,希望人工智能的治理原則和倫理規(guī)范能夠進(jìn)一步在大模型的全鏈條中落地生根。同時(shí)在增進(jìn)共識(shí)的基礎(chǔ)上加強(qiáng)人工智能治理的全球合作。

標(biāo)簽:

資訊播報(bào)

樂活HOT

  • 《熊出沒·伴我“熊芯”》票房破10億 打破內(nèi)地影史春節(jié)檔動(dòng)畫片紀(jì)錄
    《熊出沒·伴我“熊芯”》票房破

    據(jù)各方數(shù)據(jù),1月31日上午10時(shí)許,深圳出品的動(dòng)畫電影《熊出沒·伴我熊芯》票房突破10億元,在首日票房、檔期票房、連續(xù)破億天數(shù)等多方面打

  • 今年春節(jié)深圳游客出境游訂單量大幅增加 曼谷等地成為最受歡迎目的地
    今年春節(jié)深圳游客出境游訂單量大

    1月27日,攜程發(fā)布的《2023年春節(jié)旅游總結(jié)報(bào)告》顯示,今年春節(jié),深圳游客的出境游訂單量同比去年增長(zhǎng)近5倍。相較國(guó)內(nèi)熱門景點(diǎn)的人山人海,

  • 2023年春節(jié)黃金周深圳共接待游客469.25萬(wàn)人次 旅游收入31.58億元
    2023年春節(jié)黃金周深圳共接待游客

    1月27日,記者從深圳市文化廣電旅游體育局獲悉,2023年春節(jié)黃金周期間(1月21日至27日),深圳共接待游客469 25萬(wàn)人次,旅游收入31 58億元,

  • 深圳機(jī)場(chǎng)連續(xù)多日客流量超過10萬(wàn)人次 衛(wèi)星廳迎來首個(gè)大客流春運(yùn)
    深圳機(jī)場(chǎng)連續(xù)多日客流量超過10萬(wàn)

    據(jù)深圳市春運(yùn)辦統(tǒng)計(jì),1月15日和16日連續(xù)兩天,深圳對(duì)外發(fā)送旅客人數(shù)都在48萬(wàn)左右,春運(yùn)進(jìn)入客流高峰期。1月15日,深圳春運(yùn)對(duì)外旅客發(fā)送量達(dá)

  • 深圳交響樂團(tuán)將將舉辦兩場(chǎng)音樂會(huì) 以世界經(jīng)典管弦樂和歌劇詠嘆調(diào)為主
    深圳交響樂團(tuán)將將舉辦兩場(chǎng)音樂會(huì)

    新年音樂會(huì)是觀眾喜聞樂見的年度重要文化品牌活動(dòng),多年來已成為深圳市民跨歲迎新的例牌項(xiàng)目。12月30日、31日晚,深圳交響樂團(tuán)將在深圳音樂

  • 深圳大力推進(jìn)實(shí)施人才強(qiáng)市戰(zhàn)略 深圳市人才總量已達(dá)到663萬(wàn)人
    深圳大力推進(jìn)實(shí)施人才強(qiáng)市戰(zhàn)略

    作為來深科研人員中的一員,中山大學(xué)附屬第八醫(yī)院的助理研究員郭雅婕對(duì)深圳在人才服務(wù)方面的舉措贊不絕口:我作為基礎(chǔ)研究人員,很希望自己

  • 2023年故宮年票正式開售 有消費(fèi)者目前仍對(duì)購(gòu)買年票持觀望態(tài)度
    2023年故宮年票正式開售 有消費(fèi)

    12月1日晚8點(diǎn),2023年故宮年票正式開售。相比于去年,今年購(gòu)票順暢了許多。據(jù)了解,2022年故宮年票發(fā)售時(shí),因短時(shí)間內(nèi)購(gòu)買年票人數(shù)過多,曾

  • 御寒類商品消費(fèi)需求有所上升 羽絨服的整體銷售額同比增長(zhǎng)達(dá)100%
    御寒類商品消費(fèi)需求有所上升 羽

    昨日,冷空氣到達(dá),廣州氣溫逐步下降。據(jù)商超方面預(yù)測(cè),隨著氣溫的逐漸下降,市民對(duì)于御寒類商品消費(fèi)需求有所上升,不少?gòu)V州商超準(zhǔn)備了有關(guān)

  • 深圳全市共排查窨井蓋約350萬(wàn)個(gè) 發(fā)現(xiàn)存在問題的窨井蓋約3.2萬(wàn)個(gè)
    深圳全市共排查窨井蓋約350萬(wàn)個(gè)

    小井蓋、大民生。今年以來,深圳開展全市窨井蓋專項(xiàng)治理工作成效顯著。截至11月20日,全市共排查窨井蓋約350萬(wàn)個(gè),發(fā)現(xiàn)存在問題的窨井蓋約3

  • 汕汕鐵路汕頭站公布最新動(dòng)態(tài) 首期工程預(yù)計(jì)將于2024年11月完成
    汕汕鐵路汕頭站公布最新動(dòng)態(tài) 首

    備受關(guān)注的汕汕(汕頭至汕尾)鐵路汕頭站及站區(qū)工程近日傳出最新動(dòng)態(tài):項(xiàng)目已順利完成工程招標(biāo)工作,由中鐵建設(shè)集團(tuán)有限公司中標(biāo)承建。目前,

娛樂LOVE

精彩推送