<track id="zx7zx"><span id="zx7zx"><rp id="zx7zx"></rp></span></track>
<pre id="zx7zx"><strike id="zx7zx"></strike></pre>

<big id="zx7zx"><strike id="zx7zx"><rp id="zx7zx"></rp></strike></big>

<track id="zx7zx"></track>
展會信息港展會大全

直指AI發展兩大瓶頸 北京這份文件給出答案:實施算力伙伴計劃、建設預訓練語料庫
來源:互聯網   發布日期:2023-05-16 13:26:53   瀏覽:5489次  

導讀:《科創板日報》5月16日訊 繼表態支持頭部企業打造對標ChatGPT的大模型后,北京市近日公開待定的新措施,直指AIGC發展中算力、數據不足兩大痛點。 據北京市政府網站消息,為搶抓大模型發展機遇,重視通用人工智能發展,北京市科委、中關村管委會制定了《北京...

《科創板日報》5月16日訊繼表態“支持頭部企業打造對標ChatGPT的大模型”后,北京市近日公開待定的新措施,直指AIGC發展中算力、數據不足兩大痛點。

據北京市政府網站消息,為搶抓大模型發展機遇,重視通用人工智能發展,北京市科委、中關村管委會制定了《北京市促進通用人工智能創新發展的若干措施(2023-2025年)(征求意見稿)》,公開征集意見時間為2023年5月12日至5月19日。

除了算力、數據要素,這些措施還涵蓋了AI發展的多個關鍵環節,包括大模型技術、AI應用、審慎監管。

實施算力伙伴計劃 新增算力建設項目

針對算力不足的問題,北京市提出了三項待定舉措:發展商業算力、新增算力基建、建設多云算力調度平臺。

具體為組織商業算力定向滿足本市緊迫需求,加強與頭部公有云廠商等市場主體合作,實施算力伙伴計劃,并將新增算力建設項目納入算力伙伴計劃,加快推動海淀區“北京人工智能公共算力平臺”,朝陽區“北京數字經濟算力中心”等項目建設,建設統一的多云算力調度平臺,實現異構算力環境統一管理、統一運營。

其建設算力基礎設施的目標是支撐千億級參數量的大型語言模型、多模態大模型、大規模精細神經網絡模擬仿真模型、腦啟發神經網絡等研發。

建設多云算力調度平臺是為了方便企業在不同云環境上無縫、經濟、高效地運行各類AI計算任務。

值得注意的是,該措施提出要為此建設北京與河北、天津、山西、內蒙古等。ㄊ校┧懔旱闹边B基礎光傳輸網絡,進一步提升平臺對四地算力資源感知能力,探索開展算力交易。

中文語料太少怎么辦?將建設合規語料庫

目前,國內各公司發展大模型缺乏用于AI訓練的大規模中文語料集,無論高質量的還是低質量的中文語料集都極端缺乏。

對此,北京市提出,針對目前大模型訓練高質量中文語料占比過少,不利于中文語境表達及產業應用的問題,整合現有開源中文預訓練數據集和高質量互聯網中文數據并進行合規清洗。同時持續擴展高質量多模態數據來源,建設合規安全的中文、圖文對、音頻、視頻等大模型預訓練語料庫,通過北京國際大數據交易所社會數據專區進行定向有條件開放。

解決了棘手的數據來源問題,數據的收集和處理同樣是個昂貴且緩慢的過程,北京市提出要打造“國家數據基礎制度先行先試示范區”,謀劃國家級數據訓練基地、搭建數據集精細化標注眾包服務平臺,研發數據采集、清洗、標注、脫敏、存儲等功能在內的數據處理工具。

另外,對于數據應用、數據監管,北京市均有相關具體措施,包括加大對政務、醫療、科研、自動駕駛等領域數據的挖掘利用;確保訓練數據集的規范性、加強個人數據保護等。

“算力即權力” 數據將成“勝負手”

當下,人工智能已成為新一輪科技熱潮的核心發力方向。

5月5日中央財經委二十屆第一次會議和國常會相繼召開,會議強調,要把握人工智能等新科技革命浪潮。國家發改委近日表示,要加快發展數字經濟,重視通用人工智能發展。

以ChatGPT為代表的AIGC工具開啟了以大為美的人工智能新時代,隨著人工智能生產力被充分激發、多模態的興起,以及各種開源、小模型頻頻亮相,巨大的算力消耗能力、海量的數據需求已然成為技術迭代路上的攔路石。

誰能最先突破瓶頸,誰就能成為這輪科技革命的佼佼者。

國盛證券表示,“算力即權力”,算力是人工智能從玩具向工具的使能者。未來的算力將會呈現出從云端到邊緣梯度分布的格局,云端算力負責復雜科學計算,大模型運算推理等任務,邊緣側則憑借隱私、時延與成本三大優勢,成為小模型與AI應用觸及萬千用戶與場景的通道。

該機構分析師宋嘉吉稱,隨著邊緣算力需求持續增加,模組作為邊緣算力的最佳載體,將成為AI的毛細血管,邊緣IDC也將為城域級算力建設打開全新空間,他列出了下列關注方向:

1)光通信:新易盛、天孚通信、中際旭創、太辰光、德科立、華工科技;2)云算力:光環新網、奧飛數據、數據港、潤澤科技;3)邊緣算力:美格智能、廣和通、龍宇股份;4)服務器&交換機:中興通訊、紫光股份、銳捷網絡;5)核心網:震有科技。

東吳證券則指出,對于我國而言,算法和算力都可以通過挖掘優質人才、引進優秀工程實踐,或者直接購買海外優質資產追趕。而培養中文環境的優質數據集、語料庫卻必須長期自我積累沉淀,未來數據將成為AI發展的勝負手,并有望為中國訓練自己的大模型,走出差異化道路提供重要基矗

該機構分析師王紫敬看好以下三個環節:

1)數據運營:預計醫保數據將有望成為公共數據放開的第一站,重點推薦久遠銀海,建議關注山大地緯、中科江南等;2)數據基礎設施:有望成為最先放量兌現的環節。重點推薦深桑達A,易華錄,云賽智聯,建議關注中國電信;3)數據安全:看好具備央國企背景和數據安全業務積累的相關廠商。推薦啟明星辰、奇安信、安恒信息、電科網安等。

(科創板日報 宋子喬)

贊助本站

人工智能實驗室
AiLab云推薦
展開
Copyright © 2010-2023 AiLab Team. 人工智能實驗室 版權所有    關于我們 | 聯系我們 | 廣告服務 | 公司動態 | 免責聲明 | 隱私條款 | 工作機會 | 展會港 | 站長號