肖京:加快推進河套大模型產業發展
![](/img/2020wbc/imgs/icon_type.png)
2024年7月30日,在國務院發布《河套深港科技創新合作區深圳園區發展規劃》一周年前夕,政協第七屆深圳市委員會常務委員會第十八次會議“聚焦打造科技硬核,大力推進河套深港科技創新合作區深圳園區建設”專題協商會舉辦。深圳市政協主席林潔主持會議,深圳市委副書記余新國出席會議,多位深圳市政協委員圍繞河套深港科技創新合作區(以下簡稱“河套合作區”)發展建言獻策。
在發言中,深圳市政協委員、平安集團首席科學家肖京指出,當前,以大模型為代表的生成式人工智能加速發展,正以前所未有的速度重塑產業格局,成為打造新質生產力的重要引擎。深圳也已積極布局發展大模型技術,在金融、制造、醫藥等多個行業發揮價值,但大模型產業發展仍面臨挑戰。
他認為,生成式大模型的核心特性之一是scaling law(規模法則),通俗地說就是大力出奇跡,數據、算力規模越大,模型參數規模越大,涌現出來的模型能力也越強。因此,數據、算力資源對於生成式人工智能的發展至關重要,並逐漸成為制約其進一步發展的瓶頸。
河套深港科技創新合作區。 南方+ 朱洪波 拍攝
河套合作區作為粵港澳大灣區唯一以科技創新為特色的國家級平台,具有一區兩園、跨境接壤的獨特優勢,是鏈接國際科技創新網絡、培育新興產業發展新動能最直接有效的對接點。
肖京表示,基於河套合作區的特色優勢,建議圍繞數據、算力問題,引培發展相關基礎科研及軟件服務產業。
一是引進培育深耕專業垂域的數據開發服務商。例如深耕醫療領域,形成深入各專科及全科的疾病、症狀、藥品、醫院、病例診療等高質量數據資源,進而支撐構建醫療垂域大模型,助力提升全社會的診療服務水平。此外,建議充分發揮河套的深港合作地域優勢,鼓勵數商跨境引入相關領域其他語種的數據,以彌補中文數據的不足。
二是引進培育深耕仿真數據生成技術的服務商,規模化生成仿真數據資源。如在自動駕駛領域,通過基於物理原理模擬各種復雜的路況和交通情況等各類駕駛環境,規模化生成仿真駕駛數據,從而有效提升相關模型能力﹔在養老領域,通過模擬仿真各類老人生活場景、照護場景數據,提升養老服務相關模型能力。
三是引進培育專注新型高效大模型架構、知識演繹推理技術等基礎研究的機構或企業,探索突破算力瓶頸。在河套合作區開展新一代人工智能基礎研究,包括新型大模型架構及知識演繹推理技術等領域,利用香港基礎科研和國際化優勢,深港合作引進相關領域的頂尖科技人才、戰略科學家、科創企業等,如國內外已研發出替代架構(斯坦福的TTT架構、微軟聯合清華的RetNet,平安的DFlow等)的技術團隊等,提升Transformer大模型架構效率,減輕算力需求。政府在相關領域設立較長期穩定的強包容性資助政策,激勵基礎科研創新。
四是建設國產算力軟硬件適配基地(包括測評),加快構建完善的國產算力生態。在河套合作區建設國產算力軟硬件適配基地(包括測評),搭建信創綜合驗証平台,以政府獎補、專項扶持等方式引導高校、研究機構、上下游企業加強協同合作,開展基於國產軟硬件生態的標准化適配及遷移優化能力建設,解決AI系統信創遷移成本高、定制化程度高、周期長等問題,推進國產AI研發應用的高速發展。
【採寫】南方+記者 馬芳
【攝影】南方+記者 朱洪波
分享讓更多人看到
- 評論
- 關注