人民网
人民网

肖京:加快推进河套大模型产业发展

2024年07月31日14:43 | 来源:南方Plus
小字号

原标题:委员说|肖京:加快推进河套深圳园区大模型产业发展

  2024年7月30日,在国务院发布《河套深港科技创新合作区深圳园区发展规划》一周年前夕,政协第七届深圳市委员会常务委员会第十八次会议“聚焦打造科技硬核,大力推进河套深港科技创新合作区深圳园区建设”专题协商会举办。深圳市政协主席林洁主持会议,深圳市委副书记余新国出席会议,多位深圳市政协委员围绕河套深港科技创新合作区(以下简称“河套合作区”)发展建言献策。

  在发言中,深圳市政协委员、平安集团首席科学家肖京指出,当前,以大模型为代表的生成式人工智能加速发展,正以前所未有的速度重塑产业格局,成为打造新质生产力的重要引擎。深圳也已积极布局发展大模型技术,在金融、制造、医药等多个行业发挥价值,但大模型产业发展仍面临挑战。

  他认为,生成式大模型的核心特性之一是scaling law(规模法则),通俗地说就是大力出奇迹,数据、算力规模越大,模型参数规模越大,涌现出来的模型能力也越强。因此,数据、算力资源对于生成式人工智能的发展至关重要,并逐渐成为制约其进一步发展的瓶颈。

  河套深港科技创新合作区。 南方+ 朱洪波 拍摄

  河套合作区作为粤港澳大湾区唯一以科技创新为特色的国家级平台,具有一区两园、跨境接壤的独特优势,是链接国际科技创新网络、培育新兴产业发展新动能最直接有效的对接点。

  肖京表示,基于河套合作区的特色优势,建议围绕数据、算力问题,引培发展相关基础科研及软件服务产业。

  一是引进培育深耕专业垂域的数据开发服务商。例如深耕医疗领域,形成深入各专科及全科的疾病、症状、药品、医院、病例诊疗等高质量数据资源,进而支撑构建医疗垂域大模型,助力提升全社会的诊疗服务水平。此外,建议充分发挥河套的深港合作地域优势,鼓励数商跨境引入相关领域其他语种的数据,以弥补中文数据的不足。

  二是引进培育深耕仿真数据生成技术的服务商,规模化生成仿真数据资源。如在自动驾驶领域,通过基于物理原理模拟各种复杂的路况和交通情况等各类驾驶环境,规模化生成仿真驾驶数据,从而有效提升相关模型能力;在养老领域,通过模拟仿真各类老人生活场景、照护场景数据,提升养老服务相关模型能力。

  三是引进培育专注新型高效大模型架构、知识演绎推理技术等基础研究的机构或企业,探索突破算力瓶颈。在河套合作区开展新一代人工智能基础研究,包括新型大模型架构及知识演绎推理技术等领域,利用香港基础科研和国际化优势,深港合作引进相关领域的顶尖科技人才、战略科学家、科创企业等,如国内外已研发出替代架构(斯坦福的TTT架构、微软联合清华的RetNet,平安的DFlow等)的技术团队等,提升Transformer大模型架构效率,减轻算力需求。政府在相关领域设立较长期稳定的强包容性资助政策,激励基础科研创新。

  四是建设国产算力软硬件适配基地(包括测评),加快构建完善的国产算力生态。在河套合作区建设国产算力软硬件适配基地(包括测评),搭建信创综合验证平台,以政府奖补、专项扶持等方式引导高校、研究机构、上下游企业加强协同合作,开展基于国产软硬件生态的标准化适配及迁移优化能力建设,解决AI系统信创迁移成本高、定制化程度高、周期长等问题,推进国产AI研发应用的高速发展。

  【采写】南方+记者 马芳

  【摄影】南方+记者 朱洪波

(责编:李语、陈育柱)

分享让更多人看到

返回顶部