今年两会上,全国政协委员、中国科学院计算技术研究所研究员、益企研究院首席专家顾问张云泉提交了关于“东数西算”工程高质量发展、破解大模型算力瓶颈、培养新质生产力人才的相关提案。并首次提出构建”主权级基础大模型“,提升国家竞争力,维护未来国家安全。
整合战略资源
构建主权级基础大模型
大模型在 2023 年的火爆,与 GPU 的一卡难求,进一步暴露出我国算力产业发展存在的核心问题。
| 首提构建主权级基础大模型
大模型已成为各国科技竞争的战略必争地。近来美国在大模型领域持续发力:Meta公司拟采购35万片英伟达GPU发展自己的大模型,软银集团正尝试投入一千亿美金研发自己的AI芯片,OpenAI更是计划筹集七万亿美金研制生产新AI芯片。
2023年,英国政府官网公告称,创立“基础模型工作组”英国希望能拥有自己国家的“主权”AI 人工智能技术,其公共服务也能够从这种人工智能的转型影响中受益。
近日,英伟达提出“主权AI”的概念,并将其定义为“一个国家利用自己的基础设施、数据、劳动力和商业网络生产AI的能力”。英伟达官网发布的一篇文章认为,“主权 AI ”涵盖物理和数据基础设施,后者包括主权级基础大模型,由当地团队开发,并在当地数据集上进行训练,以促进对特定语言、文化和习俗的包容性。
为此,张云泉提出要重视“主权级基础大模型”的开发。“主权级基础大模型”是一个动态概念,它应该是某一时期内最高水平的大模型。这一大模型算力要求最高、智能水平最高,是一个国家AI水平的最高点、基础大模型的基础,也可以被形容为“根模型”。
“主权级基础大模型”将深刻影响一个国家的科技竞争力,涉及军事、经济、政治等多方面能力。“没有‘主权级基础大模型’,就像是国家没有了国防重器,国家就会被打压,国家安全也会受到威胁”,因此必须尽快研制处于国际领先水平的“主权级基础大模型”,以维护未来的国家安全。
第十四届全国政协委员、中国科学院计算技术研究所研究员 张云泉
| 多路并进、集中力量解决算力瓶颈
一.设立能够支持主权级多模态大模型训练的专用超算攻关专项,快速缓解国产主权级基础大模型训练的算力瓶颈。张云泉说,过去的15年,我国超算的研制水平已经达到世界领先水平,形成了神威、天河和曙光三大世界级超算研制团队,夺得了11次世界冠军和两次超算应用最高奖戈登贝尔奖。“通过该专项计划的支持,可以充分利用超算领域多年积累的人才和技术优势,快速形成突破,尽快缩小我国在‘主权级基础大模型’训练领域与美国的差距,为研制更先进适用的大模型专用训练芯片和系统赢得时间。”
目前,国内一些企业往往倾向于使用国外的开源大模型,还经常出现低水平的重复与‘内卷’,百模大战使得算力资源过于分散。延误了‘主权级基础大模型’的研发。 无论是专用超算攻关专项还是AI芯片攻关专项,都需要国家出面协调资源,以当年“两弹一星”的形式组建队伍,以取得快速突破。“留给我们的时间窗口并不长,不能错失良机。”
二.集中全国AI芯片研制力量,组建统一研发团队,优中选优,尽快研制出能够对标英伟达高端训练GPU的大模型训练专用国产芯片,软件和系统。在解决AI芯片“卡脖子”的基础性问题上,张云泉则建议,集中全国AI芯片研制力量,组建由业内权威专家和各主要AI芯片厂家参加的智能算力发展专项组,通过多轮竞争,确定最优的训练芯片研发技术路线和国家标准,择优集中投入资金和优秀人才资源,整合芯片产能,尽快研制出能够满足国产主权基础大模型训练的十万卡、百万卡甚至千万卡并行算力需求的AI芯片和系统。
三.大力发展经济实用大模型推理产业链。在大模型推理产业链上,张云泉建议通过投资引导低功耗推理芯片和算子库技术攻关,鼓励大模型压缩、适配和性能调优等技术研发,通过规模效应实现成本共担,降低模型推理算力成本,形成经济适用国产大模型推理产业链。为大模型企业和愿意通过大模型手段智能化转型的传统企业提供必要的支持和配套服务,快速形成新质智能生产力,助力国产大模型平台企业生态建设和占领市场。
普及生成式AI教育
培育新质生产力人才
为了培养新质生产力人才,张云泉委员建议优化资源分配,及时更新课程内容和教学方法,促进产教融合,加快企业导师引进并设立专项奖励。
张云泉注意到,一段时间以来,以OpenAI chatGPT为代表的通用人工智能的快速发展,预示着全球新一轮科技革命和产业变革的到来。特别是近期以SORA为代表的高质量短视频AI生成工具的出现,不仅推动着科技创新,还促进着“新质生产力”的茁壮成长,为生成式人工智能开拓了广阔的产业应用空间。
中央财办有关负责人在解读2023年中央经济工作会议精神时提到,加快培育新质生产力要打造新型劳动者队伍,包括能够创造新质生产力的战略人才和能够熟练掌握新质生产资料的应用型人才。在张云泉看来:“培养既具有科技创新能力又能熟练应用AI新技术的人才,显得尤为重要。”
他初步调研发现,我国在人工智能教育领域已取得显著成就,但也在一定程度上存在以下四方面问题:
一.教育资源分配不均。我国生成式人工智能的教育资源,如高质量课程、资深教师和先进技术,主要集中在顶尖学府和城市地区,导致农村和偏远地区的学生无法获得平等的受教育机会。
二.课程内容更新滞后。由于人工智能领域发展迅速,学校的课程内容和教学方法无法及时跟上技术的最新发展,学生学到的可能是已经过时的知识和技能。
三.实践机会缺乏。生成式人工智能教育需要大量的实践和实验,但很多学校由于资源限制,无法为学生提供足够的实验设备和实践机会。
四.师资力量不足。人工智能是一个高度专业化的领域,需要有专业知识和实践经验的教师。目前,合格的生成式人工智能教师相对稀缺,影响了教学质量。
张云泉认为,为满足市场对“新质生产力”人才的需求,需积极解决课程、师资和资源配置等挑战,以提升我国在全球数字经济竞争中的优势。他为此提出四方面的建议:
一.优化资源分配,促进教育平等。为解决教育资源分配不均的问题,建议通过国家层面的宏观规划优化资源分配,特别关注偏远和农村地区,确保上述地区也能获得必要的资源。
“建议可以通过现有的教育部政策框架内进行探索和实施,如设立‘生成式人工智能教学资源共享平台’,以鼓励学校间根据生成式人工智能的技术特点,共享教学内容资源和教学计算资源。”张云泉说。
二.及时更新课程内容和教学方法。应对课程内容更新滞后的问题,学校需要及时更新课程内容和教学方法,与快速发展的人工智能领域同步。如设立“生成式人工智能国际协同创新计划”,以鼓励国内外学校(或企业)合作创新课程内容和教学方法,并在学校示范应用生成式人工智能技术开发的教学助手,以提供个性化学习体验。
三.促进产教融合,增加实践机会。针对实践机会缺乏的问题,学校应与企业和研究机构合作,增加学生的实践机会。为了更好地适应毕业后的工作环境,学校和产业界应加强合作,通过实习、项目合作等方式帮助学生了解实际工作中的需求和挑战,从项目式学习中提高教育的实用性和有效性。
“建议设立‘生成式人工智能创新实践基地’,以鼓励有智能化需求的各行业企业提供实习机会和人工智能应用场景,增加学生在生成式人工智能技术上的实践能力。”张云泉说。
四.加快企业导师引进并设立专项奖励。针对师资力量不足的问题,应加快推进在生成式人工智能领域企业导师的引进速度,鼓励企业导师和校内教师充分合作,通过企业导师帮助校内教师提升在生成式人工智能领域的知识和教学能力。
张云泉同时提到,为鼓励和表彰在教学和科研中积极应用生成式人工智能技术的教师,建议设立“生成式人工智能教育创新奖”,并将其纳入教师职称晋升和奖励体系中。