从ChatGPT到Sora,人工智能及大模型已成为引领这一轮科技革命和产业变革的战略性技术。今年政府工作报告提到了3次“人工智能”和26次“安全”,提出要大力推进现代化产业体系建设,加快发展新质生产力,并强调要深化大数据、人工智能等研发应用,开展“人工智能+”行动,打造具有国际竞争力的数字产业集群。
“人工智能”也是今年两会代表委员们热议的关键词。南都记者统计发现,来自通信、互联网、数字人等领域的多位两会代表委员,从人才培养、算力与数据开放共享、数据安全与合规、大模型垂直应用场景开发等角度,提出了多项关于人工智能发展的建议。
聚焦1:培养人才
普及更多学段,加强AI应用型人才队伍建设
代表委员们围绕人工智能发展的人才问题建言献策,将人工智能教育普及到更多学段、加强应用型人才建设、加强高校相关学科建设等建议被多位代表反复提及。
其中,在将人工智能教育拓展到更多学段方面,全国人大代表、小米集团董事长兼CEO雷军提出,建议从义务教育阶段普及人工智能素养教育。“建议将人工智能素养教育纳入九年义务教育内容,设置人工智能通识课程,同时将相关内容纳入中小学社会实践活动。从基础理念到简单应用,全面激发中小学生的兴趣,培养中小学生对人工智能的认知能力和应用能力,为未来发展打下坚实基础!”
全国人大代表、科大讯飞董事长刘庆峰也建议,加快推广大模型赋能全学段,以全新机制加快探索我国人工智能拔尖创新人才培养。他的建议还包括加快运用大模型的现有能力,打造教师和学生的助手,赋能从中小学到职业教育和大学的教育教学提质增效。
加强人工智能应用型人才团队建设也被多位代表反复提及。在人工智能快速向各行业领域延展渗透之时,对人才技能升级的要求较高,而许多企业也成了该领域的重要推动力量,拥有大量的数据资源和强大的计算资源以及丰富的应用场景,但与此同时,社会人才市场却严重缺乏高水平的人工智能培训能力。
对此,雷军建议支持大型科技企业和教培机构培育人工智能应用型人才。“建议鼓励大型科技企业和社会教培机构开展人工智能应用型人才培训,以适应人工智能领域技术快速迭代、人才需求量大、应用广泛的特征。具体来看,可结合人工智能人才的供需情况,通过配套政策引导,鼓励企业和机构灵活设置从人工智能基础素质培训,到尖端前沿人工智能人才的系统性培养,有效满足当前各领域对人工智能应用型需求。”
刘庆峰也建议,要研究通用人工智能时代人才能力素质模型和培养方案,加快应用型人才培养。此外,刘庆峰还表示,针对未来可能被人工智能大量替代的行业和岗位,要针对劳动力培养及再就业做专项研究,并且提前、主动做好应对。同时,还要关注通用人工智能对社会各行业带来的冲击,加快建设新的人才能力素质模型和课程培养体系,特别是加快用通用人工智能赋能软件代码、语言学习、艺术创意等应用型人才的培养,助力我国软件行业和数字经济发展。
根据教育部公布的数据,目前,我国498所高校开设了“人工智能”本科专业,209所高校成功备案或申报“智能科学与技术”本科专业,在全国3000多所高校中占比仍然较低,加强人工智能学科建设仍是行业人才培养的发力重点。
基于此,雷军还建议,加大对高校人工智能学科建设的投入,通过加强与世界一流科研机构的合作交流,从海外弓进优秀师资力量,吸引企业高级人才和行业专家进入高校授课等方式,扩大教学力量。将人工智能通识课程拓展到更多专业,如传统理工科专业,医学、金融、文史、艺术类等专业,培养更多跨领域人才。引导人工智能赛道的大型企业向高校学生开放实习实践机会,提升理论与实践相融合的综合素质。
针对人才培养,全国人大代表,中国铁塔党委书记、董事长张志勇也建议,要加快人工智能人才的培养和储备,有条件的地区试点“人才特区”等政策,打造企业、人才集聚的人工智能创新高地。刘庆峰也持有类似的建议,他表示应设立国家人工智能学院,以“核心+基地”的组织形式和全新机制推动我国面对中美竞争的拔尖人工智能人才培养。
聚焦2:降低算力成本
建立算力、数据资源公共调度平台
大模型浪潮下,AI发展的三驾马车算力、算法、数据的任何一个维度都被两会代表委员高度关注。更庞大的数据量、更高的数据质量能推动大模型有更好的训练与应用效果,但数据与算力总是有限的。今年,政府工作报告中首次提到“大力推动数据开发开放和流通使用”,并强调要适度超前建设数字基础设施,加快形成全国一体化算力体系,体现对数字经济发展的积极引导。
对此,不少两会代表委员提出,要促进算力与数据等资源的协同共享。全国人大代表,中国铁塔党委书记、董事长张志勇提议,一是要打造人工智能创新开放体系,开放算力平台、共性技术平台、行业训练数据集、仿真训练平台等人工智能基础设施;二是要打造协同创新的人工智能产业发展联合体,开源平台和开源生态,促进破除商业化禁用限制,进一步降低算力成本,使大模型的使用“普惠化”。他还表示,应建立算力资源公共调度平台,促进算力资源协同共享,提升算力资源利用效能。
张志勇还提议,需要提升行业数据供给水平、引导行业龙头企业开放非敏感数据。“我建议制定统一标准的数据架构,鼓励各类企业建设高水平行业数据集,加强行业数据流通交易,建立多类多模态新型公共数据集,增强高质量数据供给;制定数据开放相关政策,引导行业龙头企业开放非敏感数据,全面提高数据资源开发利用水平,让数据‘供得出’‘流得动’‘用得好’,为行业大模型成长提供充足‘养料’。”
无独有偶,全国人大代表、科大讯飞董事长刘庆峰也围绕训练数据共享开放方面,建议推动国家级高质量训练数据开放和共享,支持国家实验室、全国重点实验室、国家人工智能开放创新平台等国家战略科技力量以揭榜挂帅形式优先、低成本使用。
全国政协委员、知乎创始人、CEO周源也提议,应加快高质量中文数据集的开发与利用。在周源看来,数据作为新型生产要素已经成为驱动全球数字经济的动力引擎,我国数据要素市场起步较晚,标准、权属、交易、商业模式、监管等相关环节还有待完善。
要提升大模型训练数据的质量,周源认为需要加快构建标准统一、布局合理、管理协同、安全可靠的公共大数据资源体系。“当前,我国已开始全面部署和推行公共数据开放制度,但公共数据开放仍然存在数据开放利用不充分、不协同、不平衡、不可持续等问题,加快构建标准统一、布局合理、管理协同、安全可靠的公共大数据资源体系,有助于大模型训练数据质量提升。”周源表示。
聚焦3:立法监管
保障数据安全与数据合规
伴随ChatGPT、Sora等大模型应用的走红,来自人工智能安全方面的威胁也在显现。近期,利用人工智能应用进行诈骗、换脸变声等安全事件已屡见不鲜。
奇安信董事长齐向东在今年两会接受采访时就表示,人工智能的源头是大数据,要先解决数据安全才能解决人工智能安全。同时,数据合规也应该被监管部门看见和重视。今年,多位两会代表委员针对数据安全、数据合规议题提出立法与监管方面的需求。
在全国政协委员、知乎创始人、CEO周源看来,当前,大模型服务提供者获取训练数据的途径大体可以分为经授权获取数据,如采购第三方数据库等,以及自行收集数据,如通过网络爬虫等技术手段收集数据等。在后者情况下,涉及多种知识产权客体,存在侵犯他人享有权益的内容的行为,有较大的法律风险。此外,根据Epoch AI人工智能预测组织的研究报告显示,AI公司可能在2026年前耗尽高质量文本训练数据。
在此情况下,周源建议从监管层面采取严惩与鼓励并行的方式,加强数据安全和知识产权的保护措施。“建议监管部门和相关机构研究制定相应的管理办法或法律法规,一方面是推动大模型研发机构和企业制定严格的保护政策和行为规范,严厉打击侵权行为发生,确保数据持有方的知识产权和利益得到充分保护;另一方面是制定相应的鼓励和扶持政策,保障拥有丰富高质量数据储备及持续生产能力的企业和社会主体得到整个行业的重视,促进数据要素市场的形成和生产能力的持续发展。”
在数据合规方面,周源表示,大模型训练高度依赖高质量数据,没有好的数据就不可能有好的模型。随着大模型技术的深度发展,他建议相关政府部门和监管机构针对数据合规应建立相应的监管机制,推动完善AIGC监管立法,保护和规范人工智能领域的数据合规。对大模型的数据采集来源、处理方法、合规性等进行监督和审查。周源还表示,应加强对大模型的社会影响和风险评估,及时发现和解决可能存在的问题。
张志勇提议,要加强模型的数据安全。比如加快推进人工智能立法,出台暂行办法保障大模型安全发展;同时要构建行业大模型内生安全体系,建立全面的软硬件安全、网络安全、数据安全、模型算法可信增强、个人信息保护的立体化安全保障体系。
刘庆峰也建议,应加速通用人工智能技术相关的法律法规制定与审议。“围绕大模型的数据安全、隐私泄露、可靠性、知识产权等几大关键方面制定法律法规,提升通用人工智能技术可靠性与规范性。同时,完善向社会开放的大模型的准入和运行规则,明确责任分配与问责机制,并明确大模型知识产权与保护方式。”
聚焦4:创新应用场景
推动大模型垂直化、产业化落地
在全国政协委员、360集团创始人周鸿祎看来,2024年是大模型应用场景元年,中国完全可以走出一条具有中国特色的大模型发展之路。
因此在其2024年两会提案中,周鸿祎建议要深化人工智能多场景应用,支持大模型向垂直化、产业化方向发展,助力加快形成新质生产力。他从场景、知识、业务融合三方面提出了建议。
“一是场景很重要,大模型在垂直领域大有可为,建议政府、央国企率先提供更多应用场景,聚焦‘小切口,大纵深’,推动大模型垂直化、产业化落地。二是知识很重要,基于‘暗知识’的垂直大模型能更好解决企业问题,建议鼓励企业在定制AI前,做好知识管理,将企业大数据平台升级为企业知识平台。三是业务融合很重要,建议鼓励和引导企业将大模型与数字化业务系统深度结合,同业务流程相结合,充分发挥大模型价值。”
同样关注人工智能应用场景的还有全国政协委员、天娱数科副总经理、山西数据流量谷董事长贺晗。他向南都记者表示,加快拓展人工智能大模型技术应用场景有着迫切的必要性,“一是因为大模型目前在传媒、金融等行业应用的多,其他行业有案例但不多更谈不上普及,推动大模型技术与制造业、能源、交通等更广泛的行业应用相结合,对于整个经济体降本提质增效有帮助;二是过程中还会产生新的业态,比如AI助教、AI诊断等,这是新的增长点;三是来自产业应用中的反馈反过来也会大模型技术创新有帮助。”
腾讯混元AI生成图片。
为此,他提出了两方面的建议,一是鼓励搭建多层次应用场景供需对接平台。“我建议鼓励地方政府、领军企业、行业协会和专业服务机构搭全国级、地方级、行业级等多层次人工智能大模型技术应用场景供需对接平台,同时我也建议推动具有首创性、示范性的标杆场景项目落地,打造标杆性大模型产品和服务。”
其次,应在全国范围实施大模型赋能千行百业示范应用推进计划。“我建议鼓励工业、金融、商务、交通、医药、政务、教育、文旅、传媒等各行业各领域深度挖掘、积极打造可应用人工智能大模型技术的各类场景,推动大模型赋能产业互联网平台应用,通过大模型技术对现有生产、服务和管理方式进行升级,实现业务流程创新和再造。”
张志勇也提到,应加快创新应用场景建设,发挥我国应用场景丰富的优势,加强企业主导的产学研深度融合。“比如可以在国家统筹部署下,引导企业开放应用场景;举办基于生产场景应用的人工智能算法大赛,加快资本、人才、技术、数据、算力等要素汇聚;进一步加强多模态、多场景、多任务的行业大模型人工智能技术研发,促进科技成果转化,推动大模型在行业应用中不断提升能力。”
出品:南都政商数据新闻部、上海新闻部
统筹:甄芹 马宁宁 田爱丽
采写:南都记者 林文琪 马宁宁