如果ChatGPT是一阵风,刮到中国后,除了引起各界对AI大模型的关注外,还带来了什么?在日前举行的第六届数字中国建设峰会上,不少官员和学者都在讨论这个问题。
毋庸置疑,随着ChatGPT的爆火,人工智能又一次站上了风口。国内不少企业抢抓机遇,纷纷推出自己的AI大模型,比如百度“文心一言”、阿里“通义千问”、华为“盘古大模型”、科大讯飞“星火认知大模型”……据不完全统计,国内迄今已推出了超20个AI大模型。
面对这么多AI大模型,国家互联网信息办公室副主任曹淑敏有些担忧,“也不能一哄而上”。
她提到了此前一些地方抢建数据中心的“乱象”。中国工程院院士、阿里云创始人王坚曾评价:许多地方把数据中心建设成了房地产一样的项目,一些数据中心实际业务就是“出租”,把数据中心的空间分给不同客户……不要为了建设数据中心而去建设。曹淑敏说,“各个领域不能过热”。
当前,人工智能日益融入我国经济发展各个领域,成为推动科技跨越发展、产业转型升级、生产力整体跃升的重要驱动力量,为新旧动能转换和经济高质量发展提供了有力支撑。
中国电子信息产业发展研究院发布的数据显示,2017年至2021年,我国人工智能产业规模增长了2.6倍,占全球比重提升到16.8%。专利申请量占全球比重持续扩大,从2012年的13%增长到2021年的70.9%。
曹淑敏表示,虽然取得了很多进步和成就,但我国人工智能整体发展水平和发达国家相比仍存在一些差距,特别是在一些基础理论、原创性的技术还有产业高端的核心技术领域。
她希望各界能借助ChatGPT带来的东风,真正沉下心去发展人工智能,抓住机遇,“同时要保持定力,能够理性地发展”。
AI大模型会怎么演进
人工智能发展到现在已经历三次浪潮,基于互联网大数据的深度学习的突破,成就了现在人工智能的盛况。在中国科学院自动化研究所副所长曾大军看来,ChatGPT系统本身准确地说不是科学上大的突破,而是技术积累到一定程度之后的大集成和使用效果上的大突破,是工程实践的里程碑。
业内的共识是:超级的算法加上超级的算力再加上超级数据的耦合,终于创造了工程的奇迹。
中国科学院自动化研究所将ChatGPT的能力、特点概括为“四个通”——通顺自然的自然语言生成、全领域通识知识体系的覆盖、多种自然语言场景的通用和通畅的人机交互、意图识别及逻辑推理。效果上ChatGPT实现了相当高的乃至类人级别的理解和语言对话能力。
这背后是AI大模型的支撑,这也是为什么ChatGPT后众多企业扎堆推出AI大模型的原因。曾大军说,ChatGPT背后大模型的成功为世界认知和建模等人工智能核心挑战探索出了一条与众不同的道路。
攻克大模型、大算力、大数据等关键核心技术和基础理论,将成为抢抓人工智能发展制高点的关键。大家想知道的是大模型的路未来会怎么走。
中国科学院自动化研究所对AI大模型的演进态势做了研判,在第六届数字中国建设峰会·人工智能分论坛上,曾大军介绍了他们的观点:应用和创新生态正在发生剧变或至少有剧变的潜质、大模型推动决策智能迅猛发展、大模型小型化和领域化需求非常迫切、更加通用的人工智能有望实现。
他说,大模型就像一个人类大脑的雏形,通过喂养各种数据,实现各种智能能力,大模型正在重新定义人和计算机的互动关系,有望成为计算机和人今后主要的接口。
现场,曾大军着重强调了大模型小型化和领域化的发展。他说,现有大模型的算力和能耗挑战会促使很多工作向领域专用化、轻量化的小模型或大小模型混搭的方向发展,特别是金融、教育、医疗、交通等领域,大量的工作在试图降低大模型的成本。
厦门大学南强特聘教授、人工智能研究院负责人纪荣嵘也谈到了这一点。他说,大模型最终要用到车载、机载、电载等应用上,在无人机等设备中,硬件大一些,成本就以倍数上涨,多一点计算空间就会增加巨额的硬件成本,所以“各个企业也不要只关注模型做大,还要思考怎么样把大模型做小”。
我国走什么路径
按照国务院2017年发布的《国家新一代人工智能发展规划》,到2025年,人工智能基础理论实现重大突破,部分技术与应用达到世界领先水平,人工智能成为我国产业升级和经济转型的主要动力,智能社会建设取得积极进展。5年后的2030年,我国人工智能理论、技术与应用总体达到世界领先水平,成为世界主要人工智能创新中心。
科技部高新技术司副司长、一级巡视员梅建平说,按照规划,这些年,科技部和各有关部门一直以来大力推动人工智能基础理论、关键技术和示范应用创新。
比如,在基础技术方面,特别是涉及基础设施建设方面,科技部从数字、数据到计算、连接等方面,都做了课题研发的系统布局,取得了一系列成果。最近,科技部还在积极推动算力网的建设,希望通过新技术的研发和应用来打造超算、智算的算力底座,为数字中国建设提供强有力的支撑。
曾大军认为,目前,我国人工智能的创新水平已经迈入世界第一梯队,整体的发展态势良好,但也存在着不少挑战。主要是顶天突破比较少,原创性、颠覆性的核心算法与美国等发达国家相比差距比较大;立地的能力偏弱,重大的、系统性的集成创新能力不足,存在着低水平重复建设的问题。
针对AI大模型,他建议,一方面我国需要加速大模型技术的落地应用,“我国在大模型技术方面已经有了很好的能力储备和应用,最近类ChatGPT技术的门槛也已经大大降低了”;另一方面,建议集中优势力量突破通用底座大模型,“需要围绕通用大模型构建新型的有组织科研力量,坚定不移持续攻关,并积极寻求多种渠道的资源投入”。
他还说,GPT-4已经呈现了一些通用人工智能能力的雏形,但这条技术路径功耗非常高,这是发展数字经济无法承受的。曾大军认为,我国在人工智能与脑科学融合交叉方向有很好的研究基础,后续需要进一步将大模型和脑科学交叉融合,发展符合伦理和可持续性的低碳AI。
无论走哪条路径,重点是得“攻克关键核心技术和基础理论”。曹淑敏说,只有整个链条的关键核心技术突破,才能真正实现人工智能的全面发展,当中涉及大量的算法问题、模型问题、智能算力有关产业等,“这些都需要我们深耕”。
尤其是芯片产业,这直接关系到人工智能算力的发展突破。
让技术向善
在同一个场合,瑞芯微电子科技公司董事长励民感慨,要考虑符合中国现实芯片产业发展的人工智能训练和推理方式。
今年,励民参加了在多国举办的7个大型展会,几乎所有客户都认为,未来3年,所有的IT业会被人工智能和AIoT(人工智能物联网)席卷,“因为3年后ChatGPT 7.0会是什么样子,大家想象不出来”。
趋势已现,站在人工智能的拐点,我们的应对是必须跟上算力需求,归根结底还得靠底层技术。
励民说,要思考新的工业人工智能模型,不能照抄ChatGPT,国内3年内人工智能模型要与国内3年内的芯片发展相适应。相关产业发展也要“赛马而不是相马,不能靠PPT做产业”。
曹淑敏还提到了发展的安全问题。此前,OpenAI的数据泄露引发了隐私争议,后来,包括马斯克、辛顿等上千名科技领袖都签署了一封公开信,呼吁所有AI实验室立即暂停训练比GPT-4更强大的AI系统至少6个月,他们都关心人工智能发展所带来的各种风险。
“如何统筹好发展和安全,这也是我们面临的一个重大问题。”曹淑敏说,每一项新技术都是双刃剑,带来巨大发展机遇的同时,也带来很多挑战,特别是当新的技术能力非常强大时,带来的风险也非常严重。
4月11日,国家互联网信息办公室发布《生成式人工智能服务管理办法(征求意见稿)》,倡议建立有庞大算力规模、专业垂直的监管体系,达成代码公约等,为人工智能确定伦理规范。
曹淑敏说,我们要积极应对人工智能带来的可能的公共安全、隐私侵权、数字鸿沟、伦理示范等方面的挑战,如何让技术向善、造福人类,如何推动人工智能发展更加公平、更可持续、更为安全,让技术更好地惠及人民,让技术更好地推动经济社会健康、持续发展,“这是我们所有主体都面临的一个重大责任”。
中青报·中青网记者 张均斌 来源:中国青年报