您当前的位置:首页 > 新闻资讯 > 科技

国产大模型“诸神之战”出路何方

时间:2023-06-12 09:30:02  来源:  作者:中国青年报
1956年,达特茅斯学院的一场会议上,参会者热烈地讨论:如何开发出像人类一样能从经验中自主学习的计算机系统。这场会议被后人视为打响了人工智能研发的第一枪。

60余年后,美国AI target=_blank class=infotextkey>OpenAI公司八年磨一剑的人工智能大模型ChatGPT3横空出世,人们争相在社交媒体展示它那令人吃惊的能力,ChatGPT4更是“所向披靡”:作诗、写文案已不在话下,它甚至有了逻辑推理能力,还能自我纠错。那场著名会议的答案似乎已不言自明。

前不久,在2023中国国际大数据产业博览会上,AI(人工智能)、大模型、ChatGPT、元宇宙等关键词频频出现。在以“人工智能”为主题的会场,人头攒动,听会的人从会场内排到了会议室门口,还不断有新来的人挤进来。

在不同的会场和论坛上,来自不同领域的人们似乎都聚焦一个兴趣点,他们试图搞明白人工智能会对未来行业带来哪些颠覆性的变革,国产大模型之路应该如何走,还有什么基础工作要做。

想解决实际问题,大模型还要“念个博士”

孙茂松让ChatGPT找出《阿房宫赋》中描写阿房宫的句子,令他惊讶的是,它竟然一字不漏地找出来了。

孙茂松是清华大学计算机科学与技术系教授,也是该校人工智能研究院常务副院长,他研究自然语言处理,跟ChatGPT“专业对口”。在演讲中,他多次感叹:“它确实厉害!”

考完文字功夫,孙茂松又问ChatGPT,如何根据《阿房宫赋》绘制阿房宫的图景。ChatGPT像写剧本一样分了5个场景:阿房宫的宏伟壮观、阿房宫建筑风格、水景与桥梁、春光与武殿、迷宫般的宫殿布局。

今年以来,ChatGPT的博学已经广为人知,但美国国家工程院院士、东方理工高等研究院常务副院长张东晓认为:“大模型有很强的能力,很博学,相当于中小学生。要解决实际问题,还要上大学,还要念一个专业、念一个博士,或是成为那个领域的工程师。”

过去这段时间,ChatGPT所属公司OpenAI已与科技、教育、金融等行业的数百家公司或组织开展合作。

孙茂松认为:“(大模型)可以重塑一个产业,也能够重塑产业的生态。”

他举了个例子:有人想订家酒店,要求价格别太贵,最好离王府井近一点,而且要安静一些。面对用户的种种要求,以前要做到这一点很费劲,秘书可能要花两个小时才能找到这么一家酒店。而人工智能大模型会跟用户学习订酒店的习惯,效率大幅提高。

中国产学研合作促进会会长王建华说:“在人工智能影像医学这个领域,我们把全国医院的放射科和一些影像医学相关的企业进行融合,解决看片子完全靠人去看(的问题)。通过人工智能的话,精准度比较高,而且它不疲劳。”

王建华注意到,现在有很多智能产品,比如可以通过大数据的对比,测定人体糖代谢水平。他认为,人工智能会影响到整个医学领域的创新和发展。

医渡科技有限公司创始人徐济铭更期待的是,人工智能能够加速新药研发。

新药研发是个漫长的试错过程,从细胞实验,到动物实验,再到一、二、三期临床试验,从实验室研究到上市可能需要10年、花费10亿美元——这被称为新药研发领域的“双十定律”。近年,辉瑞、阿斯利康等知名药企开始在新药研发领域引入人工智能,希望提高成功率、降低成本。徐济铭设想,通过人体多模态的数据构建一个模型,模拟人体器官的运作,在临床实验之前先通过这些系统模型做实验,AI可以由此造福人类。

在京东探索研究院资深算法科学家薛超看来,大模型就是未来的操作系统,它向上提供应用程序接口(API),向下可以兼容各种各样的硬件。比如,一个餐馆想要建立一个送餐机器人或者对话机器人,店主把餐馆的菜单输进大模型,这样就可以快速建立起功能机器人。

“AI未来会越来越平民化,越来越低门槛化,可以通过自然语言来控制它的整个交互。”薛超说。

研发大模型,提高数据“喂养”质量很关键

本届数博会上,知乎联合面壁智能发布了对话类模型产品“面壁露卡”。发布会上,主持人请它规划在贵州四天三夜的旅游路线。在“露卡”规划的旅游方案中,游客每天晚上都要从景点所在地返回出发点贵阳,第二天再出发前往下一个市州。路线略显冗长,好在覆盖了较为知名的景点和特色小吃。

上海交通大学人工智能研究院常务副院长杨小康称,国内的大模型研发可谓是“真正的诸神之战”,“据说有70几个大模型,甚至上百个大模型在研发”。他认为,研究大模型非常耗能,需要有序引导,形成合力。

贵安新区科创产业发展公司常务副总经理邓周灰提到“铁三角”理论:大模型是“大数据+大算力+强算法”结合的产物。他认为:“当前数据质量是一个比较堪忧的问题,国外进行大模型训练的时候,有很多不错的文献,还有一些科技文献,所以模型训练出来的智能化水平很高。但是我们现在在大模型训练的时候,大部分(语料)来自互联网,所以质量就不是特别理想。”

古人常说,兵马未动,粮草先行。在人工智能时代,数据正是“喂养”大模型的粮草。而在目前,“粮草”供应还存在大量现实困难。

晶泰智药技术(上海)有限公司副总裁王明泰说,数据需要标注和清洗,但医药研发领域有大量数据无法标注。王明泰表示,蛋白质序列可达到十亿级以上,但目前能够找到的蛋白质功能数据少之又少,“中间有巨大的差距”。

他还表示:“现在的数据主要是靠人做实验,然后提取录入系统,再‘喂’给机器学习。目前我们保守估计,中国可能有超过20万人在为全世界医药研发企业做实验,这些人可能都是本科以上学历,以后可能(招不来)这么多人来做实验了。”这意味着数据产生的成本极高,而要“喂养”大模型,“必须是廉价产生的数据”。

在数据的源头,还存在标准不统一的问题。

达而观信息科技(上海)有限公司首席战略官刘江贤认为,要注意梳理我们究竟需要什么样的数据、怎样才能产生高标准的数据。他认为,首先要制订数据产生的标准和流程,选准产生大量有质量、有价值数据的区域,“要制定标准化生产的流程,才能够产生出我们想要的数据。”

在本届数博会的多场论坛上,嘉宾们提到了数据流通、交易的问题。

2020年4月,《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》对外公布,将数据定义为继土地、劳动力、资本、技术之后的第五大生产要素。2022年6月,中央全面深化改革委员会第二十六次会议上审议通过了《关于构建数据基础制度更好发挥数据要素作用的意见》,明确要建立数据产权制度、要建立合规高效的数据要素流通和交易制度、完善数据要素市场化配置机制。

北京雁栖湖应用数学研究院研究员、清雁科技董事长韩立岩接受中青报·中青网记者专访时解释说,数据成为生产要素、可以进入资产负债表,意味着它是企业资产的一部分,可以成为质押标的、帮企业融资,更可以为企业增信。这对于轻资产的科创企业尤为重要。

广州数据交易所总经理魏东说,湛江一家水产公司在广州数据交易所做了合规登记后,银行给予它的授信额度不仅增加了数倍规模,花费的时间也大为减少。

中国人工智能开源软件发展联盟副理事长王健宗说,以前数据不是生产要素,在企业产生后也不受重视,“可能都作为废品处理,有人要就拿走”。“现在(数据)定义为生产要素,毫无疑问大家都重视起来,一旦重视就是香饽饽了,共享和流通就存在了困难。”他说。

作为清华大学和北京雁栖湖应用数学研究院联合孵化的高科技公司,清雁科技正在建设“可信数据空间”,在这个虚拟空间里,他们努力让数据“可用但不可见”,由此既能促进数据资产的交易与共享,又能确保数据安全。

大模型产业之路,绕不开科技伦理和就业焦虑

上海山丘联康健康管理有限公司创始人、董事长颜艳春用充满诗意的语言表达了他的期待:“在工业文明时代,我们发现人类变成了机器,我们每个工人变成了流水线上的螺丝钉。ChatGPT会带来人类巨大的解放。”

他设想,人类也许不必“996”,“我们也许(每周工作)一天、两天就够了,因为有一个更庞大的‘新人类军团’正在面世。”

其实,新人类军团的“先遣部队”已经面世数年。早在2018年,戴姆勒金融服务就展示了它的第一个数字销售代表Sarah,她可以为人们计算买新款奔驰汽车的性价比,还可以为客户选择选装套件。同年2月,英国苏格兰皇家银行聘用了一位虚拟的客服机器人Cora,她了解客户喜好,能一眼识别出客户并叫出名字,一天能处理上千个问题,她还能从错误中不断学习。也是在2018年,瑞银集团宣布数字化“复制”了其首席经济学家,推出数字人……

颜艳春对于未来非常乐观:“我们认为,下一个50年,当碳基和硅基生命共生共荣时,每一个人都可能成为一个诗人,成为一个作家,成为一个导演,成为一个画家。甚至人人都有可能成为老师、医生和码农。”

他引用了泰戈尔在《飞鸟集》中的一句诗:信念是鸟,它在黎明仍然黑暗之际感觉到光明,唱出了歌。他说:“在当今人类文明高度‘内卷’的当下,我认为人工智能给我们带来了这样一场新的光明。”

一边是高歌猛进的人工智能技术,一边是技术担忧论:人工智能首先带来的,可能不是劳动力的解放,而是失业的浪潮。

孙茂松提到,过去20多年,人工智能给一些企业创造了巨大的价值;它还能使知识工作者的工作效率大大提高,预期到2030年,它会使财会人员的效率提高一倍、让程序员编程效率提高两倍。

“这对公司是好事,对个人不一定是好事。意味着财会人员要砍掉一半,意味着75%的程序员可能不需要了。”他说。而剩下的人,需要拥有更高的水平。

中青报·中青网记者 李雅娟 实习生 卢世龙 来源:中国青年报



Tags:大模型   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
华为笔记本将接入盘古大模型!全新华为MateBook X Pro即将发布
快科技4月10日消息,华为官方宣布,华为将于4月11日举办新品发布会。据了解,此次发布会将推出全新的华为MateBook X Pro,而预热海报的主题是“轻且强”。这里的“强”不仅仅是指性...【详细内容】
2024-04-10  Search: 大模型  点击:(4)  评论:(0)  加入收藏
行业大模型快速落地的一年,如何做?
生成式AI正成为时下科技企业“讲故事”的关键词之一。但从发展上看,无论是“文生文”的大语言模型,还是“文生图”的多模态模型,更多的是辅助人们进行一些简单的办公,或者提供一...【详细内容】
2024-04-10  Search: 大模型  点击:(3)  评论:(0)  加入收藏
AI是万灵药?Meta要把大模型塞进AR眼镜里
寻找下一块“屏幕”,这无疑是最近几年科技行业的一个热门赛道。随着个人计算机点燃了互联网,智能手机让移动互联网无处不在之后,这前后两次造富神话的出现,也让所有人都在期待下...【详细内容】
2024-04-09  Search: 大模型  点击:(5)  评论:(0)  加入收藏
AI程序员上岗 垂类大模型应用迎来井喷期
能自动写代码的“AI员工”、逐渐告别不够好用的智能客服,无需费时费力开发的工业AI控制器……随着人工智能大模型能力开始深入多个行业,IT、工业生产、金融、服务...【详细内容】
2024-04-07  Search: 大模型  点击:(4)  评论:(0)  加入收藏
AI干掉声优?音频大模型追逐“图灵时刻”
七十年前,“人工智能之父”图灵提出,如果人无法判断屏幕的另一侧究竟是人还是机器,就证明机器具备了人一样的智能。这一经典的图灵测试如同北斗星一般,指引着AI行业的工作者们不...【详细内容】
2024-04-03  Search: 大模型  点击:(5)  评论:(0)  加入收藏
大模型Kimi火了,长文本“卷”出新高度
近日,AI智能助手Kimi宣布支持200万字无损上下文,在长上下文窗口技术上再次取得突破,引燃人工智能领域新一轮投资热情。  摄影/宁颖OpenAI官方去年11月发布的GPT-4 Turbo,支持1...【详细内容】
2024-03-29  Search: 大模型  点击:(13)  评论:(0)  加入收藏
大模型应用的 10 种架构模式
作者 | 曹洪伟在塑造新领域的过程中,我们往往依赖于一些经过实践验证的策略、方法和模式。这种观念对于软件工程领域的专业人士来说,已经司空见惯,设计模式已成为程序员们的重...【详细内容】
2024-03-27  Search: 大模型  点击:(13)  评论:(0)  加入收藏
超长文本是AI大模型的能力突破口吗?
◎记者 刘怡鹤近日,能“一口气读完20万字小说”的AI大模型应用Kimi再次为国内AI产业添了一把火。业内认为,国产大模型能力提升或成今年国内AI领域最核心的主线。超长上下文是...【详细内容】
2024-03-26  Search: 大模型  点击:(8)  评论:(0)  加入收藏
百度AI“咬”了一口苹果 大模型商用有戏了?
百度3月25日突传利好。据知情人士透露,百度将为苹果今年发布的iPhone16、Mac系统和ios18提供AI功能。消息人士称,苹果曾与阿里以及另外一家国产大模型公司进行过洽谈,最后确定...【详细内容】
2024-03-26  Search: 大模型  点击:(19)  评论:(0)  加入收藏
Kimi引燃大模型“长文本竞赛”,阿里360百度急出手
从ChapGPT到Sora,从数千亿参数到千万长文本,大模型浪潮下,永远不缺热点。近日,“Kimi概念股暴涨”“Kimi为宕机道歉”等词条先后冲上微博热搜,让月之暗面这家刚成立一年的人工智...【详细内容】
2024-03-25  Search: 大模型  点击:(15)  评论:(0)  加入收藏
▌简易百科推荐
英特尔发布新一代AI芯片并首推AI芯片代工 “单挑”英伟达和台积电
新华财经上海4月11日电 当地时间4月9日,英特尔在Vision 2024客户和合作伙伴大会上宣布推出最新AI芯片产品Gaudi 3加速器。英特尔称,相比英伟达的H100 GPU,Gaudi3 AI芯片的模型...【详细内容】
2024-04-11    上海证券报  Tags:英特尔   点击:(2)  评论:(0)  加入收藏
AI“复活”亲人成生意,哪些红线待划定?
提供一张照片、一段10多秒的音频,即可让逝者在视频中“活”过来——AI“复活”亲人成生意,哪些红线待划定?本报记者 陶稳《工人日报》(2024年04月11日 06版)阅读提示...【详细内容】
2024-04-11    工人日报  Tags:AI   点击:(2)  评论:(0)  加入收藏
谷歌推出适用于安卓设备的“查找我的设备”网络
IT之家 4 月 9 日消息,谷歌今日推出了适用于安卓设备的“查找我的设备”网络,其功能类似于苹果的“查找”网络,旨在帮助用户定位丢失、被盗的安卓产品。IT之家注意到,与苹果的“...【详细内容】
2024-04-09    IT之家  Tags:安卓   点击:(2)  评论:(0)  加入收藏
你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢
2026年的数据荒越来越近,硅谷大厂们已经为AI训练数据抢疯了。它们纷纷豪掷十数亿美元,希望把犄角旮旯里的照片、视频、聊天记录都给挖出来。不过,如果有一天AI忽然吐出了我们的...【详细内容】
2024-04-09    新智元  Tags:硅谷   点击:(2)  评论:(0)  加入收藏
谷歌搜索史上最大变革!考虑对AI搜索收费
快科技4月7日消息,据国外媒体报道,谷歌正计划对由生成式人工智能驱动的新高级功能收费,这将是谷歌搜索业务历史上最大的一次变革。自2000年以来,谷歌的搜索产品一直依靠广告盈利...【详细内容】
2024-04-08    快科技  Tags:谷歌搜索   点击:(8)  评论:(0)  加入收藏
为训练AI,OpenAI等科技巨头花式淘数据
[环球时报特约记者 甄翔]《纽约时报》6日披露了科技公司训练人工智能的秘密——利用语音识别工具转录视频网站YouTube上的视频,形成对话文本数据,供其最新的AI学习...【详细内容】
2024-04-08    环球网  Tags:AI   点击:(9)  评论:(0)  加入收藏
训出GPT-5短缺20万亿token!OpenAI被曝计划建「数据市场」
全网真的无数据可用了!外媒报道称,OpenAl、Anthropic等公司正在努力寻找足够的信息,来训练下一代人工智能模型。前几天,OpenAI和微软被曝出正在联手打造超算「星际之门」,解决算...【详细内容】
2024-04-08    新智元  Tags:GPT-5   点击:(2)  评论:(0)  加入收藏
当“机器人”有了“AI大脑” 人形机器人时代来了吗
数智风向标当“机器人”有了“AI大脑”​人形机器人时代来了吗简单明了的口令下达后,机器人便开始搬箱子、运小球,在各类不同的地形行走……这些身上布满芯片和传...【详细内容】
2024-04-08    中国青年报  Tags:机器人   点击:(5)  评论:(0)  加入收藏
报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4
IT之家 4 月 7 日消息,本周早些时候,《华尔街日报》报道称 AI 公司在收集高质量训练数据方面遇到了困难。今天,《纽约时报》详细介绍了 AI 公司处理此问题的一些方法,其中涉及到...【详细内容】
2024-04-07    IT之家  Tags:OpenAI   点击:(7)  评论:(0)  加入收藏
量子计算会和经典计算一样融入人们的日常生活
作为2024中国网络媒体论坛打造的创新活动之一,“技术赋能·八点见”创新项目发布会于3月30日晚在云南昆明举行。活动现场,本源量子计算科技(合肥)股份有限公司(以下简称“...【详细内容】
2024-04-03    人民网  Tags:量子计算   点击:(8)  评论:(0)  加入收藏
站内最新
栏目相关
  • · 英特尔发布新一代AI芯片并首推AI芯片代工 “单挑”英伟达和台积电
  • · AI“复活”亲人成生意,哪些红线待划定?
  • · 谷歌推出适用于安卓设备的“查找我的设备”网络
  • · 你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢
  • · 谷歌搜索史上最大变革!考虑对AI搜索收费
  • · 为训练AI,OpenAI等科技巨头花式淘数据
  • · 训出GPT-5短缺20万亿token!OpenAI被曝计划建「数据市场」
  • · 当“机器人”有了“AI大脑” 人形机器人时代来了吗
  • · 报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4
  • · 量子计算会和经典计算一样融入人们的日常生活
  • · ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?
  • · 谷歌为了结集体诉讼,同意删除 Chrome 无痕模式下收集的用户数据
  • · 哥伦比亚大学华人开发「人脸机器人」,照镜子自主模仿人类表情超逼真
  • · 谷歌服务现已支持使用 Windows Hello 人脸和指纹解锁登录
  • · GPT商店热度不尽人意 仅用在写论文和炒股票上较受欢迎
  • · 距实现全球安全量子通信更近一步:量子点源产生近乎完美纠缠光子对
  • · 中国三大运营商共同发布通过GSMA Open Gateway认证的一次性密码 API
  • · 马斯克脑机接口再造奇迹:瘫痪小伙意念玩赛车击败正常人
  • · 国家数据局局长刘烈宏:充分发挥数据要素价值 培育新质生产力
  • · 谷歌Chrome巨变:第三方Cookie的终结将重塑互联网格局
  • 站内热门
    相关头条
  • · 谷歌搜索史上最大变革!考虑对AI搜索收费
  • · ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?
  • · 马斯克脑机接口再造奇迹:瘫痪小伙意念玩赛车击败正常人
  • · Kimi引燃大模型“长文本竞赛”,阿里360百度急出手
  • · 瘫痪8年小哥植入马斯克脑机接口,狂打8小时「文明6」!Neuralink首个人类植入者直播来了
  • · 英伟达“算力核弹”强在哪里?
  • · AI大模型之争远未落幕
  • · 世界首款!英伟达重磅发布人形机器人模型
  • · 全程回顾黄仁勋GTC演讲:Blackwell架构B200芯片登场
  • · 真“Open ” AI?马斯克旗下大模型Grok宣布开源:参数量全球最大
  • · 全球首位AI程序员诞生 人类程序员会失业吗?
  • · 谷歌宣布更新搜索算法:打击AI生成内容,提高搜索结果质量
  • · 英伟达、微软等巨头“抱团”,AI有望助推6G时代到来 国内产业如何接招?
  • · OpenAI Sora已开放对外申请 网友爆料:可能还有其它重磅产品发布
  • · 周鸿祎再谈Sora:真正给人工智能补上了“眼睛”
  • · Sora爆火超100小时:美国狂“卷”算力,国内则卖 AI 课程“捞金”一年5000万|钛媒体AGI
  • · 爆火Sora参数规模仅30亿?谢赛宁等大佬技术分析来了
  • · “AI女友”霸占GPT商店,OpenAI苦不堪言:开发者也难出头!
  • · 从居家到工作,CES 2024上演 AI硬件大秀
  • · OpenAI新年头号重磅!GPT Store上线,企业客户新品也来了
  • 站内头条