您当前的位置:首页 > 新闻资讯 > 科技

阿里GPT测评:AI摩尔定律时代真的来了?

时间:2023-04-11 11:21:57  来源:电脑报  作者:

半导体领域的摩尔定律正在失效,AI世界的“摩尔定律”才刚开始。不久前,OpenAI CEO 、“ChatGPT之父”Sam Altman发文指出,全球AI运算量每隔18个月就会提升一倍。从科技公司对GPT你追我赶的态势看,“AI摩尔定律”,也许正在成为全球大模型竞争的节拍器。

继OpenAI、微软、谷歌之后,中国公司也正加速公布各自的大模型研发进展。上周,阿里云官宣其大模型“通义千问”启动企业邀测,达摩院多年磨一剑的AI研发工作初现真身。电脑报参与了“通义千问”的定向邀测,短短几天内,感受到了中国大模型「以日为进」的成长速度。

阿里云大模型“通义千问”亮相

从OpenAI 的ChatGPT到百度的文心一言,同AI对话成功挑起人类的好奇心,而就在人们为“哪家AI更聪明”争论不休时,阿里云突然宣布“通义千问”开始企业邀测。

“通义千问,一个专门响应人类指令的大模型。我是效率助手,也是点子生成机,我服务于人类,致力于让生活更美好。”——这是“通义千问”官方主页上对自己的介绍,单从字面上了解,“通义千问”更像是一个问答平台或对话工具,但登录进入其交互界面后,“通义千问”对自己的“工作范畴”其实是有引导性解释的。

在“通义千问”页面最下方的“百宝袋”通道,展示了9种应用,这些应用被分为3类:效率类、生活类和娱乐类。

在娱乐类应用中,有“彩虹屁专家”“写情书”“为你写诗”3个功能,比如“彩虹屁专家”,当你想夸别人,却不知道怎么夸的时候,就能让通义千问帮吹一些彩虹屁。

显然,从这9种应用定位可以看出,“通义千问”并非单纯用于对话娱乐,更有生产力工具属性,而在我们输入“通义千问自身定位是?”提问时,它是这么回答的。

以“日”为单位成长的AI

“最初第一批拿到测试资格时蛮兴奋的,第一时间就尝试同‘通义千问’进行对话,但对话结果却有些失望,除‘牛头不对马嘴’外,更给出了不少错误答案。可当我们带着失望心情在第二天输入同样问题时,‘通义千问’竟给出了近乎完美的正确答案,这种‘低开高走’的测试真的很刺激,‘通义千问’真是以肉眼可见的速度在成长!”

2023年4月8日,《电脑报》记者根据热点新闻事件向“通义千问”提出“能否制作一段有关石墨烯的视频脚本?”要求时,它写出来的视频脚本非常生涩,甚至像说明文多过视频脚本。

“通义千问”在4月8日时写的视频脚本更像是说明文

然而,仅仅过了一天时间,当记者在4月9日向“通义千问”再次提出“能否制作一段有关石墨烯的视频脚本?”时,“通义千问”非常准确地了解了记者需求,且创作出可行性较高的视频脚本,从旁白对话到画面设计,都给予了详细的内容和建议。

每天都在变强的“通义千问”成功吊起我们好奇心,同当下主流免费的ChatGPT(GPT3.5)和文心一言相比,“通义千问”能力究竟如何呢?

一场“谁更聪明”的对局

2023年4月9日,我们分别从逻辑思维及语言组织能力(教育心理分析)、语言文字创作能力(小学生作文)及非线性思维能力(数学组合题目)三个方面进行了横向测试。当下各家AI更新太快,本次结论仅做测试当日参考。

逻辑思维及语言组织能力:如何处理同叛逆期初中生的亲子关系?

ChatGPT(GPT3.5)在该测试场景下的表现堪称完美,整体逻辑非常有条理,将同孩子关系的处理方式方法进行了罗列,具有较强的说服性。

文心一言回答显然简单了许多,这样的回答想要说服一个叛逆期的初中生,显然不太具有可执行性。

通义千问的逻辑性已经和ChatGPT不相上下,其给出的解决办法具有比较明显的条理性。

点评:无论是ChatGPT还是通义千问,都已具备初步逻辑思维能力,完全可以应对日常交互,并针对用户需求给出符合逻辑的解决方案。

语言文字创作能力:帮我写一篇赞美秋天的作文

在文字描述细节上,ChatGPT(GPT3.5)抓住了秋天的特点,但在文章结构和具体事物的表述上显得有些僵硬,对于这样一个相对简单的入门级作文,ChatGPT(GPT3.5)的表现让人有些失望。

文心一言将果实作为赞美秋天的核心来展开,很好地领悟了中文作文“主次分明”的技巧。只是在对秋天整体的把控上稍欠火候。

通义千问的作文能力多少让人有些惊喜,总分总的结构拿捏得十分到位,开篇明义的同时,通过树木、树叶、果园三个事务在秋天的表现,完成了秋天具象化描写,很好地表达了对秋天景色的赞美和喜爱之情。

点评:从作品看,三款AI在语言文字创作能力上均有不错的表现,尤其是通义千问对作文的打造显得非常“老练”,稍加修改就能成为一篇传阅的优秀范文,整体作文的逻辑性上稳压ChatGPT一筹!

非线性思维能力:老师打算将 10 张相同的积分卡分给甲、乙和菲菲,甲想得到至少 4 张,菲菲想得到至少 3 张,乙则表示无所谓,给不给他都行,若老师打算满足每个人的要求,共有多少种分法呢?

答案错误,显然,ChatGPT(GPT3.5)这一次在一本正经的胡说八道。

答案错误,虽然文心一言简短的回答看上去挺有自信,可答案依旧错了。

通义千问的解题思路非常清楚,条理清楚地对问题进行了分布求解,不过遗憾的是依旧没有给出正确答案。

点评:相对于编程、鸡兔同笼、流水行船、牛吃草等线性思维的数学学科题目,排列组合这类非线性思维模式题目能考验AI自主思考能力。显然,从这道题目的测试情况看,三家AI均败下阵来,不过非线性学科问题本身就是AI测试的难点,很期待未来AI在该领域的表现。

科技巨头的大模型之战

“通义千问”并非凭空出现,而是阿里厚积薄发的结果。

阿里达摩院深耕 NLP 领域,在大模型技术路径上具备多年前瞻技术积累,阿里达摩院于2019 年启动大模型研发,在超大模型、语言及多模态能力、低碳训练、平台化服务、落地应用等多个方面,为中文大模型的发展做出一系列探索工作。

动辄超千亿参数的大模型研发,不是单一的算法问题,也不是简单的堆算力的过程,这是囊括了底层算力、网络、存储、数据清洗与治理、AI 框架、AI 算法、人类调优等多个方面的系统性工程问题。

目前头部科技企业均采取“模型+工具平台+生态”三层共建模式,有助于业务的良性循环,也更容易借助长期积累形成竞争壁垒,国内大模型厂商目前主要为百度、阿里两家。

2022 年 9 月,在世界人工智能大会上,阿里巴巴达摩院主办“大规模预训练模型”主题论坛,达摩院副院长周靖人发布阿里巴巴最新“通义”大模型系列,并宣布相关核心模型向全球开发者开源开放;2022年云栖大会上,阿里推出魔搭平台,并在业界率先提出“模型即服务”(Model as a service,MaaS)概念。面向大模型通用性与易用性仍欠缺的难题,通义打造了业界首个 AI 统一底座,并构建了大小模型协同的层次化人工智能体系,将为 AI 从感知智能迈向知识驱动的认知智能提供先进基础设施。

以统一底座为基础,达摩院构建了层次化的模型体系,其中,通用模型层覆盖自然语言处理、多模态、计算机视觉,专业模型层深入电商、医疗、法律金融、娱乐等行业。

而如此庞大的构想底气源自阿里系庞大的算力。根据行业权威研究机构Gartner 2021 年全球云计算IaaS 市场份额数据显示,阿里云排名全球第三,市场份额为9.55%,连续六年实现份额增长;同时,阿里云排名亚太市场第一,市场份额为25.53%。

在AI 算力方面,2022 年阿里云宣布正式推出全栈智能计算解决方案“飞天智算平台”,为科研、公共服务和企业机构提供强大的智能计算服务,通过先进的技术架构,飞天智算平台实现了90%的千卡并行计算效率,可将算力资源利用率提高3 倍以上,AI 训练效率提升11 倍,推理效率提升6 倍。

依托于坚实的云计算底座,AI正像水一样浸润到千行百业,帮助更多企业从数字化走向智能化,更多应用涌现出更智能的新功能和新体验。

对于这样的变革,你会期待吗?



Tags:阿里GPT   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
阿里GPT测评:AI摩尔定律时代真的来了?
半导体领域的摩尔定律正在失效,AI世界的“摩尔定律”才刚开始。不久前,OpenAI CEO 、“ChatGPT之父”Sam Altman发文指出,全球AI运算量每隔18个月就会提升一倍。从科技公司对GP...【详细内容】
2023-04-11  Search: 阿里GPT  点击:(130)  评论:(0)  加入收藏
▌简易百科推荐
Meta推出新版自研AI芯片:性能较上代提高三倍,降低对英伟达依赖
AI(人工智能)芯片紧缺之际,越来越多科技巨头选择自行研发。当地时间4月10日,社交巨头Meta公布了自主研发芯片MTIA的最新版本。MTIA是Meta专门为AI训练和推理工作设计的定制芯片...【详细内容】
2024-04-11    澎湃新闻  Tags:Meta   点击:(1)  评论:(0)  加入收藏
英特尔发布新一代AI芯片并首推AI芯片代工 “单挑”英伟达和台积电
新华财经上海4月11日电 当地时间4月9日,英特尔在Vision 2024客户和合作伙伴大会上宣布推出最新AI芯片产品Gaudi 3加速器。英特尔称,相比英伟达的H100 GPU,Gaudi3 AI芯片的模型...【详细内容】
2024-04-11    上海证券报  Tags:英特尔   点击:(2)  评论:(0)  加入收藏
AI“复活”亲人成生意,哪些红线待划定?
提供一张照片、一段10多秒的音频,即可让逝者在视频中“活”过来——AI“复活”亲人成生意,哪些红线待划定?本报记者 陶稳《工人日报》(2024年04月11日 06版)阅读提示...【详细内容】
2024-04-11    工人日报  Tags:AI   点击:(2)  评论:(0)  加入收藏
科技巨头狂撒千亿美元 “买照片”,只为训练AI模型?
高质量的数据,越来越值钱。你能想象,那些被遗忘在网盘的陈年老图,有朝一日能价值千金?就在最近,路透社报道称,苹果公司正与图像托管网站Photobucket协商,希望得到这家公司近130亿张...【详细内容】
2024-04-10    镁客网  Tags:AI模型   点击:(0)  评论:(0)  加入收藏
谷歌推出适用于安卓设备的“查找我的设备”网络
IT之家 4 月 9 日消息,谷歌今日推出了适用于安卓设备的“查找我的设备”网络,其功能类似于苹果的“查找”网络,旨在帮助用户定位丢失、被盗的安卓产品。IT之家注意到,与苹果的“...【详细内容】
2024-04-09    IT之家  Tags:安卓   点击:(2)  评论:(0)  加入收藏
你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢
2026年的数据荒越来越近,硅谷大厂们已经为AI训练数据抢疯了。它们纷纷豪掷十数亿美元,希望把犄角旮旯里的照片、视频、聊天记录都给挖出来。不过,如果有一天AI忽然吐出了我们的...【详细内容】
2024-04-09    新智元  Tags:硅谷   点击:(2)  评论:(0)  加入收藏
谷歌搜索史上最大变革!考虑对AI搜索收费
快科技4月7日消息,据国外媒体报道,谷歌正计划对由生成式人工智能驱动的新高级功能收费,这将是谷歌搜索业务历史上最大的一次变革。自2000年以来,谷歌的搜索产品一直依靠广告盈利...【详细内容】
2024-04-08    快科技  Tags:谷歌搜索   点击:(8)  评论:(0)  加入收藏
为训练AI,OpenAI等科技巨头花式淘数据
[环球时报特约记者 甄翔]《纽约时报》6日披露了科技公司训练人工智能的秘密——利用语音识别工具转录视频网站YouTube上的视频,形成对话文本数据,供其最新的AI学习...【详细内容】
2024-04-08    环球网  Tags:AI   点击:(9)  评论:(0)  加入收藏
训出GPT-5短缺20万亿token!OpenAI被曝计划建「数据市场」
全网真的无数据可用了!外媒报道称,OpenAl、Anthropic等公司正在努力寻找足够的信息,来训练下一代人工智能模型。前几天,OpenAI和微软被曝出正在联手打造超算「星际之门」,解决算...【详细内容】
2024-04-08    新智元  Tags:GPT-5   点击:(2)  评论:(0)  加入收藏
当“机器人”有了“AI大脑” 人形机器人时代来了吗
数智风向标当“机器人”有了“AI大脑”​人形机器人时代来了吗简单明了的口令下达后,机器人便开始搬箱子、运小球,在各类不同的地形行走……这些身上布满芯片和传...【详细内容】
2024-04-08    中国青年报  Tags:机器人   点击:(5)  评论:(0)  加入收藏
相关文章
    无相关信息
站内最新
栏目相关
  • · Meta推出新版自研AI芯片:性能较上代提高三倍,降低对英伟达依赖
  • · 英特尔发布新一代AI芯片并首推AI芯片代工 “单挑”英伟达和台积电
  • · AI“复活”亲人成生意,哪些红线待划定?
  • · 科技巨头狂撒千亿美元 “买照片”,只为训练AI模型?
  • · 谷歌推出适用于安卓设备的“查找我的设备”网络
  • · 你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢
  • · 谷歌搜索史上最大变革!考虑对AI搜索收费
  • · 为训练AI,OpenAI等科技巨头花式淘数据
  • · 训出GPT-5短缺20万亿token!OpenAI被曝计划建「数据市场」
  • · 当“机器人”有了“AI大脑” 人形机器人时代来了吗
  • · 报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4
  • · 量子计算会和经典计算一样融入人们的日常生活
  • · ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?
  • · 谷歌为了结集体诉讼,同意删除 Chrome 无痕模式下收集的用户数据
  • · 哥伦比亚大学华人开发「人脸机器人」,照镜子自主模仿人类表情超逼真
  • · 谷歌服务现已支持使用 Windows Hello 人脸和指纹解锁登录
  • · GPT商店热度不尽人意 仅用在写论文和炒股票上较受欢迎
  • · 距实现全球安全量子通信更近一步:量子点源产生近乎完美纠缠光子对
  • · 中国三大运营商共同发布通过GSMA Open Gateway认证的一次性密码 API
  • · 马斯克脑机接口再造奇迹:瘫痪小伙意念玩赛车击败正常人
  • 站内热门
    相关头条
  • · 谷歌搜索史上最大变革!考虑对AI搜索收费
  • · ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?
  • · 马斯克脑机接口再造奇迹:瘫痪小伙意念玩赛车击败正常人
  • · Kimi引燃大模型“长文本竞赛”,阿里360百度急出手
  • · 瘫痪8年小哥植入马斯克脑机接口,狂打8小时「文明6」!Neuralink首个人类植入者直播来了
  • · 英伟达“算力核弹”强在哪里?
  • · AI大模型之争远未落幕
  • · 世界首款!英伟达重磅发布人形机器人模型
  • · 全程回顾黄仁勋GTC演讲:Blackwell架构B200芯片登场
  • · 真“Open ” AI?马斯克旗下大模型Grok宣布开源:参数量全球最大
  • · 全球首位AI程序员诞生 人类程序员会失业吗?
  • · 谷歌宣布更新搜索算法:打击AI生成内容,提高搜索结果质量
  • · 英伟达、微软等巨头“抱团”,AI有望助推6G时代到来 国内产业如何接招?
  • · OpenAI Sora已开放对外申请 网友爆料:可能还有其它重磅产品发布
  • · 周鸿祎再谈Sora:真正给人工智能补上了“眼睛”
  • · Sora爆火超100小时:美国狂“卷”算力,国内则卖 AI 课程“捞金”一年5000万|钛媒体AGI
  • · 爆火Sora参数规模仅30亿?谢赛宁等大佬技术分析来了
  • · “AI女友”霸占GPT商店,OpenAI苦不堪言:开发者也难出头!
  • · 从居家到工作,CES 2024上演 AI硬件大秀
  • · OpenAI新年头号重磅!GPT Store上线,企业客户新品也来了
  • 站内头条