您当前的位置:首页 > 新闻资讯 > 科技

Kimi、通义千问、Claude“变身”马斯克,它们这样评价雷军

时间:2024-05-07 09:09:03  来源:中国企业家  作者:

长文本对大模型而言为何重要?

文|孙欣

编辑|姚赟

头图来源|视觉中国(13.740, 0.00, 0.00%)

200万字,意味着什么?《埃隆·马斯克传》30万字,《红楼梦》70万字,《后宫甄嬛传》100万字。如果按照20分钟看1万字的阅读速度来计算,1小时阅读3万字,那么200万字大概要读66.67个小时。

而这样马拉松式的阅读,大概率是囫囵吞枣。

3月18日,国内AI创业公司月之暗面(Moonshot AI)宣布在大模型长上下文窗口技术上取得新的突破,Kimi智能助手已支持200万字超长无损上下文,并于即日起开启产品“内测”。而后,各大公司跟进,卷起了文本长度。22日,阿里通义千问向所有人免费开放1000万字的长文档处理功能;23日,360智脑宣布内测可处理500万字功能。

也就是说,现在,10分钟左右Kimi、通义千问、360智脑等产品就可以读完《埃隆·马斯克传》《红楼梦》《后宫甄嬛传》三本书,且能结合上下文理解其中的内容。

实际上,长文本早已是AGI(通用人工智能)的必争之地:2023年11月,OpenAI发布了GPT4 Turbo,最高支持128k上下文长度的输入;14天后,Antrophric紧急发布Claude 2.1,宣布上下文能力的突破,从100k提升到了200k;2024年2月,Gemini 1.5宣布长文本窗口支持100w长度,为75万文字。

那这些数字和标准到底意味着什么?长文本上下文处理能力到底是什么功能?我们挑选了Kimi、通义千问、Claude等产品进行测试体验。

Antrophric的Claude,此前一直以抢眼的长文本处理能力被人认可;阿里的通义千问目前可处理1000万文字,字数量级属于第一梯队;Kimi因长文本上下文处理能力让月之暗面在国内AI创业中首次出圈。

第一步:把Kimi、通义千问、Claude“喂成”马斯克

“如果有机会,我当然愿意和雷军交流。”Kimi化身马斯克对我说道。

来源:Kimi截图

为了更好地测评长文本上下文处理能力,我们同时给Kimi、通义千问、Claude输入约37万字的《埃隆·马斯克传》,并让它们用马斯克的思维和语气来和我们进行对话。

(1)最多可同时上传500个文件,支持多种格式

当我们输入文档时,三者解析条件和所用时间相似。

通义千问解析文档,可同时上传100个文件,每个不超过150MB,支持PDF、wordExcel、Markdown、EPUB、Mobi、txt等形式。

Kimi解析文档可同时上传最多500个,每个不超过100MB,支持doc、xisx、PPT、txt、图片等文件形式。值得注意的是,Kimi需要申请长文本上下文能力内测资格,申请通过后即可免费使用。

Claude解析文档可同时上传最多5个文件,每个文件不超过10MB,支持docs和images文件形式。因此当文档较大时,我们需将其分解成几个不超过10MB的docs文件开始解析。

来源:通义千问截图

(2)联网的Kimi更懂端妃

我们分别输入了约100万字的《后宫甄嬛传》小说,并对它们进行提问。“你认为《甄嬛传》中谁最有可能成为一个成功的企业家?”几秒钟后我们分别得到了这样的回答。

Kimi给出了甄嬛、沈眉庄、华妃、端妃、皇后五个答案,并对每个答案进行了分析。如,甄嬛是因为“能够在复杂的后宫环境中生存并逐步提升自己的地位”,沈眉庄是因为“稳重和深思熟虑”,华妃是因为“在后宫中拥有较高的地位和权力”,皇后是因为“作为后宫之主”。

Kimi的这一回答中,给端妃的理由比较有趣,在书中没有直接写到。Kimi认为端妃是因为“虽然在小说中不如甄嬛和华妃那样显眼,但她能够在后宫中保持一定的地位和影响力,说明她在人际关系和个人发展上的‘投资’也相对成功”。

来源:Kimi截图

而Claude却给出了一个在《后宫甄嬛传》中不存在的角色——纯妃,并给纯妃设定了有洞察力、判断力、虚心求教、勤奋好学、擅长处理人际关系、勇于创新、坚韧等品格设定。

来源:Claude截图

3月18日,Kimi在官方发布直播中,月之暗面AI Infra负责人许欣然提到了一万小时定律,即要想成为一个领域的专家,我们至少需要学习一万小时。而现在只需要10分钟,Kimi就能接近任何一个新领域的初级专家水平。

在直播中,许欣然还现场输入了约100万字的《倚天屠龙记》复印件、100万字的《甄嬛传》剧本,不到10分钟,Kimi就成了“倚学家”“甄学家”。

我们继续测试。

我们在未向Kimi提供《埃隆·马斯克传》时,输入了“请以马斯克的思想和语气与我对话”。

Kimi在开始和最后都强调了本次回答是“模仿马斯克的风格”,并不代表其本人和相关公司的真实观点。面对这个问题,化身为马斯克的“K斯克”是这样评价雷军和小米SU7的。它认为,“雷军是一位非常出色的企业家”“小米SU7汽车是一个非常有趣的产品”。最后还给出了建议,“作为一家新进入电动汽车领域的公司,小米还有很长的路要走。他们需要在技术创新、生产效率、供应链管理等方面不断努力。”

Kimi阅读《埃隆·马斯克传》之前的回答版本。来源:Kimi截图

我们又将该书“喂”给了Kimi,解析此书后,它给出相似的回答。

Kimi阅读《埃隆·马斯克传》之后的回答版本。来源:Kimi截图

我们重复了上一步,将同样的问题给到通义千问。通义千问给到的回答中,关于小米SU7的内容为:“虽然具体型号和细节在现实中可能不存在,但基于小米进入电动汽车领域的假设……”

通义千问阅读《埃隆·马斯克传》之后的回答版本。来源:通义千问截图

如法炮制,继续测试Claude,结果与通义千问相似。

据了解,作为大模型产品,Kimi除了文档解读,还有联网功能。这意味着,Kimi不但可以使用既定资料分析,还可以根据问题搜索全网信息作为数据分析依据。目前,ChatGPT 3.5、Claude 2.0不支持这项功能。

(3)文档检索三者能力相近

为了测试Kimi、通义千问、Claude的文档内容理解功能,在向三者都输入了《埃隆·马斯克传》之后,我们针对于书中的内容进行了提问。

来源:Kimi回答截图

来源:通义千问回答截图

来源:Claude回答截图

针对该书同一个问题,三者的回答相似且较为准确,都提到了马斯克觉得这是《蝇王》故事现实版,分到少量的食物和水,瘦了10磅等细节。

(4)Kimi看到了马斯克的成功者特质,Claude更关注马斯克的内心世界

在一个聊天框中输入的内容被称之为“上下文”。上下文之间的理解能力也至关重要,段落之间割裂,会导致上下文信息的丢失,对于AI给出答案的准确度也有影响。

例如,如果用户在对话中提到了特定的话题或问题,具有上下文能力的AI可以记住这些信息,并在后续的对话中引用它们,以提供连贯和相关的回答。这种能力对于创建自然、流畅的对话体验非常重要。

为测试三者上下文文本处理功能,我们提问了马斯克12岁时的学校经历后,追问了“马斯克的性格是怎么样的”。

Claude给出了狂热执着、冷酷无情、戏剧化、顽强坚韧、双重性格等特征,同时,针对这些特征一一进行了分析。如狂热执着是因为“他对现实宏伟目标如开发电动车、登陆火星等怀有先知般的狂热和使命感。这种狂热忽视了他的笨拙,也促使他勇于冒险并承担极高的风险”。

来源:Claude回答截图

来源:通义千问回答截图

来源:Kimi回答截图

通义千问也提到了宏大愿景、推动普及电动车、移民火星等内容。区别是,通义千问将这些“理想主义与远见卓识”,将马斯克形容为“坚信通过科技可以解决人类面临的问题”。

Claude、通义千问和Kimi给出的这些特质中,也都提到了马斯克冷酷无情、双重性格、戏剧化、矛盾性等“负面”特征。Claude将马斯克总结为“性格狂热、冷酷、喜好戏剧化、坚韧顽强,但又带着某些孩子般的天真和脆弱”。而Kimi将其总结为“非常独特的个体”,并认为他在科技和商业领域的成就很大程度上得益于这些性格。

长文本,AI“登月”第一步

长文本对大模型而言为何重要?

“为什么长文本是‘登月’第一步?它很本质。它是新的计算机内存。”月之暗面创始人、CEO杨植麟曾在腾讯科技的采访中表示,长文本(Long Context)是大语言模型(LLM)的基础能力。

此前,杨植麟用了形象的比喻来描述长文本,“支持更长的上下文”意味着大模型拥有更大的“内存”。

2023年10月,Kimi上线,当时可以支持无损上下文长度最多为20万汉字。5个月内,升级至200万字,月之暗面直接将长文本能力提高至10倍。按照AI领域的计算标准,200万汉字的长度大约为400万token。而当时长文本水平在第一梯队的谷歌Gemini 1.5、Claude 3支持100万token,Kimi 200万汉字上下文长度超越了海外顶尖大模型水平。

与衡量手机、电脑性能时的“跑分”类似,大模型也有专属的“跑分”标准,被称之为token。它是一个大模型输入、输出的基本单位。以OpenAI的相关准则来看,1k的token等于750个英文单词、500个中文汉字。token越大,文本处理能力越强。据了解,当前ChatGPT 4的token是32k,Claude 3的token是100w ,Kimi的token是400w。

也就是说,可处理的文本越长,可提取内容时的素材越多,帮助用户处理信息时则越准确。

制表:孙欣(信息来源:各AI产品公司官网介绍)

据统计,长文档处理长度之最来自于阿里云的通义千问,上下文长文本处理能力最强的是来自于月之暗面的Kimi,谷歌的Gemini、Kimi均支持联网功能,不过Ultra大会员需付费,价格是每月19.99美元。

值得注意的是,目前国内的主流长文本处理产品通义千问、Kimi等均为免费申请内测即可使用,随着用户用量的增加,意味着大模型的“训练”数据也在增加,AGI长文本处理赛道正在开卷。

参考资料:

《“Kimi概念”降温,长文本“担不起”大模型的下一步》,腾讯科技

《爆火的Kimi,抢了谁的生意?》,定焦



Tags:雷军   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
Kimi、通义千问、Claude“变身”马斯克,它们这样评价雷军
长文本对大模型而言为何重要?文|孙欣编辑|姚赟头图来源|视觉中国(13.740, 0.00, 0.00%)200万字,意味着什么?《埃隆·马斯克传》30万字,《红楼梦》70万字,《后宫甄嬛传》100...【详细内容】
2024-05-07  Search: 雷军  点击:(0)  评论:(0)  加入收藏
雷军:10年编程路,给程序员的几点建议
随着小米SU7的火热发售,雷军凭借“跨界灭霸”称号又一战封神。作为中国互联网历史上极富传奇色彩的连续创业者,他向大家生动地诠释了“人生在于奋斗”的真谛。雷军作为中国第...【详细内容】
2024-04-15  Search: 雷军  点击:(14)  评论:(0)  加入收藏
小米SU7被大卸八块,雷军回应了
4月8日晚国内有一场汽车发布会,然后出现了令人不可思议的一幕。他们把小米SU7当为标杆进行对比,但却把小米SU7的参数给标错了。随后小米官方连发三条信息进行强硬回应,最后的结...【详细内容】
2024-04-09  Search: 雷军  点击:(23)  评论:(0)  加入收藏
小米SU7首批交付,大定超10万单,雷军担心的事咋解决?
4月3日上午,小米SU7首批交付仪式在北京亦庄的小米汽车工厂总装车间举行。小米集团创始人、董事长兼CEO雷军出席仪式,亲手向首批车主交车。同时,全国28城交付中心也同步开启首批...【详细内容】
2024-04-03  Search: 雷军  点击:(19)  评论:(0)  加入收藏
雷军:小米SU7大定超10万单,锁单超4万!中国必将诞生像特斯拉一样伟大的公司
快科技4月3日消息,今天,小米汽车正式开始交付,这也标志着雷军三年前的承诺变为现实。首批车主将在今天(4月3日)接收他们的小米SU7,成为这款车的首批车主。根据官方消息,5000辆小米S...【详细内容】
2024-04-03  Search: 雷军  点击:(26)  评论:(0)  加入收藏
小米SU7开启全国首批交付,雷军亲手向首批车主交车
4月3日,在北京亦庄小米汽车工厂举行的小米SU7首批交付仪式上,小米集团创始人雷军亲自迎接了每一位新车车主,并为他们开关车门。雷军在微博上分享了这一刻的喜悦:“三年前的豪言...【详细内容】
2024-04-03  Search: 雷军  点击:(27)  评论:(0)  加入收藏
最后一次创业、赌上所有荣誉 雷军发车
原标题:雷军发车来源:北京商报为了这一天,雷军准备了三年,彩排了几天。舞台上的他感慨万千,并谈道:“回想三年前,小米官宣造车的发布会,仿佛就在昨天。当时我说,小米汽车将会是我人生...【详细内容】
2024-03-29  Search: 雷军  点击:(44)  评论:(0)  加入收藏
起售价21.59万,小米汽车上市27分钟大定5万台!雷军:亏钱卖,冰箱音响真皮座椅免费送
每经编辑:张锦河据小米汽车微博3月28日晚消息,在小米汽车发布会后,小米SU74分钟大定破万,7分钟大定破2万,上市27分钟大定5万台。3月28日晚7点,在小米汽车发布上,小米集团董事长雷军...【详细内容】
2024-03-28  Search: 雷军  点击:(23)  评论:(0)  加入收藏
小米SU7本周四晚7点发布 雷军:昨天你到店里看车没?
【CNMO科技消息】小米汽车的首款车型SU7即将在本周四(3月28日)晚7点正式登场,同时,其价格也将正式揭晓。随着发布日期的日益临近,小米集团董事长兼CEO雷军近期频繁发文,为这款备受...【详细内容】
2024-03-26  Search: 雷军  点击:(23)  评论:(0)  加入收藏
雷军再谈小米SU7价格:会有点贵,亲测十多次,很强大
3月24日,小米集团董事长雷军发文,回应小米汽车价格相关的问题。他提到:这段时间很多人在追问,小米SU7为何迟迟不公布价格?雷军回应小米SU7为何迟迟不公布价格对此,雷军解释道:“整...【详细内容】
2024-03-25  Search: 雷军  点击:(33)  评论:(0)  加入收藏
▌简易百科推荐
Kimi、通义千问、Claude“变身”马斯克,它们这样评价雷军
长文本对大模型而言为何重要?文|孙欣编辑|姚赟头图来源|视觉中国(13.740, 0.00, 0.00%)200万字,意味着什么?《埃隆·马斯克传》30万字,《红楼梦》70万字,《后宫甄嬛传》100...【详细内容】
2024-05-07    中国企业家  Tags:雷军   点击:(0)  评论:(0)  加入收藏
谷歌裁掉整个Python团队!PyTorch 创始人急得直骂人:“WTF!核心语言团队无可替换”
来源:InfoQ编辑 | Tina、褚杏娟、冬梅我们长期人手不足,但是我 20 年来最好的工作。 谷歌 Python 工程师、Python 指导委员会成员 Thomas Wouters 昨天在社交媒体上发布了一...【详细内容】
2024-04-29    InfoQ  Tags:Python   点击:(12)  评论:(0)  加入收藏
黄仁勋最新访谈:AI不会完全取代人类工作
英伟达CEO黄仁勋认为,人工智能将改变世界,但人类的工作并不会因此消失。在当地时间周日晚上播出的一次采访中,黄仁勋说,随着人工智能帮助企业,它们自然会扩张。他说:“工人们为公...【详细内容】
2024-04-29  环球市场播报    Tags:黄仁勋   点击:(19)  评论:(0)  加入收藏
第一批喂养AI的「妈妈工人」,正在被抛弃
文丨徐爽编辑丨杜雯雯“妈妈工人”,她们通常被这样称呼。大多数时候,她们的工作内容是在电脑前训练AI——就像教会自己的孩子一样。在过去几年的宣传叙述中,这些女性...【详细内容】
2024-04-26    凤凰WEEKLY  Tags:AI   点击:(16)  评论:(0)  加入收藏
OpenAI“尝鲜”:收到英伟达全球首部DGX H200 AI超算
作者:李丹来源:硬AI英伟达号称开创先河的人工智能(AI)超级计算机DGX H200正式交付,OpenAI喝到了“头啖汤”。美东时间4月24日周三,OpenAI总裁兼联合创始人Greg Brockman在社交媒体...【详细内容】
2024-04-25    华尔街见闻  Tags:AI超算   点击:(14)  评论:(0)  加入收藏
开源VS闭源,李彦宏、周鸿祎等大佬各持己见
开源和闭源,一直是大模型时代讨论的焦点。当地时间4月18日,Meta推出开源大模型Llama 3系列,发布8B和70B两个版本。Meta CEO扎克伯格在同一天宣布,基于Llama 3,Meta的AI助手现在已...【详细内容】
2024-04-25    财经网  Tags:开源   点击:(12)  评论:(0)  加入收藏
半个AI圈,向李彦宏“开炮”
文 | 新浪科技 彦殊百度创始人、董事长兼CEO李彦宏近期的言论,遭到了多名企业家反驳,并得罪了一大批开源软件的拥护者。李彦宏近期两次谈及开源时,都提出了“开源模型会越来越...【详细内容】
2024-04-25    新浪科技  Tags:李彦宏   点击:(15)  评论:(0)  加入收藏
黄仁勋最新研判:三大行业将迎来颠覆性变革
在4月17日于美国硅谷圣塔克拉拉会议中心举行的CadenceLIVE Silicon Valley 2024大会期间,英伟达创始人兼首席执行官黄仁勋与Cadence公司CEO兼总裁阿尼鲁德·迪夫根(Anir...【详细内容】
2024-04-24    每日经济新闻  Tags:黄仁勋   点击:(14)  评论:(0)  加入收藏
美国参议院通过涉“字节剥离TikTok”新法案
当地时间4月23日,美国国会参议院投票通过一项议案修正案,涉及一揽子价值950亿美元的对外援助法案,包括向乌克兰提供超600亿美元的援助,以及向以色列提供260亿美元的援助。该法案...【详细内容】
2024-04-24    时间新闻  Tags:TikTok   点击:(12)  评论:(0)  加入收藏
移动版谷歌 Chrome 浏览器开始引入“短暂模式”:用户无需下载,即可体验应用
IT之家 4 月 24 日消息,消息源 @Leopeva64 近日发布推文,表示 Canary 频道安卓版 Chrome 浏览器开始测试引入“短暂模式”(ephemeral mode),用户可以通过启用实验 Flag 体验。IT...【详细内容】
2024-04-24    IT之家  Tags:Chrome   点击:(14)  评论:(0)  加入收藏
站内最新
站内热门
相关头条
  • · 斯坦福发布2024 AI报告:中国AI专利全球第一,顶级AI模型主要来自美国
  • · 谷歌搜索史上最大变革!考虑对AI搜索收费
  • · ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?
  • · 马斯克脑机接口再造奇迹:瘫痪小伙意念玩赛车击败正常人
  • · Kimi引燃大模型“长文本竞赛”,阿里360百度急出手
  • · 瘫痪8年小哥植入马斯克脑机接口,狂打8小时「文明6」!Neuralink首个人类植入者直播来了
  • · 英伟达“算力核弹”强在哪里?
  • · AI大模型之争远未落幕
  • · 世界首款!英伟达重磅发布人形机器人模型
  • · 全程回顾黄仁勋GTC演讲:Blackwell架构B200芯片登场
  • · 真“Open ” AI?马斯克旗下大模型Grok宣布开源:参数量全球最大
  • · 全球首位AI程序员诞生 人类程序员会失业吗?
  • · 谷歌宣布更新搜索算法:打击AI生成内容,提高搜索结果质量
  • · 英伟达、微软等巨头“抱团”,AI有望助推6G时代到来 国内产业如何接招?
  • · OpenAI Sora已开放对外申请 网友爆料:可能还有其它重磅产品发布
  • · 周鸿祎再谈Sora:真正给人工智能补上了“眼睛”
  • · Sora爆火超100小时:美国狂“卷”算力,国内则卖 AI 课程“捞金”一年5000万|钛媒体AGI
  • · 爆火Sora参数规模仅30亿?谢赛宁等大佬技术分析来了
  • · “AI女友”霸占GPT商店,OpenAI苦不堪言:开发者也难出头!
  • · 从居家到工作,CES 2024上演 AI硬件大秀
  • 站内头条