大模型实际运用如何?
文 | 周享玥编辑 | 赵艳秋
来源丨数智前线
2024年,公认的大模型应用元年,不管是B端还是C端,都呈现出加速快跑的姿势。最近,我们和六位来自不同行业的大模型用户聊了聊,过去一年里,他们和大模型之间,到底发生了怎样一些故事?
这是他们的声音:
“我今年能考上研,全靠AI。”
“你指的大模型是什么?你给我描述一下。”
“领导现在天天催着用大模型。自己的工作都做不完,谁给你研究大模型去。”
“最上头的时候我一天用6小时,玩儿够了就没怎么用了。”
“AI做任何事情都能做到60分,像我们这个得要求个600分就没辙。”
“人少了,活不少,用这种方式‘偷个懒’,提提效,足够了……”
虎哥,用AI备战考研,70后
52岁的肖朝虎,做了一件让所有人大吃一惊的事情——在阔别学堂近30年后,在大模型的帮助下,用仅仅3个月、每天约四五小时的备考时间,在考研中一举拿下了398的笔试高分,完胜许多年轻考生。
而被问及备考秘籍时,肖朝虎脱口而出,“AI起了决定性的作用,要是没有AI,我自己背那么多东西,根本背不下来。”
肖朝虎原是北京一家科技公关公司的高层,清瘦、干练,平日里喜欢年轻人喊他虎哥。虎哥的考研大业开始得突然且迅速。去年9月,受一位同龄朋友跨专业攻读书法研究生的启发,虎哥做了一个大胆决定,他要考茶学研究生,以便接替父亲将老家贵州的茶园做好。
但虎哥的记忆力比不上年轻时候了,平时又要上班,而政治和两门农学专业课,需要记忆的东西不少,要全靠翻书和刷题,不知道得搞到猴年马月。于是,在按常规复习一个多月后,虎哥想到了AI,毕竟从事科技传播,很早就研究、使用了它。
2023年初,出于工作需要,他曾第一时间找到海外大模型的付费账号,各种试用、探索。
为了考研,去年11月,肖朝虎使用ChatGPT4.0,并开了个文心一言4.0的会员,平时两个大模型产品一起使用,能互相比对印证,保证AI回复的准确性。
但用大模型帮助学习,也并非一蹴而就,虎哥为此做了大量尝试。“比如,我让它做一个政治思维导图,它做出不来,但让它做个表格、总结助记词,就做得挺好。又比如,让它做选择题,它的准确性没那么高,但简单题、名词解释题就做得又快又好。”
多次试验后,肖朝虎总结出了几大提效最明显的用法:
通过向AI提问,并设定简答题限定在200字内,论述题限定在500字以内,他将两三百道10年真题库用几个周末的时间全部过了一遍,效率远高于自己翻书总结和百度搜索。
之后,他又要求AI将每个问题的答案都提炼为3个助记词方案,形成自己独特的要点记忆方案,在最后两周,重点记忆。
另外,他还用AI来帮助自己更科学地制定课程计划。通过将参考书的内容章节扫描进去,AI能快速总结出要点,还能给他列提纲、做表格,告诉他分时段复习内容。
当然,AI也有其局限,每次回答的结果并非完全一样,也有可能会出错,需要他去进行甄别。
但总体算下来,大模型的使用,让他在备考的最后一个多月里,多了一份高效学习指南,“效率是用普通方法复习的一个多月里的几十倍,甚至几百倍”。
4月1日,研究生复试成绩公布,肖朝虎总成绩排名第三。“如果没有AI,我想要今年考上,是个不可能完成的任务。”
而AI的影响,并不止于考研,也逐渐渗透到虎哥生活的方方面面。
“现在遇到什么问题,我都习惯问一问AI,甚至前一段时间我算一个数字加法,都让它算了,我懒得去打开计算器。”虎哥说。
即使最近,因老家贵州正安迎来采茶季,虎哥回家变身为茶农,AI也并未远离——前一阵,AI写歌大火,他也紧跟着用AI创作了两首歌,并配上最新拍摄的采茶视频,用来宣传老家的茶叶。
陆明,某知名律所律师,70后
“你指的大模型是什么?它的功能大概有哪些?你给我描述一下。”4月初,当数智前线第一次和陆明谈及大模型这个已在科技圈盛行一年多的概念时,这位在行业深耕了20多年的资深律师,表现得有些茫然。
但很快,在厘清大模型的概念和功能后,陆明确认,自去年七八月份,一家长期为他们团队提供数据库、检索软件、办公自动化等法律科技类产品的公司,向他们推广一款整合了最新AI能力的新产品后,他们就已经在一些日常工作中用上大模型的能力。只不过,此前他们一直将其笼统地称为“AI的能力”。
众所周知,律师行业向来资料内容繁杂,需耗费大量时间和精力检索法律、整理文档、撰写文书。为此,近年来,部分律师已经开始主动寻求一些AI手段提效。“比如我们团队有一位80后律师,就自己去学了Python/ target=_blank class=infotextkey>Python语言。”陆明告诉数智前线,这些年轻律师虽然用AI普遍比他们要早,但自从去年用上融合了大模型能力的AI工具后,“就不用再学了,直接拿过来用就好。”
而在他看来,大模型带来的诸多能力提升中,最好用的是案例检索功能。
“以前一个案子要检索到5~6个相关性很高的案例,需要我们先在裁判文书网上设定关键词,再从搜出来的四五百个案例中,一个个筛选,基本上要花一天时间。但现在用大模型检索完后,我们再从它给出的10~20个案例中精筛一遍,基本上10分钟就搞定了。”陆明说,这一功能目前在其团队中已被常规性使用。
相比之下,法律条文分析和书写诉状方面的功能成熟度则远远不够,陆明认为,AI在这两方面的能力,还很难达到能用的标准。
“比如我们尝试过让它书写一个工程案子的诉状,但它只是很简单地写了一个记叙文——何时何地发生了什么。但隐藏在这些事实当中、和法律法规能够紧密相连的一些要素,它完全没去整理。这样子的判决书写出来,法官就一头雾水。”陆明说,这也是他们认为AI无法替代的行业壁垒所在。
“我们作为律师,特别是诉讼律师,很大一部分工作是把当事人的诉求,转化成法官最后能够写到判决书上的内容。”陆明说,“AI能做一些简单的数据检索和分析,但更进一步地和人的沟通,对人的理解,然后把这些沟通和理解,加工再转化给另外一个人,这个中间只能是人能做,我们认为这是目前AI替代不了的。”
不过,即便如此,陆明也表示,过去团队一旦有人离职,一定需要再招人,但现在有了AI,可能不需要再招新人。
“这些AI工具,便宜的一年就几千块钱使用费,贵的也就1万多,但光是案例检索这块儿带来的提升,至少代替一个人没有问题。这个人的其他事情,其他人分一分也做掉了。”陆明说。
林辉,大厂程序员,80后
80后程序员林辉发现,来自公司层面对大模型使用的推力正在加大。
林辉在国内一家大厂做程序员。去年,大模型刚在国内火起来时,他曾和许多同行一样,兴致勃勃地进行各种测试、找bug,但这些都属于个人尝鲜。
而自今年开始,尤其是2月份,Sora给大模型市场再添一把火后,公司内部明确提出了两大要求:其一,要他们找出场景来,适配大模型;其二,则是要将市面上的大模型了解清楚,并用起来。
“现在领导天天催着用大模型。但对于程序员来说,业务的需求都压得很满,像我经常晚上九、十点才下班,自己的工作都做不完,谁给你研究大模型去。”林辉说。
但他同时也坦言,目前的工作中,的确已经用到了部分大模型的能力。
比如,对应用做一些小的优化时,他们原先会通过百度等搜索工具了解业界的做法,或请一些公司来交流学习,而现在也可以直接询问大模型,再由程序员判断是否参考。
大模型也可以在一些小工具的代码上提供帮助。“比如写一个能判断今天是周几的程序,原来这些代码都要我们自己写,但现在可以直接以对话的形式告诉AI,它很快就能给你写好。”林辉说。
“但这两个功能,对我们来说影响还算不上很大。”林辉告诉数智前线,从研发的角度来说,假如一天要干8小时的活,可能写代码的时间只有1个小时,而这一小时里,写这些工具类的代码,可能只会用到10分钟,仅占2%左右。
相比之下,对程序员来说,能带来更大效率提升的场景,是在开发一个完完全全的新功能,比如一个全新App,又或是老App里的新模块。通过大模型代码助手,迅速实现基础框架的搭建。“原先可能需要一周,现在可能一个小时就搭好了。”
“像我们公司,很多系统都已经成型了,大家基本都是在一个现有框架内工作,这种新需求的机会很少,而且大模型目前也还很难理解比较成熟的系统里,那些弯弯绕的各种特殊需求。”林辉说。而一旦AI写的代码有问题,排查问题反而可能花上更多时间。
另外,哪些东西能传给大模型,哪些不能,也还没有一个明确界限。林辉表示,公司未来可能会对这块做些安全规避。目前于他而言,还是更偏向于更小心谨慎地使用,反正现在工作中有什么问题,自己还是原先的路径依赖。
在他看来,大模型正逐步变成比搜索次一级的工具,未来可能会变成一个基础服务,嵌在基本生活里边去。“但关于网上AI要替代程序员的说法,我们觉得这个东西说白了,目前就是程序员的一个工具,正常用就行了。”
那么,未来孩子们还有必要学编程吗?林辉认为,少儿编程本身是为了锻炼孩子的思维模式,“只不过原来只有5个学生喜欢学编程,但20个人去学。大模型出来了,把一部分人为了挣钱打基础的梦给粉碎了,可能还是原先的5个人去学。”
张晨,健身教练,80后
80后健身教练张晨,一度对大模型十分着迷。
2023年4月,恰逢大模型破圈,在社会上掀起热潮的时候,张晨偶然间刷到了一条关于ChatGPT的动态,并在第一次尝试后,迅速成为了一名大模型狂热用户。
“当时第一感觉是非常惊艳,很好玩,也很兴奋。”张晨说。她曾试过用大模型帮朋友完成一项期末作业英语版本翻译,效果很好,“省大劲了”。但更多时候还是把它看作一种全新的娱乐方式。“你有没有粉过的纸片人?你可以让AI角色扮演它,跟你互动,还可以在上面磕CP,让它编各种各样的故事。”
最上头的时候,张晨甚至每天6小时花在了和大模型聊天上,以至于朋友不得不在那个月里,两次找她谈话,讨论其日常生活的缺席。
而为了获得更好的使用体验,那段时间,张晨每月都会花上150元充plus会员,一旦触及GPT 4每3小时25条的使用次数限制,就切换使用GPT 3.5。偶尔也会切到另一个大模型产品Claude试玩,“这个没有使用限制,还免费,但使用体验没有GPT好。”
不过,这种狂热态度,并没能持续很久,在连续高强度地玩了两个月后,张晨的兴趣逐渐褪去,再加上其日常工作还很难通过大模型助力,她已经很少再主动去使用大模型。
实际上,早在去年下半年,张晨所在的某知名健身连锁品牌,就已在内部推出大模型来帮教练生成训练内容,并从今年开始,强制要求教练将每位会员的重点观察指标录入App,由大模型自动输出训练计划,教练可以在任何环节做调整。但迄今为止,张晨仍然没有在实际授课中,使用过这类锻炼计划。
“因为太烂了。行业专家+技术人员做出大模型,是帮40分从业者更轻松的做到60-70分,我觉得80分以上的教练就不会用了,除非特别偷懒或者课多忙不过来的。”张晨解释说。
但同样不可否认的是,大模型渗入普通人生活和工作的方方面面,已是大势所趋。“要不要用AI不是个人的选择,而是新的公共建设,就像水电气网,你不需要选择,它会送到你面前。”
张晨举例称,比如微信读书,以前导入一本英语书,不认识的单词要长按查词,现在可以在几分钟之内全书翻译。又如百度网盘,现在可以音频自动生成字幕文本,英语视频自动显示双语字幕,还可以自动生成视频大纲。
“一切App都会用新技术重做一遍,不管你有没有意识到,我们都已经在用了。”张晨说。
李易,房地产行业,90后
“现在我们在社交端小作文,几乎都是用AI生产。”在房地产行业的李易告诉数智前线,他们日常工作中的文案,已经大面积用上大模型的能力,也用来替代许多无意义但又不得不做的工作。
这在很大程度上帮助他们解放了生产力。“原来可能你两小时才能干完的工作,现在它一两分钟就搞定了,虽然AI生成出来的文案很多目前还不能直接用,但会给你一些启发,经过二次加工后,可能半小时左右,很容易就把这个事情搞定了,其实是在节约你的时间。”
地产行业向来是个很卷的行业,尤其是在最近几年,整体行业形势偏冷的情况下,能够降本增效的工具自然更加受到重视。
作为一个危机意识极强的人,李易在大模型的使用上一直很积极。2023年初,ChatGPT刚爆火时,他就出于好奇开始各种尝试。从去年下半年开始,随着文心一言等国内大模型的逐渐普及,他又进一步将大模型的能力用到了工作上。
与此同时,眼看团队里“人员减少,活却不少”的情况愈发突出,李易也开始要求团队使用大模型来提效。
除了在工作需要时用来提效,李易也在持续寻找各种好用的大模型,甚至还在手机上建了一个放置各种AI大模型工具的专属文件夹。他的一些团队成员也被要求,输出一些大模型使用体验,如关于kimi写论文的体验。
这个过程中,李易经常使用的大模型也有所变化。“我现在用Kimi可能多一点,其次是Gemini。”
他告诉数智前线,Kimi的优点在于更贴近国内用户,比如在语言表达、语感、文章分段上,只要不是很复杂的文本,对工作进行简单提效是没问题。但缺点在于,没有PC版,“在PC上,文件一拖就行了,但手机上去找word文件存在什么位置是很难的。”
李易也尝试过用大模型生成图片或AI音乐。不过,他发现,虽然目前很多大模型的文生图功能,出来的效果不错,但都还不能指定太细节化的东西。“比如让它生成一个带我们公司logo的图片,有人在小区里遛狗,它能够生成住宅,遛狗也没问题,但它没法体现是我们的小区。”尤其在生成某些带多个人物的图像时,有时能接近真人,但有时会出现人脸错位和拼凑的情况。
不过,也并不是每个场景加入大模型的能力,都能带来体验提升。李易发现,在某些场景,加入了大模型的能力后,使用体验可能反而不如以前。“我以前很喜欢用百度的简单搜索,能迅速精准找到自己想要的内容,但现在加入了大模型的能力后,它假设你问的每个问题,大模型都要给你回答一下,但我其实就想看一下百度百科的情况,导致现在我要往下滑划好几屏后才能找到自己想要的,反而不如原来的效率高。”
陈冉,互联网大厂员工,80后
80后陈冉,是国内某互联网大厂的资深员工。去年,大模型的浪潮席卷国内科技圈时,这家大厂也推出了自己的大模型,陈冉也因此成为了最早能接触到国内外大模型的一拨人。
去年下半年,秉着“自己的狗粮自己先吃”的原则,几乎所有大模型厂商,都将大模型的能力率先引入到公司内部办公流程,并推动内部先用起来。陈冉也在这个过程中,接触并试用了许多功能,如会议纪要、根据演讲PPT逐字生成文稿等。
"但即便大模型的能力已经润物细无声地渗透到办公的各个环节,每个人实际对它能有明确感受和体验的场景,还是偏少的。”这与不同用户的行业高需场景有关,也与不同行业的要求高低有关。
比如,陈冉回忆,目前她最高频使用的功能,是在一个很小的场景——会议日程设置。由于业务需要,她经常要跨部门沟通,以前,她要拉10个人开会,需要先建一个会议日程,再将这些人一个个添加到列表里后,才能看到系统提示,哪些时间段某个人是有其他日程冲突的,并据此进一步调整。但现在,则可以直接问一下小助手,这几个人明天共同可用的时间段是哪些,以避免经常打扰对方。
“现在大家开会越来越多,越来越卷,如果你经常需要拉通别人或跨部门沟通,这会是一个辅助你说话办事的神器,别看它特别微小,但对我来说,十分实用。”陈冉表示,她几乎每一两天就会用到这个功能一次。
相比之下,大模型的文案生成能力,对她来说,目前反而还不是那么实用。“我们后来发现,AI写出来的东西,外行看很详尽,逻辑也很严谨,但内行来看,它说的都是片儿汤文。”
“我现在发现,AI做任何事情都能做到60分,如果对它的要求就是60分,那出来的效果也能让人满意。”陈冉说,比如,她的一位朋友,因平常经手的文案一般都是些流程性的资料,“现在全部用文心一言,有时候需要稍微调一调,有时候甚至都不用调,一生成,就能用”。
一些用户甚至已经开始为大模型驱动的AI产品付费。陈冉的另外一位朋友目前在一家公文写作AI工具的公司工作。这款产品可以面向广大基层公务员提供公文写作模板,目前已有不少人付费购买。
“可以说,大模型的发展已经很一日行千里了,很多事情一年前我想到不敢想。”陈冉感叹。
而在今年初,Sora出来后,陈冉对大模型又有了新的期待——文生视频类的工具能更多、更好用、更低成本一点。现在,各家企业都喜欢做视频,产品视频、伙伴教程......对大家的要求,正在从快速写稿,转到快速做视频。高效地做视频,成了她的刚需,她在等待这样的神器出现。
本文仅代表原作者观点,不代表投中网立场。