您当前的位置:首页 > 电脑百科 > 程序开发 > 程序员

为何大语言模型不会取代码农?

时间:2024-03-21 13:57:38  来源:51CTO  作者:

译者 | 布加迪

审校 | 重楼

生成式人工智能(GenAI)会取代人类程序员吗?恐怕不会。不过,使用GenAI的人类可能会取代程序员。但是如今有这么多的大语言模型(LLM),实际效果不一而足。

如果您在努力跟上所有LLM,并非只有您一个人。我们目睹一场激烈的LLM竞赛。单单谷歌的GenAI产品就已经变得非常丰富——其最新的开放模型Gemma是LLM快速精简的最新例子,甚至可以称之为小语言模型。

与DevOps社区更密切相关的是我们看到其他用于生成代码的LLM闪电般的开发速度,比如Meta最近更新的Code Llama 70B。当然,GenAI吓倒了不少开发者。最近的一项研究发现,近一半的开发者对于自己凭借目前的技术技能在GenAI界取得成功表示了担忧。

但这种担心真的有道理吗?关于人类程序员已死的说法可能夸大其辞了。人类甚至可能实际上有更多的时间来准备迎接由GenAI主导的世界。

事实上,开发者应该询问的更适当的问题不是“GenAI会抢走我的工作吗?”,而是“我该使用哪个LLM?”

太庞大了,编程没法成功

LLM给软件开发界的承诺是有望将码农变成架构师。然而,并非所有LLM都天生一样;值得探讨的是,为什么一开始就涌现出了较小巧的LLM。

更强大的主流模型(比如GPT-4和Claude 2)仍然只能勉强解决不到5%的实际Github问题。ChatGPT仍然存在严重的幻觉问题:假变量,或者甚至十多年前就已经被弃用的概念。此外,它让没用的内容看起来很有用。您可以尝试利用“提示工程”来摆脱这些没用的内容,但是有益的上下文数量存在一个最佳平衡点——太多会导致更混乱更随机的结果,白白耗费了更多的处理能力。

LLM编程方面更大的问题是信任。在过去,主流LLM不加区别地吸收网上的一切内容,就像一个大型数字吸尘器,至于它们从哪里获取数据缺乏透明度。哪怕一家公司交付的代码中仅仅1%含有另一家公司的受版权保护的代码,这也是个问题。您可以想象噩梦般的召回场景:交付的产品没有无线传输功能来挑出可疑代码。

不过,LLM格局正在迅速改变。

LLM对于编码够专业吗?

当Meta在今年早些时候宣布对其Code Llama 70B进行更新时,感觉这是大受欢迎的尝试,有望解决主流LLM对编码缺乏关注的问题。它有三种不同大小的版本:70亿个参数、130亿个参数和340亿个参数。它还使用代码的5000亿个token和与代码相关的数据进行训练,包含10万个token的庞大上下文窗口。

从理论上讲,其中最令人兴奋的是Code Llama Python/ target=_blank class=infotextkey>Python,这是专门为Python设计的Code Llama版本——主要是由于它代表了LLM未来的发展方向。与Meta的大型科技同行开发的一些模型不同,这个模型完全致力于为一种特定的语言编程,使用Python代码的大约1000亿个额外的token进行训练。业界更加需要的正是针对特定用例的这种级别的定制建模。

之所以需要强调“理论上令人兴奋”,是由于像Code Llama这样的LLM对开发者到底有多有用还有待观察。去Reddit看看,就会发现早期的结论似乎是,该模型因诸多问题而令人沮丧,其中包括复杂的提示格式、过于严格的护栏,最重要的还有幻觉问题。最后一点是另一个不争的事实,提醒人们:任何模型的好坏完全取决于训练它所使用的数据。

不管是否存在缺陷,Meta的定制LLM方法已经引起了人们的重视,即大语言模型并不是AI辅助代码生成取得成功的唯一途径。我们看到,业界越来越青睐使用规模较小、更专门化的LLM编写代码,比如BigCode、Codegen和CodeAlpaca。StarCoder是另一个LLM,尽管只有155亿个参数,但在评估基准测试中的表现却胜过PaLM、LaMDA和LLaMA等超大模型。

这每一种选择都有优缺点,但最重要的是,小模型用起来比大模型安全得多。如果您在用C++编程,果真需要您的LLM充斥着一大堆不相关的知识(比如“谁是美国第三任总统?”)吗?数据池越小,保持内容的相关性就越容易,模型的训练成本就越低,无意中窃取他人受版权保护数据的可能性也就越小。

2024年的DevOps团队应该彻底调研市面上所有可用的LLM选项,而不是默认选择最明显的选项。甚至可能有必要针对不同的用例使用不止一种LLM。

但回到当前存在的问题……

GenAI会取代人类吗?

这些GenAI工具有可能代替真正的程序员吗?除非模型提供的编程答案具有的准确性提高到了可接受的误差范围内(即98%-100%),否则可能代替不了。

不过为了便于讨论,我们假设GenAI确实达到了这个误差范围。那么这是否意味着软件工程的角色将发生转变,您只需审查和验证AI生成的代码,而不是编写代码?如果四眼原则(four-eyes principle)适用的话,这样的假设可能是错误的。这是内部风险控制最重要的机制之一,要求任何实质性风险的活动(比如交付软件)都要由第二个、独立的、有能力的人进行审查和复核。除非AI被重新归类是一种独立的、有能力的生命体,否则它短期内应该没有资格成为四眼原则中的另一双眼睛。

如果GenAI将来有能力进行端到端开发和构建人机界面,那也不会是在不久的将来。LLM可以充分地与文本和图像元素进行交互。甚至现在就有工具可以将网页设计转换成前端代码。然而与编码相比,AI单独承担与图形和UI/UX工作流程相关的设计要困难得多,尽管并非不可能。编码也只是开发的其中一部分。剩余的工作就是另辟蹊径,弄清楚谁是受众,将想法转化为可以构建的产品,然后加以完善和改进,这正是人类发挥作用的地方。

不管LLM变得有多好,对于程序员来说,有一条原则应该始终不变:像对待自己编写的代码一样对待每一段代码。请同行评审,询问同事“这是好的代码吗?”。永远不要盲目相信代码。

原文标题:Why Large Language Models Won’t Replace Human Coders,作者:Peter Schneider



Tags:大语言模型   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
为何大语言模型不会取代码农?
译者 | 布加迪审校 | 重楼生成式人工智能(GenAI)会取代人类程序员吗?恐怕不会。不过,使用GenAI的人类可能会取代程序员。但是如今有这么多的大语言模型(LLM),实际效果不一而足。如...【详细内容】
2024-03-21  Search: 大语言模型  点击:(19)  评论:(0)  加入收藏
大语言模型插件功能在携程的Python实践
作者简介成学,携程高级安全研发工程师,关注Python/Golang后端开发、大语言模型等领域。一、背景2023年初,科技圈最火爆的话题莫过于大语言模型了,它是一种全新的聊天机器人模型,...【详细内容】
2024-01-26  Search: 大语言模型  点击:(72)  评论:(0)  加入收藏
面向超长上下文,大语言模型如何优化架构,这篇综述一网打尽了
ChatGPT 的诞生,让基于 Transformer 的大型语言模型 (LLM) 为通用人工智能(AGI)铺开了一条革命性的道路,并在知识库、人机交互、机器人等多个领域得到应用。然而,目前存在一个普...【详细内容】
2024-01-03  Search: 大语言模型  点击:(114)  评论:(0)  加入收藏
大语言模型真的需要这么多层吗?
研究表明,移除70% 的注意力头和 20% 的前馈网络对上下文学习影响甚微,这暗示大语言模型或许训练得不够充分。本文经授权转载宝玉老师的个人博客(微博@宝玉xp ),链 接https://ba...【详细内容】
2023-12-19  Search: 大语言模型  点击:(67)  评论:(0)  加入收藏
大语言模型量化方法对比:GPTQ、GGUF、AWQ
在过去的一年里,大型语言模型(llm)有了飞速的发展,在本文中,我们将探讨几种(量化)的方式,除此以外,还会介绍分片及不同的保存和压缩策略。说明:每次加载LLM示例后,建议清除缓存,以防...【详细内容】
2023-11-17  Search: 大语言模型  点击:(261)  评论:(0)  加入收藏
SEO中的大语言模型量化方法
随着互联网的快速发展,搜索引擎优化(SEO)已经成为了企业提升网站流量和排名的重要手段。在SEO的过程中,大语言模型量化方法被广泛应用,以帮助企业更好地理解搜索引擎的工作原理,并...【详细内容】
2023-11-16  Search: 大语言模型  点击:(185)  评论:(0)  加入收藏
大语言模型数据泄露堪忧,超自动化Agent成解决之道
文/王吉伟阻碍广大企业应用大语言模型(LLM,Large Langeuage Models)的诸多因素中,无疑数据安全是最重要的。3月份ChatGPT发生了用户隐私数据泄露事件,OpenAI声明由于开源代码库中...【详细内容】
2023-11-15  Search: 大语言模型  点击:(187)  评论:(0)  加入收藏
无限上下文,多级内存管理!突破ChatGPT等大语言模型上下文限制
目前,ChatGPT、Llama 2、文心一言等主流大语言模型,因技术架构的问题上下文输入一直受到限制,即便是Claude 最多只支持10万token输入,这对于解读上百页报告、书籍、论文来说非常...【详细内容】
2023-11-02  Search: 大语言模型  点击:(273)  评论:(0)  加入收藏
十个2023年最具影响力的开源大语言模型
由于大型语言模型(LLM)的崛起,2023年被认为是开源领域的关键一年。下面精心挑选了一些在2023年上半年掀起波澜的最有影响力的模型。这些模型几乎可以与band、GPT-3.5、GPT4、Cl...【详细内容】
2023-10-13  Search: 大语言模型  点击:(332)  评论:(0)  加入收藏
引入大语言模型、首个支持国产算力生态,全新开源RL框架RLLTE来了
近年来,强化学习的研究热度不断攀升,在智能制造、自动驾驶、大语言模型等多个领域取得了耀眼成绩,展示出巨大的研究潜力。然而,强化学习算法高效、可靠的工程实现仍是长期存在的...【详细内容】
2023-10-12  Search: 大语言模型  点击:(362)  评论:(0)  加入收藏
▌简易百科推荐
AI程序员上岗 垂类大模型应用迎来井喷期
能自动写代码的“AI员工”、逐渐告别不够好用的智能客服,无需费时费力开发的工业AI控制器……随着人工智能大模型能力开始深入多个行业,IT、工业生产、金融、服务...【详细内容】
2024-04-08    北京日报  Tags:AI程序员   点击:(3)  评论:(0)  加入收藏
AI程序员上岗 垂类大模型应用迎来井喷期
能自动写代码的“AI员工”、逐渐告别不够好用的智能客服,无需费时费力开发的工业AI控制器……随着人工智能大模型能力开始深入多个行业,IT、工业生产、金融、服务...【详细内容】
2024-04-07    千龙网  Tags:AI程序员   点击:(2)  评论:(0)  加入收藏
首个AI程序员上岗,码农们暂且不必过度焦虑
“AI程序员上岗”或许是噱头,但淘汰焦虑仍然近在咫尺,需要积极面对。全文2418字,阅读约需7分钟 撰稿 / 马尔文(媒体人)编辑 / 何睿 校对 / 张彦君▲随着相关技术的突飞猛进,AI也在...【详细内容】
2024-04-07    新京报  Tags:AI程序员   点击:(3)  评论:(0)  加入收藏
为何大语言模型不会取代码农?
译者 | 布加迪审校 | 重楼生成式人工智能(GenAI)会取代人类程序员吗?恐怕不会。不过,使用GenAI的人类可能会取代程序员。但是如今有这么多的大语言模型(LLM),实际效果不一而足。如...【详细内容】
2024-03-21    51CTO  Tags:大语言模型   点击:(19)  评论:(0)  加入收藏
AI程序员Devin:通过了面试,但不一定适合职场
昨天,AI圈上演了第一场“大男主爽文”:一个少年成名的编程天才,组建起仅有10人的编程界奥林匹克“梦之队”,在全球瞩目的科技风暴正中心创办了一家公司。成立不到两个月,其推出的...【详细内容】
2024-03-18    甲子光年  Tags:AI程序员   点击:(13)  评论:(0)  加入收藏
微软AI程序员登场,10倍AI工程师真来了?996自主生成代码,性能超GPT-4 30%
新智元报道编辑:桃子 润【新智元导读】全球首个AI程序员Devin诞生之后,让码农纷纷恐慌。没想到,微软同时也整出了一个AI程序员——AutoDev,能够自主生成、执行代码等...【详细内容】
2024-03-18    新智元  Tags:AI程序员   点击:(15)  评论:(0)  加入收藏
李彦宏称程序员职业将不复存在,周鸿祎:程序员热十年内不会减弱,AI时代更需要程序员
李彦宏称程序员职业将不复存在,周鸿祎:程序员热十年内不会减弱,AI时代更需要程序员3月10日,360创始人周鸿祎在社交平台上发文称,“大模型将替代程序员?未来不用学编程了么?我认为,程...【详细内容】
2024-03-11    九派新闻  Tags:程序员   点击:(20)  评论:(0)  加入收藏
李彦宏最新发声,“程序员”职业将不复存在!
在3月9日央视的《对话》·开年说节目上,百度创始人、董事长兼CEO李彦宏表示,以后不会存在“程序员”这种职业了,因为只要会说话,人人都会具备程序员的能力。“未来的编程...【详细内容】
2024-03-11    红星新闻  Tags:程序员   点击:(18)  评论:(0)  加入收藏
编程二十年,38岁谷歌程序员的16条建议,涉创业、技术淘汰、拿大厂offer……
以能够让项目自负盈亏,并在这一约束下优化其增长的方式来管理和调整项目,这是这个世上最厉害的本事。距离我正式开始编程的工作已经过去二十年了。在这些年里,我有以下收获: 获...【详细内容】
2024-03-10    CSDN  Tags:程序员   点击:(4)  评论:(0)  加入收藏
鸿蒙开发岗平均月薪超1.8万,成为计算机人才和程序员的求职新选择!
智联招聘发布的《2024年春招市场行情周报(第一期)》显示,2023年9-12月,鸿蒙相关职位数同比增速从33.8%攀升至216.1%,鸿蒙相关职位的投递人数同比增速从132.1%攀升至380.1%。春节...【详细内容】
2024-02-26  晓枫侃科技    Tags:鸿蒙开发   点击:(24)  评论:(0)  加入收藏
站内最新
站内热门
站内头条