您当前的位置:首页 > 电脑百科 > 软件技术 > 应用软件

Stability AI发布代码生成工具 StableCode

时间:2023-08-13 14:54:27  来源:智创狮  作者:

Stability AI是一家以Stable Diffusion文本到图像生成模型而闻名的公司,但这家初创公司对生成式AI的目标不止于此。最近,Stability AI宣布首次公开发布一款名为StableCode的新开源大型语言模型(LLM),旨在帮助用户生成编程语言代码。StableCode提供了三个不同的层次:基本模型适用于通用用例、指令模型以及支持多达16,000个标记的长上下文窗口模型。

StableCode模型的基础是来自开源项目BigCode的初始编程语言数据集,Stability AI还对其进行了额外的过滤和微调。最初,StableCode将支持Python/ target=_blank class=infotextkey>Python、Go、JAVAJavaScript、C、Markdown和C++等编程语言的开发。

Stability AI的研究主管Christian Laforte在接受专访时表示:“我们希望通过这个模型做一些类似于Stable Diffusion的事情,SD帮助全世界的每个人都能成为艺术家。我们希望用StableCode模型做同样的事情。”

基于BigCode

任何LLM的培训都依赖于数据,对于StableCode来说,数据来源于BigCode项目。将BigCode作为生成式AI代码工具的LLM基础并非新概念。HuggingFace和ServiceNow早在5月份就发布了基于BigCode的开源StarCoder LLM。

Stability AI首席研究科学家Nathan Cooper在接受专访时解释说,StableCode的培训涉及对BigCode数据进行大量的过滤和清理。

“我们喜欢BigCode,他们在数据治理、模型治理和模型训练方面很惊人,”Cooper说。“我们获取了他们的数据集,并应用了额外的过滤来确保质量,然后构建了一个具有大上下文窗口的模型版本,并在我们的集群上对其进行了训练。”它遵循与自然语言领域非常相似的方法,首先预训练一个通用模型,然后对其进行微调以适应一组特定任务,或者在这种情况下,是针对语言的微调。”Cooper说。

更大的上下文空间

除了其基于BigCode的基础之外,StableCode的长上下文版本为用户带来了重要的优势。

StableCode的长上下文窗口版本具有16,000个标记的上下文窗口,Stability AI声称这超过了其他任何模型。Cooper解释说,更长的上下文窗口支持使用更专业和复杂的代码生成提示。这也意味着用户可以让StableCode查看包含多个文件的中型代码库,以帮助理解和生成新代码。

“您可以利用这个更长的上下文窗口,让模型更好地了解您的代码库,以及其他文件中定义的其他函数,”Cooper说。“因此,当它提供代码建议时,它可以更加定制化地适应您的代码库和需求。”

改善代码生成

与所有现代生成式AI模型一样,StableCode是基于转换器神经网络的。

与使用ALiBi方法在转换器模型中定位输出的方式不同——这是StarCoder用于其开源生成式AI编码模型的方法——StableCode采用了一种称为旋转位置嵌入(RoPE)的方法。

Cooper表示,转换器模型中的ALiBi方法倾向于给予当前标记比过去标记更高的权重。在他看来,对于代码而言,这并不是一个理想的方法,因为与具有开始、中间和结束结构的自然语言描述不同,代码函数可以在应用程序流的任何位置进行定义。

“我不认为编码本身适合这种认为现在比过去更重要的想法,所以我们使用...RoPE,它没有这种偏见,不会过于关注过去。”“我们将与社区互动和合作,看看他们会提出什么有趣的想法,并探索生成式开发空间。”Cooper说道。



Tags:StableCode   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
Stability AI发布代码生成工具 StableCode
Stability AI是一家以Stable Diffusion文本到图像生成模型而闻名的公司,但这家初创公司对生成式AI的目标不止于此。最近,Stability AI宣布首次公开发布一款名为StableCode的新...【详细内容】
2023-08-13  Search: StableCode  点击:(218)  评论:(0)  加入收藏
▌简易百科推荐
Telegram怎么不显示在线?
在Telegram中,您可以通过进入“设置” -> “隐私与安全” -> “最后在线时间”,然后选择“没有人”或者自定义特定的人群,以隐藏自己的在线状态。这样设置后,其他用户将无法看到...【详细内容】
2024-04-04  HouseRelax    Tags:Telegram   点击:(1)  评论:(0)  加入收藏
谷歌 Gmail 新规生效:为遏制钓鱼 / 欺诈情况,日群发超 5000 封邮件账号需验证
IT之家 4 月 2 日消息,谷歌为了增强对垃圾邮件和网络钓鱼攻击的管控,今天宣布正式启用新措施:对于向 Gmail 邮箱账号日群发数量超过 5000 封的用户,需要其在域名中设置 SPF / DK...【详细内容】
2024-04-02    IT之家  Tags:Gmail   点击:(10)  评论:(0)  加入收藏
钉钉AI升级多模态:能根据图片识人、翻译、创作、多轮问答
新浪科技讯 3月28日午间消息,钉钉AI助理迎来升级,上线图片理解、文档速读、工作流等产品能力,探索多模态、长文本与RPA技术在AI应用的落地。基于阿里通义千问大模型,升级后的钉...【详细内容】
2024-03-28    新浪科技  Tags:钉钉   点击:(12)  评论:(0)  加入收藏
都2024年了,谁还在用QQ聊天啊?
你还在用 QQ 吗?之所以突然这么问,是因为前些天腾讯发了份热气腾腾的财报。随手翻了翻,发现 QQ 这个老企鹅,居然还有5.54 亿多人每个月都在坚持登录。虽说和辉煌时候没法比了,但...【详细内容】
2024-03-26    差评  Tags:QQ   点击:(8)  评论:(0)  加入收藏
腾讯QQ浏览器工具权益卡上线PC端,每月最低6元
IT之家 1 月 29 日消息,腾讯 QQ 浏览器此前在手机端上线工具权益卡,现将部分权益适用范围拓展至 PC 端,每月 10 元,连续包月为 6 元。开通后用户可以在 QQ 浏览器软件内享有由腾...【详细内容】
2024-01-29    IT之家  Tags:QQ浏览器   点击:(74)  评论:(0)  加入收藏
开源工具Ventoy更新:新增对FreeBSD 14.0的支持
近日,开源装机工具Ventoy发布了1.0.97版本的更新。本次更新的主要亮点是新增了对FreeBSD 14.0版本的支持,并修复了启动问题以及解决了几个Linux独有的bug等。同时,官方还修复了...【详细内容】
2024-01-25    中关村在线  Tags:Ventoy   点击:(38)  评论:(0)  加入收藏
微软Copilot Pro来了:个人用户也能在Word里用GPT-4,20美元/月
面向个人用户的微软Copilot会员版来了。一个月多交20刀(约合人民币142元),Microsoft 365个人版/家庭版用户就能在Word、Excel、PPT等Office全家桶中用上GPT-4。就像这样,不用在C...【详细内容】
2024-01-16    量子位  Tags:Copilot Pro   点击:(89)  评论:(0)  加入收藏
微软 Edge 浏览器支持双引擎同时搜索功能,便利与槽点并存
IT之家 1 月 15 日消息,微软广告和网络服务部门首席执行官 Mikhail Parakhin 近日透露了一个微软 Edge 浏览器的隐藏功能:双引擎同时搜索。顾名思义,该功能允许用户同时使用两...【详细内容】
2024-01-16    IT之家  Tags:Edge   点击:(61)  评论:(0)  加入收藏
11个面向设计师的必备AI工具
译者 | 布加迪审校 | 重楼在当今快速发展的设计领域,人工智能(AI)工具已成为不可或缺的创新催化剂。这些工具专门用于提高效率和创造力,从而重新定义传统的设计方法。AI正在彻底...【详细内容】
2024-01-09    51CTO  Tags:AI工具   点击:(92)  评论:(0)  加入收藏
钉钉与微软中国达成合作,将推钉钉Office套件,每人每月35元
IT之家 1 月 9 日消息,今日在钉钉 7.5 产品发布会上,钉钉正式宣布与微软中国达成产品级合作,将推出钉钉 Office 套件,集成包括 Word、Excel、PowerPoint 在内的产品。根据合作协...【详细内容】
2024-01-09    IT之家  Tags:钉钉   点击:(83)  评论:(0)  加入收藏
相关文章
    无相关信息
站内最新
站内热门
站内头条