抖音团队在用的大模型服务平台"火山方舟",我们也上手体验了一把

时间：2023-06-30 12:31:36 来源：作者：机器之心Pro

作者：蛋酱

2023 上半年，海内外经历了一场「百模大战」。从科技巨头、科研机构、创业公司到各传统行业，纷纷掀起了炼大模型的热潮。

当大模型成为新的风口，我们却发现，相比于上一波 AI 爆发浪潮，AI 创业的门槛其实明显被拉高了。

对于任何想要入局的创业者来说，大模型首先是「体量大」，需要顶尖的研发技术，且投入极高的前期训练成本。以 1750 亿参数的 GPT-3 为例，海外媒体曾做出估计，GPT-3 的存储需求高达 350GB、训练成本超过 1200 万美元。至于今年的 GPT-4，参数量仍是秘密，训练成本想必只增不减。

其次，自研大模型的成本不会止于训练。从算力消费的角度来说，第一条增长曲线是模型训练，第二条增长曲线则是模型的应用和调优，而且在不久的将来，第二条增长曲线必然会超过第一条。

说到底，大模型技术想要广泛落地，最终还是要过成本关：对于大模型提供商来说，怎样才能让大模型以真正具有性价比的方式融入千行百业？对于每个行业来说，如何「多快好省」地用好大模型这一利器？

在这样的背景下，AI 领域形成了一种全新的商业模式：Model as a Service（MaaS），模型即服务。「模型即服务」能够将大模型、工具平台、应用场景三者联合起来。对于行业来说，这是一种无需巨额前期投入即可完成大模型训练、推理的途径；对于大模型提供商来说，这是一种探索商业化落地、获得资金回报的可靠方法。

最近，这个赛道又迎来了一位重磅玩家。6 月 28 日，在北京举行的火山引擎体验创新科技峰会上，「火山方舟」MaaS 平台正式启航。

火山引擎总裁谭待。

「火山方舟」面向企业提供模型精调、评测、推理等全方位的 MaaS 平台服务。基于其独特的多模型架构，企业可通过「火山方舟」同步试用多个大模型，选用更适合自身业务需要的模型组合。此外，「火山方舟」实现了大模型安全互信计算，更加注重为企业客户确保数据资产安全。

「火山方舟」到底怎么用？好不好用？仅通过发布会的 PPT 内容，还不足了解到产品全貌。为了全面、深入地了解「火山方舟」，机器之心对其进行了一次「摸底」。

体验「火山方舟」

首先，登陆火山引擎机器学习平台账号，你会看到产品界面顶端上线了「大模型平台」入口：

目前，火山方舟提供了「模型广场」、「体验中心」、「模型精调」、「模型测评」等版块。

模型广场：从选择、体验到真正落地

发布会上，火山方舟公布了模型广场的首批入驻大模型，包括百川智能、出门问问、复旦大学 MOSS、IDEA 研究院、澜舟科技、MiniMax、智谱 AI（以拼音首字母排序）等多家 AI 科技公司及科研院所的大模型，并已启动邀测。

我们可以将「模型广场」理解为一家「商店」，模型供应方可以在模型广场进行模型创建、上传、部署等，模型使用方可以在模型广场查看模型、快捷体验。

比如我们选择「ChatGLM-130B」，任务就是帮我们写这篇文章的提纲：

除了 AI 对话类的应用，火山方舟现在还提供 AI 绘画类的应用体验。这里我们以「文生图」为例，让它帮我们生成一张「符合前沿科技调性的文章插图」：

通过火山方舟大模型服务平台，企业可一站式接入各种大模型产品和服务，同时也可以在火山方舟平台上训练自己的大模型，进行对比之后再决定，为自己的业务场景找到最合适的解决方案。

在未来的规划中，火山方舟平台将为用户提供跨越多个模态的大模型选择，包括当下最火的大型语言模型、图像生成类模型，以及语音识别类模型。

模型精调：百尺竿头更进一步

当然，在选定大模型之后，企业客户仍然可以根据自己的业务需求进行精调。

鉴于一些垂直场景对大模型的要求较高，客户需要利用自有数据或领域非公开数据进行持续训练，以及建设和积累自己的精调数据集。对精调手段的良好运用，能够帮助企业客户利用更小的模型尺寸，在特定任务上达到媲美通用大模型的水平，由此进一步降低推理成本。

对于这些有复杂需求的场景，企业客户只需手动设置高级参数、验证集、测试集等，更自由地使用模型精调功能。平台也会给出总训练费用预估作为参考：

在平台中，企业客户可以记录下每一次的精调版本：

模型评估环节也是火山方舟重点关注的一环，包括数据准备、指标定义以及人工评估和自动化评估等诸多全方位的工具。

在火山方舟平台上，模型在发起精调任务的同时将进行自动化评估，精调的效果和运行指标也将在平台实时跟踪。

从下图中能看到，各项评测指标在精调前后的变化：

同时，火山引擎提供安全互信的推理方案，保障模型提供商与模型使用者的模型与数据安全，客户可直接使用模型供应方已部署的在线服务或便捷地将精调模型部署为在线服务。

做好大模型服务，还需要解决三个问题

大模型领域的百花齐放，不仅仅带来了算力需求的大幅增长，还让人们意识到：模型也可以成为一种资产。

在现场，谭待分享了自己眼中「做好大模型面临的三个问题」，这也是火山方舟大模型服务平台希望解决好的三个问题。

第一个问题是「安全和信任」。

相比于以往「自产自销」的 AI 模型，今天的大语言模型突出了「模型作为资产」的重要性。模型提供商提供了模型参数和模型结构，自然希望保护知识资产，避免千辛万苦研发出来的核心技术泄露；而模型使用方希望调用模型的输入和输出不被获取和记录，保护自己核心的业务数据、精调数据不会泄露。「资产」能否获得合格的保护，将深刻影响大模型应用的市场格局。

针对这个问题，火山方舟面向不同的业务场景和需求，将安全沙箱与三方审计、硬件支持、联邦学习三种流派将融合为多套方案，为大模型服务商和应用企业提供了双向的信任机制。

目前，平台已经上线了基于安全沙箱的大模型安全互信计算方案，利用计算隔离、存储隔离、网络隔离、流量审计等方式，实现了模型的机密性、完整性和可用性保证，适用于对训练和推理延时要求较低的客户。同时还在探索基于 NVIDIA 新一代硬件支持的可信计算环境、基于联邦学习的数据资产分离等多种方式的安全互信计算方案，更全面地满足大模型在不同业务场景的数据安全要求。

第二个问题是「性价比」。

未来的大模型市场必然是百花齐放的生态，在这样一个生态系统中，可能同时存在少数的超级大模型、多个中等规模的大模型和无数面向具体行业的垂类模型。超大的基座模型未必能够搞定一切，有时候，一个经过良好 f.NETune 的小模型，在垂直领域的一项特定任务上的表现可能不亚于一个通用的大基座模型，但推理成本能降低到原来的十分之一。

对于企业客户来说，这意味着解决实际业务场景问题可能需要一套「组合拳」，对于大模型的应用会呈现出「1+N」的应用模式。

不过，挑战也是一目了然的：首先，选择和决策的过程会非常复杂，逐家试用反而会导致更高的成本；其次，如何做 prompt、如何组织 metric 和数据集、如何科学地 fine-tuning，也需要一些经验和技术的积累才能完成。

在真实的应用场景里面，成本和收益的比例是无法绕过的问题，所以选择大模型优先要考虑性价比。只有把模型的推理成本做到足够低，才能让大模型真正地被广泛使用起来。

火山方舟丰富的模型精调和评测支持可以让这件复杂的事情简单化，企业用统一的工作流对接多家大模型，可设置高级参数、验证集、测试集等功能，再通过自动化和人工评估直观对比模型精调效果，在不同业务场景里还可灵活切换不同的模型，实现最具性价比的模型组合。这些自定义指标和评估数据的积累，也将成为企业在大模型时代宝贵的数据资产。

第三个问题是「生态系统」。如果大语言模型被比喻为 CPU，那么火山方舟要做的事情就是制造出整块主板，丰富下游服务，进一步提升大模型的落地表现。

后续计划包括两项：首先，工具链和下游应用插件需要持续完善。火山方舟团队将基于大模型基座的理解能力和规划能力打造工具链，提供大量的插件并为每个插件配套数据集；其次，打造垂直领域模型的微服务网络，内置包括图像分割、语音识别等众多专业模型，便于企业客户随时调用、自由组合。

方舟，与其背后的「引擎」

从整个大模型应用市场来看，大模型服务平台获得企业客户的前提之一，也包括持续获得众多大模型提供商的支持。

能够迎来国内数家顶尖大模型提供商的积极入驻，火山方舟当然有自己的优势。

对于模型提供商来说，一方面，火山方舟是「大模型技术」与「火山引擎机器学习平台」的有机整体，能够提供可靠的算力供应、持续的性能优化、有竞争力的性价比。

作为首批入驻的大模型提供商，据智谱 AI CEO 张鹏介绍，智谱 AI 在火山引擎平台上解决了千亿模型训练的稳定性、性能优化等挑战；MiniMax 联合创始人杨斌则表示，MiniMax 在火山引擎上实现了从月至周级别的大模型迭代速度，和指数级的用户交互增长。

另一方面，借助火山方舟平台，模型提供商不需要去管理非常底层、复杂的事项，就能够向客户提供稳定服务，更低成本触达广泛客户，快速获得技术的回报。在技术之外，火山引擎的算法团队、解决方案团队和交付团队也会共同协助企业客户与大模型提供商之间对齐需求，促进大模型的落地加速。

此前，很多国内训练大模型的厂商都使用火山引擎的云服务，而从今以后，它们不仅能在火山引擎平台上花钱，还能够在火山引擎平台上赚钱。

每一次技术的大变革，都会带来体验创新的新机会。在大模型热潮的推动下，包括火山引擎在内的云厂商同样面临着快速变化的行业格局。能否把握住变革中的机会，却与此前的技术布局分不开。

如下图所示，位于基础设施层的火山引擎为大模型的推理提供高可靠的保障以及企业级的负载均衡和容错能力。随着平台的不断迭代，其对大模型的资源供应将更为弹性、动态和廉价。利用流量错峰、训推一体等手段，大模型推理的单位成本将进一步降低，这也是「大模型上云」带来的重要优势。

除此之外，火山引擎还将与大模型提供商联合进行深度的性能优化。以 Lego 算子库为例，在训练场景下，使用该高性能算子库可将 Stable Diffusion 模型在 128 张 A100 的训练时间从 25 天减少到 15 天，训练性能提升 40%。

在火山引擎的发展历程中，与英伟达的紧密合作也是一大亮点。此前，双方共同完成的 GPU 推理库 ByteTransformer 在 IEEE 国际并行和分布式处理大会（IPDPS 2023）上获得最佳论文奖。火山引擎和英伟达还联合开源了高性能图像处理加速库 CV-CUDA，并在大规模稳定训练、多模型混合部署等方面的技术合作上取得成效。

NVIDIA 开发与技术部亚太区总经理李曦鹏表示，未来双方将继续深化合作，包含在 NVIDIA Hopper 架构进行适配与优化、机密计算、重点模型合作优化、共同为重点客户提供支持，以及 NeMo Framework 适配等，携手助力大模型产业繁荣。

据了解，在火山方舟推向市场之前，团队已经利用众多的内部场景打磨和改进了平台。迄今，字节跳动有 10 余个业务线正在探索接入和试用火山方舟平台，覆盖文本和图像生成、对话代码辅助、信息检索、营销创意、电商办公效率等应用。

在大模型落地的关键探索时期，火山方舟的诞生恰逢其时，也收获了足够的注视。但作为一个新生事物，它必然还要广阔的成长空间，而接下来的路，就需要大模型领域中的每一位参与者共同携手走下去了。

Tags：火山方舟点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作，风险自担。如有任何标注错误或版权侵犯请与我们联系，我们将及时更正、删除。

▌相关推荐

抖音团队在用的大模型服务平台"火山方舟",我们也上手体验了一把

作者：蛋酱2023 上半年，海内外经历了一场「百模大战」。从科技巨头、科研机构、创业公司到各传统行业，纷纷掀起了炼大模型的热潮。当大模型成为新的风口，我们却发现，相比于上一波...【详细内容】

2023-06-30　　Search: 火山方舟点击:(312)　　评论:(0)　　加入收藏

▌简易百科推荐

行业大模型快速落地的一年，如何做？

生成式AI正成为时下科技企业“讲故事”的关键词之一。但从发展上看，无论是“文生文”的大语言模型，还是“文生图”的多模态模型，更多的是辅助人们进行一些简单的办公，或者提供一...【详细内容】

2024-04-10　　　　钛媒体APP　　Tags:行业大模型　点击:(3)　　评论:(0)　　加入收藏

互联网充斥“针对小白的AI课”，能相信吗？普通人不学AI课程会被淘汰？

早前，一位标榜清华大学博士和多家公司AI顾问名头的百万级粉丝量博主，向用户大力推介“所有人都需要学”的AI入门课程。不过，这些课程最终因贩卖焦虑、蒙骗学员而被平台下架。然...【详细内容】

2024-04-10　　　　九派新闻　　Tags:AI课　点击:(5)　　评论:(0)　　加入收藏

藏在AI背后的“吃电狂魔”

人工智能时代的能耗黑洞据估算，到2027年，人工智能行业每年将消耗85~134太瓦时的电力，相当于瑞典或荷兰一年的总用电量。马斯克判断，电力缺口最早可能会在2025年发生，“明年你会看...【详细内容】

2024-04-09　　　　雪豹财经社　　Tags:AI 　点击:(3)　　评论:(0)　　加入收藏

OpenAI和谷歌再起纷争：AI的尽头是内容

日前，纽约时报的一篇报道称，人工智能公司 OpenAI为收集高质量训练数据而开发了一个语音转录模型Whisper。该模型主要用于转录 OpenAI 获取的超过 100 万小时的 YouTube 视频，也...【详细内容】

2024-04-09　　小编也疯狂　　新浪网　　Tags:AI 　点击:(2)　　评论:(0)　　加入收藏

AI产业的灰色暗面：OpenAI、谷歌、META如何搞训练语料

财联社4月7日讯（编辑史正丞）种种迹象显示，目前站在全世界AI领域潮头浪尖的这些公司，早在几年前就已经陷入对训练语料的“绝望”追逐中——为此他们不惜修改政策条款...【详细内容】

2024-04-09　　　　财联社　　Tags:AI产业　点击:(3)　　评论:(0)　　加入收藏

和“数字人”交朋友，当心隐私被出卖......

在虚拟社交中如何在保护用户隐私和数据安全的同时提供高质量的社交体验？如何避免过度依赖虚拟社交找到虚拟与真实之间的平衡点？《中国消费者报》记者就此展开了调查APP里有个...【详细内容】

2024-04-09　　　　中国消费者报　　Tags:数字人　点击:(6)　　评论:(0)　　加入收藏

AI“复活”成产业链：成本可降至数百元

大模型应用落地，带火数字人(11.560, 0.29, 2.57%)赛道。文|《中国企业家》记者李艳艳实习生孙欣编辑|姚赟头图来源|《流浪地球2》电影画面截图清明节前，预估会有需求的庞立...【详细内容】

2024-04-09　　　　中国企业家　　Tags:AI“复活” 　点击:(3)　　评论:(0)　　加入收藏

多方热议人工智能产业新机遇

编者按&emsp;&emsp;从前沿科技展会到高层对话平台，从上海、重庆到博鳌，从线上到线下……一场场高规格、大规模的盛会中，人工智能正在成为各界热议的高频词。赋能千...【详细内容】

2024-04-08　　　　中国家电网　　Tags:人工智能　点击:(5)　　评论:(0)　　加入收藏

人形机器人时代来了吗

日前，由中国人形机器人(11.080, -0.05, -0.45%)百人会主办的人形机器人大赛在北京经济技术开发区开赛。工作人员向参观者展示一款人形机器人。参观者与一款陪护型人形机器人...【详细内容】

2024-04-08　　　　中国青年报　　Tags:人形机器人　点击:(6)　　评论:(0)　　加入收藏

AI重塑社交：腾讯与字节跳动的新赛场

文|新火种一号编辑|美美最近，腾讯和字节跳动这两大互联网巨头几乎同步推出了各自的AI社交产品，尽管腾讯和字节跳动在前段时间刚刚“破冰”，但这一举措不仅意味着这两大巨头之...【详细内容】

2024-04-07　　　　蓝鲸财经　　Tags:AI 　点击:(8)　　评论:(0)　　加入收藏

推荐资讯

手机死机怎么办？10个常	从Windows到MacOS：操作
电脑怎么重新设置密码	笔记本电池0%，但电源已
笔记本电脑没有声音？这	英特尔发布新一代AI芯
美联储降息或再延期	国家统计局：2024年3月