构建更好的基于LLM的应用程序的四大秘诀

时间：2023-12-13 11:56:55 来源：51CTO 作者：

作者 | Adrien Treuille

译者 | 布加迪

自从AI target=_blank class=infotextkey>OpenAI发布首个ChatGPT模型以来，人们对生成式AI的兴趣激增。基于大语言模型（LLM）的应用程序现处于企业思考生产力和效率的最前沿，用于构建生成式AI应用程序的工具和框架得到了极大的扩展。但人们仍然担心生成式AI输出的准确性，因此开发人员需要快速学会处理诸如此类的问题，以构建强大、可靠的应用程序。

以下是提高LLM应用程序准确性的一些建议和技术，以及选择正确LLM的注意事项。我们无法详尽地探讨这些问题，因为每个问题本身都很复杂，但我们可以提供一番建议，供诸位进一步探索。

本文中的Streamlit是一个免费开源框架，用于快速构建和共享机器学习和数据科学Web应用程序，最近它发布了一份报告，分析了Streamlit社区云上13000余名开发人员构建的21000多个LLM应用程序。它介绍了开发人员迄今为止一直在使用的一些工具和技术，并提供了以下一些建议。

比如说，矢量检索工具可以为基于LLM的应用程序有效地改善上下文推荐，但我们的调查发现，目前只有少数开发人员在使用矢量功能，这代表未来大有机会。

随着更多的开发人员利用生成式AI开发应用程序，我们将开始看到跨类别和垂直行业的应用程序逐渐内置基于AI的搜索以及对话和辅助体验。以下是我给开发人员的四条建议，帮助他们构建更好的基于LLM的应用程序，这样他们可以给所在组织带来真正的颠覆效应。

1、为更智能的应用程序使用代理和编排

像LangChain和LlamaIndex这样的编排框架可以使用额外的工具或代理来帮助增强模型基于LLM的应用程序的功能。在这种情况下，可以将代理视为插件系统，允许您将额外功能做入到应用程序中，用自然语言来表达。

这些代理可以组合起来管理和优化LLM功能，比如改进AI推理、解决偏见和集成外部数据源。代理还可以为LLM提供一种方法来思考它是否犯了错误以及成功完成任务所必须采取的步骤。

打个比方，考虑一下开发人员如何编写提供特定函数的API和描述该函数的文档：API表示为代码，文档使用自然语言。代理以类似的方式工作，除了提供文档是为了方便LLM，而不是方便其他开发人员。因此，LLM关注手头的任务，查看代理的文档，并确定代理是否可以帮助它完成任务。

这些代理还为应用程序提供了一种反思自身错误并纠正它们的方法，从而为LLM应用程序增添了健壮性。比如说，假设一个LLM应用程序编写了一些SQL代码来执行任务，比如检查数据库中的库存数量，但它在代码中犯了错误。对于标准的“幼稚”的LLM应用程序而言，这个错误如同路之尽头。

然而，如果应用程序有一个执行SQL的代理，它可以查看错误，使用代理来确定应该采取什么不同的做法，然后纠正错误。这可能只是语法上的一个小变化，但是如果没有代理，LLM就无法通过推理解决错误。

2、使用矢量魔法和RAG来对抗幻觉

有时，您在使用的LLM无法访问完成预期任务所需的所有信息。这可以在提示时注入额外的信息，但大多数LLM限制了这些提示的大小。为了克服这种限制，LLM可能需要使用矢量查询外部数据库，这种技术就叫检索增强生成（RAG）。

为了理解RAG可以为LLM应用程序做什么，不妨考虑三个不同级别的LLM应用程序。

•第1级：应用程序可以使用LLM中已有的知识生成结果。

•第2级：应用程序需要额外的信息，信息可以在提示时注入。只要您能保持遵守提示限制，这相当简单。

•第3级：LLM需要联系外部信息源（比如数据库）以完成任务。

RAG在第3级有了用武之地，外部数据库通常使用矢量进行语义索引，这就是为什么您最近可能频频听到矢量数据库和矢量搜索工具的新闻。

具有矢量数据库和矢量搜索的应用程序可以通过对庞大的非结构化数据集（包括文本、图像、视频或音频）进行分类，以实现快速的上下文搜索。这对于进行更快、更强大的上下文推荐非常有效。但矢量工具仍未得到广泛应用。Streamlit的调查发现，仅20%的基于生成式AI的应用程序使用了某种矢量技术。

3、聊天机器人为用户提供了一种强大的方式来优化查询

聊天机器人将生成式AI带入了主流，但有人怀疑将来它们是否会成为一种有效的界面。有人认为，聊天机器人给了用户太多的自由，却没有足够的背景知识来说明如何使用LLM应用程序。有人被过去的失败所吓倒：Clippy是一场灾难，为什么聊天机器人今天会成功呢？

很显然，聊天机器人是否合适一方面取决于应用程序的预期用途。但聊天机器人至少有一个非常有用的优点不容忽视：它们为用户通过流畅的、仿人的界面添加上下文和完善答案提供了一种简单又直观的方式。

要理解为什么这很强大，不妨想想搜索引擎。用户通常无法改进搜索引擎查询；比如说，如果结果略有偏差，没有办法告诉搜索引擎“再试一次，但排除关于X的答案”，或者“给y更多的权重”。这将是一种方便而强大的功能，这也是聊天机器人为LLM应用程序提供的功能。

调查发现，用Streamlit构建的生成式AI应用程序中28%是聊天机器人，而72%的应用程序通常不允许会话改进。另一方面，调查显示，这些聊天机器人的每周使用率上升到近40%，而非聊天机器人应用程序的使用率有所下降。因此，聊天机器人可能是最终用户青睐的界面。

4、考虑GPT的替代方案，包括开源LLM

基本的GPT模型仍然是最知名的LLM，它们功能非常强大，但在过去的一年里出现了更多的选择，其中一些可能更适合您的应用程序。需要考虑的因素包括：LLM所需的知识广度、LLM的规模、您的训练要求和预算，以及LLM是开源还是专有对您来说是否重要。与科技界的许多方面一样，这里也存在取舍。

如果您在构建一个供内部使用的生成式AI应用程序，可能需要使用内部企业数据来训练该LLM。对于大多数企业来说，出于安全原因，与公共LLM共享敏感数据是不可能的，因此许多公司在现有的云安全边界内运行LLM，这常常导致它们选择比较小的LLM，比如AI21和Reka。

非常庞大的LLM还往往有更高的延迟，由于所需的计算资源，通常运行成本更高。如果应用程序执行比较简单的任务，比如翻译文本或总结文档，较小的LLM可能效果很好，使用和操作成本显著降低。

您也可能有理由偏爱开源LLM，比如Meta的LLaMA，而不是像OpenAI、Anthropic或Cohere这样的专有LLM：在专有LLM中，源代码、训练数据、权重或模型的其他细节通常不会公开披露。开源LLM需要自托管或通过托管提供商进行推理，但是源代码及模型的其他细节更容易获得。

5、写在最后：现在就开始使用生成式AI

生成式AI仍然是迅速崛起的领域，但所需的工具和技术在迅速发展，今天有很多选择可以开始入手。抓住这个机会的开发人员可以为所在组织提供巨大的价值，将AI应用程序作为日常业务运营和任务的一项常规功能。随着生成式AI继续重塑组织中的角色和责任，依赖并精通基于LLM的应用程序的开发人员将脱颖而出，上述建议将帮助您开始迈出正确的第一步。

原文链接：https://thenewstack.io/4-key-tips-for-building-better-llm-powered-Apps/

Tags：LLM 点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作，风险自担。如有任何标注错误或版权侵犯请与我们联系，我们将及时更正、删除。

▌相关推荐

一文解析如何基于 LangChain 构建 LLM 应用程序

Hello folks，我是 Luga，今天我们继续来聊一下人工智能(AI)生态领域相关的技术 - LangChain ，本文将继续聚焦在针对 LangChain 的技术进行剖析，使得大家能够了解 LangChain 实现...【详细内容】

2024-03-07　　Search: LLM 点击:(31)　　评论:(0)　　加入收藏

有了LLM，所有程序员都将转变为架构师？

编译 | 言征出品 | 51CTO技术栈（微信号：blog51cto）生成式人工智能是否会取代人类程序员？可能不会。但使用生成式人工智能的人类可能会，可惜的是，现在还不是时候。目前，我们正在见...【详细内容】

2024-03-07　　Search: LLM 点击:(19)　　评论:(0)　　加入收藏

一文读懂大型语言模型LLM

在当今的技术世界中，人工智能正以前所未有的速度发展和演变。这一领域的快速发展得益于先进的机器学习算法、海量数据的可用性以及计算能力的显著提升。特别是，在自然语言处理...【详细内容】

2024-01-02　　Search: LLM 点击:(81)　　评论:(0)　　加入收藏

SQL应用于LLM的程序开发利器——开源LMQL

译者 | 朱先忠审校 | 重楼我相信你听说过SQL，甚至已经掌握了它。SQL（结构化查询语言）是一种广泛用于处理数据库数据的声明性语言。根据StackOverflow的年度调查，SQL仍然是世界上...【详细内容】

2023-12-27　　Search: LLM 点击:(76)　　评论:(0)　　加入收藏

生成式人工智能潜力的释放：软件工程师的MLOps和LLM部署策略

译者 | 李睿审校 | 重楼生成式人工智能最近的爆发标志着机器学习模型的能力发生了翻天覆地的变化。像DALL-E 2、GPT-3和Codex这样的人工智能系统表明，人工智能系统在未来可以...【详细内容】

2023-12-18　　Search: LLM 点击:(116)　　评论:(0)　　加入收藏

构建更好的基于LLM的应用程序的四大秘诀

作者 | Adrien Treuille译者 | 布加迪自从OpenAI发布首个ChatGPT模型以来，人们对生成式AI的兴趣激增。基于大语言模型（LLM）的应用程序现处于企业思考生产力和效率的最前沿，用于...【详细内容】

2023-12-13　　Search: LLM 点击:(132)　　评论:(0)　　加入收藏

解决LLaMA、BERT等部署难题：首个4-bit浮点量化LLM来了

大语言模型 (LLM) 压缩一直备受关注，后训练量化（Post-training Quantization) 是其中一种常用算法，但是现有 PTQ 方法大多数都是 integer 量化，且当比特数低于 8 时，量化后模型的...【详细内容】

2023-11-17　　Search: LLM 点击:(144)　　评论:(0)　　加入收藏

LLM量化包与传统投资策略的对比分析

随着科技的发展和金融市场的变化，投资者们在寻求更有效的投资策略时，开始关注量化投资。LLM量化包作为一种先进的量化投资工具，与传统投资策略相比，具有许多独特的优势。本文将...【详细内容】

2023-11-17　　Search: LLM 点击:(132)　　评论:(0)　　加入收藏

LLMs应用框架：LangChain端到端语言模型

在当今数字化时代，语言处理技术的重要性日益凸显。大语言模型（LLMs）作为其中的重要分支，已经在多个领域取得了显著的进展。然而，如何将这些模型应用到实际场景中，实现端到端的自动...【详细内容】

2023-11-16　　Search: LLM 点击:(167)　　评论:(0)　　加入收藏

什么是 LLM （大型语言模型）以及如何构建LLM？

来源：Mangesh Gothankar在本文中，我们将了解如何从零开始构建 LLM（大型语言模型）。你可能会问，为什么要做这样的事情？是这样的，LLM 在无数应用中都非常有用，从头开始构建一个 LLM，你...【详细内容】

2023-11-09　　Search: LLM 点击:(90)　　评论:(0)　　加入收藏

▌简易百科推荐

即将过时的 5 种软件开发技能！

作者 | Eran Yahav编译 | 言征出品 | 51CTO技术栈（微信号：blog51cto）时至今日，AI编码工具已经进化到足够强大了吗？这未必好回答，但从2023 年 Stack Overflow 上的调查数据来看，44%...【详细内容】

2024-04-03　　　　51CTO　　Tags:软件开发　点击:(5)　　评论:(0)　　加入收藏

跳转链接代码怎么写？

在网页开发中，跳转链接是一项常见的功能。然而，对于非技术人员来说，编写跳转链接代码可能会显得有些困难。不用担心！我们可以借助外链平台来简化操作，即使没有编程经验，也能轻松实...【详细内容】

2024-03-27　　蓝色天纪　　　　Tags:跳转链接　点击:(12)　　评论:(0)　　加入收藏

中台亡了，问题到底出在哪里？

曾几何时，中台一度被当做“变革灵药”，嫁接在“前台作战单元”和“后台资源部门”之间，实现企业各业务线的“打通”和全域业务能力集成，提高开发和服务效率。但在中台如火如荼之...【详细内容】

2024-03-27　　dbaplus社群　　　　Tags:中台　点击:(8)　　评论:(0)　　加入收藏

员工写了个比删库更可怕的Bug！

想必大家都听说过删库跑路吧，我之前一直把它当一个段子来看。可万万没想到，就在昨天，我们公司的某位员工，竟然写了一个比删库更可怕的 Bug！给大家分享一下（不是公开处刑），希望朋友们...【详细内容】

2024-03-26　　dbaplus社群　　　　Tags:Bug 　点击:(5)　　评论:(0)　　加入收藏

我们一起聊聊什么是正向代理和反向代理

从字面意思上看，代理就是代替处理的意思，一个对象有能力代替另一个对象处理某一件事。代理，这个词在我们的日常生活中也不陌生，比如在购物、旅游等场景中，我们经常会委托别人代替...【详细内容】

2024-03-26　　萤火架构　　微信公众号　　Tags:正向代理　点击:(10)　　评论:(0)　　加入收藏

看一遍就理解：IO模型详解

前言大家好，我是程序员田螺。今天我们一起来学习IO模型。在本文开始前呢，先问问大家几个问题哈~什么是IO呢？什么是阻塞非阻塞IO？什么是同步异步IO？什么是IO多路复用？select/epoll...【详细内容】

2024-03-26　　捡田螺的小男孩　　微信公众号　　Tags:IO模型　点击:(8)　　评论:(0)　　加入收藏

为什么都说 HashMap 是线程不安全的？

做Java开发的人，应该都用过 HashMap 这种集合。今天就和大家来聊聊，为什么 HashMap 是线程不安全的。1.HashMap 数据结构简单来说，HashMap 基于哈希表实现。它使用键的哈希码来...【详细内容】

2024-03-22　　Java技术指北　　微信公众号　　Tags:HashMap 　点击:(11)　　评论:(0)　　加入收藏

如何从头开始编写LoRA代码，这有一份教程

选自 lightning.ai作者：Sebastian Raschka机器之心编译编辑：陈萍作者表示：在各种有效的 LLM 微调方法中，LoRA 仍然是他的首选。LoRA（Low-Rank Adaptation）作为一种用于微调 LLM（大...【详细内容】

2024-03-21　　机器之心Pro　　　　Tags:LoRA 　点击:(12)　　评论:(0)　　加入收藏

这样搭建日志中心，传统的ELK就扔了吧！

最近客户有个新需求，就是想查看网站的访问情况。由于网站没有做google的统计和百度的统计，所以访问情况，只能通过日志查看，通过脚本的形式给客户导出也不太实际，给客户写个简单的...【详细内容】

2024-03-20　　dbaplus社群　　　　Tags:日志　点击:(4)　　评论:(0)　　加入收藏

Kubernetes 究竟有没有 LTS？

从一个有趣的问题引出很多人都在关注的 Kubernetes LTS 的问题。有趣的问题2019 年，一个名为 apiserver LoopbackClient Server cert expired after 1 year[1] 的 issue 中提...【详细内容】

2024-03-15　　云原生散修　　微信公众号　　Tags:Kubernetes 　点击:(5)　　评论:(0)　　加入收藏

推荐资讯

访问网站显示不安全是	掌握独立站SEO策略，提
快手蓝色小钥匙跳转微	微信朋友圈如何置顶
Facebook新用户扩展怎	详解微信里面的分期可
微信表情包更新：原创设	微信朋友圈功能大改版