当前位置:数码通 > 手机

鸿科分享| Google Vertex AI平台使用Redis构建大型语言模型

来源于 数码通 2023-09-30 13:31

基础模型和高性能数据层两个基本组件始终是创建高效且可扩展的语言模型应用程序的关键。使用Redis构建大型语言模型可以实现高效且可扩展的语义搜索、检索增强生成、LLM缓存机制、LLM内存和持久化。 Redis支持的大语言模型可以应用于文档检索、虚拟导购、客服助理等,为企业带来效益。

1。语言模型组件

应用程序生成、理解和使用人类语言的能力变得越来越重要,从客户服务机器人到虚拟助理到内容生成,人们对AI应用程序感兴趣功能需求跨越许多领域,而这一切的实现都要归功于谷歌的PaLM 2等基本模型。这些模型经过精心调整,可以生成类似于人类表达风格的内容。

在这种动态环境中,基础模型和高性能数据层这两个基本组件仍然是创建高效且可扩展的语言模型应用程序的关键。

1.基本款

基本模型是生成式 人工智能 应用程序的基石,其中大型语言模型 (LLM) 是其中的一个子集。 LLM 经过大量文本训练,使其能够为各种任务生成上下文敏感、类人表达风格的文本。改进这些模型以使其更加复杂,使应用程序能够更精细、更高效地响应用户输入。选择的语言模型可以显着影响应用程序的性能、成本和服务质量。

然而,PaLM 2 等模型虽然功能强大,但也有其局限性。例如,当缺乏特定领域的数据时,模型可能不够相关,并且可能无法及时呈现新的信息或准确的信息。 LLM 对提示中可以处理的上下文长度(即短语数量)有硬性限制。另外,LLM的训练或微调需要大量的计算资源,这会大幅增加成本。平衡这些限制和优势需要谨慎的战略和强大的基础设施的支持。

2。高性能数据层

高效的法学硕士应用程序以可扩展的高性能数据层为基础,该组件可确保高速交易和低延迟,这对于保持流畅的用户交互至关重要。它在以下方面发挥着关键作用:

·缓存预先计算的请求响应或嵌入

·保留过去的交互历史

·进行语义搜索以检索相关上下文或知识

矢量数据库已成为流行的数据层解决方案。 Redis 对矢量搜索的投资早于当前矢量数据库热潮,这反映了我们丰富的经验,尤其是在性能方面。 Redis 在矢量搜索方面的经验体现在刚刚发布的 Redis 7.2 版本中,其中包括可扩展搜索功能的预览,并且与之前的版本相比,每秒的查询数量增加了 16 倍。

基础模型和向量数据库在不同行业的LLM应用中发挥着至关重要的作用,从而引起了业界的极大兴趣和炒作。例如,一些较新的独立矢量数据库解决方案(如 Pinecone)宣布了巨额融资,并投入了大量精力来吸引开发人员的关注。然而,随着每周都有新工具出现,可能很难知道哪种工具能够真正满足您的业务需求。

GCP(Google 的 Google Cloud Platfm)的特点是其统一的产品,它结合了强大的基础模型、可扩展的基础设施,并结合了一套用于调优的工具、部署和维护这些模型以确保最高级别的数据安全和隐私。

但要真正实现这些进步的潜力,高性能且可扩展的数据层是必不可少的,这就是 Redis 的用武之地。

3。可扩展语言模型应用程序的推理架构

-->
登录后参与评论