• 首页
  • 时政
  • 财经
  • 社会
  • 股票
  • 信用
  • 视频
  • 图片
  • 品牌
  • 发改动态
  • 中宏研究
  • 营商环境
  • 新质生产力
logo 公司
  • 中宏网首页 >
  • 商业管理 >
  • 公司 >
  • 正文

Zilliz@阿里云:大模型时代下向量数据库处理非结构化数据的最佳实践

2023-09-23 16:59:17 来源:河北网络广播电视台
分享到:
用微信扫描二维码

  大模型时代下的数据存储与分析该如何处理?有没有已经落地的应用实践?

  为探讨这些问题,近日,阿里云联合Zilliz和Doris举办了一场以《大模型时代下的数据存储与分析》为主题的技术沙龙,其中,阿里云对象存储OSS上拥有海量的非结构化数据,Milvus(Zilliz)作为全球最有影响力的开源向量数据库项目、Doris(飞轮科技)作为热门的数据分析项目,都积累了丰富的非结构化数据处理和分析的最佳实践。

  沙龙现场,Zilliz运营与生态负责人李晨进行了名为《向量数据库:大模型的记忆体》的主题分享。

1.jpg

  受大模型催化,向量数据库方兴未艾。与传统数据库相比,向量数据库面向高维度向量,可以更好地处理图像、音频和视频等非结构化数据。李晨主要介绍了向量数据库的基本原理、应用场景和演进方向,以及Zilliz在此方向中的积累和心得。

  他表示,向量数据库是AIGC大模型的重要补充,是提供准确可靠、高度可扩展的长短期“记忆”的关键载体,其在LLM领域的应用主要可以分为以下6类:管理私有数据和知识库、为大模型提供实时数据更新、实现大模型的个性化和增强、提供智能体的记忆、保存大模型的处理结果、构建更复杂的AI系统。当然,这其中离不开一个新的程序开发应用范式——CVPStack。

  在CVPStack中,C是以ChatGPT为代表的大模型,它在AI程序中充当中央处理器的角色;V代表VectorDatabase,即以ZillizCloud和Milvus为代表的向量数据库,为大模型提供知识存储;P代表PromptEngineering,各环节通过Prompt的方式进行交互。

  相比单模型架构,CVP架构在灵活性、可扩展性、实时性、成本四个维度都有明显优势。最关键的原因是,在CVP架构中,领域知识可以用数据入库的形式进行更新,而非重新训练或微调模型,向量数据库是该架构的重要组成部分。这其中一个典型的应用实践就是OSSChat,它用于解决开源项目文档冗长、不易查找等问题,目前已经支持几十个主流的开源项目。

1.jpg

  此外,为了进一步降低应用构建成本,提供标准化组件,Zilliz已与全球头部大模型生态完成了C-V间对接。2023年3月,Zilliz作为OpenAI首批向量数据库合作伙伴,完成了Milvus与ZillizCloud插件化集成,作为官方推荐的向量数据库插件提供给广大应用开发者。同时,Zilliz还与LangChain、Cohere、LlamaIndex、Auto-GPT、BabyAGI等热门项目进行了深度集成。值得一提的是,ZillizCloud已经正式在国内提供云服务,也在今年7月份官宣了和阿里云的合作,相信在双方的努力配合下,一定可以让用户享受到更好的产品和服务。


编辑:沈露
审核:郭勇

免责声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。如稿件版权单位或个人不想在本网发布,可与本网联系,本网视情况可立即将其撤除。

  • 微信
  • 微博
  • 手机中宏网

互联网新闻信息服务许可证10120230012 信息网络传播视听节目许可证0121673 增值电信业务经营许可证京B2-20171219 广播电视节目制作经营许可证(京)字第10250号

关于我们 中宏网动态 广告服务 中宏网版权所有 京ICP备2023030128号-1 举报电话:010-63359623

Copyright © 2016-2025 by www.zhonghongwang.com. all rights reserved 运营管理:国家发展和改革委员会宏观经济杂志社