网站首页 > 开源技术 正文
基于大语言模型和多向量数据库的知识库问答系统白盒化解决方案
- 支持多种向量数据库: Hologres、Elasticsearch、OpenSearch、AnalyticDB、以及本地FAISS向量库
- 支持多种向量化模型(中文、英文、多语言): SGPT-125M, text2vec-large-chinese, text2vec-base-chinese, paraphrase-multilingual, OpenAIEmbeddings
- 支持任意基于PAI-EAS部署的大模型服务: Qwen, chatglm, llama2, baichuan等系列模型,同时支持ChatGPT调用(需提供OpenAI Key)
- 部署参考链接:PAI+向量检索快速搭建大模型知识库对话
PAI-RAG白盒化解决方案系统架构图
- Step1: 文档处理、切片,针对文本进行不同格式和长度的切分
- Step2: 文本向量化,导入到向量数据库
- Step3: 用户Query向量化,并进行向量相似度检索,获取Top-K条相似文本块
- Step4: 将用户query和Top-K条文本块基于上下文构建Prompt
- Step5: 大模型推理回答,必要时可以finetune模型
Gihub:https://github.com/aigc-apps/PAI-RAG
猜你喜欢
- 2024-12-16 AI时代竟有智能化鸿沟,具备哪些条件才能跨过?
- 2024-08-03 Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏
- 2024-08-03 项目部署后验证是否部署成功的方法
- 2024-08-03 干货!爱奇艺深度学习云平台的实践及优化
- 2024-08-03 长期盘踞热榜,微软官方AutoML库教你三步学会20+炼金基本功
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- jdk (81)
- putty (66)
- rufus (78)
- 内网穿透 (89)
- okhttp (70)
- powertoys (74)
- windowsterminal (81)
- netcat (65)
- ghostscript (65)
- veracrypt (65)
- asp.netcore (70)
- wrk (67)
- aspose.words (80)
- itk (80)
- ajaxfileupload.js (66)
- sqlhelper (67)
- express.js (67)
- phpmailer (67)
- xjar (70)
- redisclient (78)
- wakeonlan (66)
- tinygo (85)
- startbbs (72)
- webftp (82)
- vsvim (79)
本文暂时没有评论,来添加一个吧(●'◡'●)