alibaba / higress

Cloud Native API Gateway | 云原生API网关
https://higress.io
Apache License 2.0
2.5k stars 407 forks source link

【GLCC】AI 缓存 Wasm 插件对接更多向量数据库/向量存储、搜索组件 #1041

Open Suchun-sv opened 2 weeks ago

Suchun-sv commented 2 weeks ago

GitLink编程夏令营(GLCC),是在CCF中国计算机学会指导下,由CCF开源发展委员会(CCF ODC)举办的面向全国高校学生的暑期编程活动。活动将覆盖近千所高校,并联合各大开源基金会、开源企业、开源社区、开源专家,旨在鼓励青年学生通过参加真实的开源软件开发,提升自身技术能力,为开源社区输送优秀人才。为青年学生提供开放友好的交流平台,希望进一步推动国内开源社区的繁荣发展。

Higress将会参加本次的“GitLink编程夏令营(GLCC)”

背景

Higress 最近正在开发一款基于向量相似度实现 LLM 结果召回的 Wasm 插件 AI Cache(#1040)。目前使用的核心向量召回模块为Redis。但为了适配更多的扩展需求,需要对接更多种类的向量数据库或支持向量存储、搜索的组件。目前 Wasm 插件提供了对外发送 HTTP 请求的能力,所以可以很方便的对接提供 REST API 的相关产品。

目标

在 AI Cache 插件中对接一系列向量数据库或支持向量存储、搜索的组件。

难度

中等

导师

董艺荃(@CH3CHO) ch3cho@qq.com

产出要求

基于 AI Cache 插件中的向量存储操作接口,支持对以下向量数据库/存储搜索组件的进行操作,以实现基于向量相似度实现 LLM 结果召回功能:

能力要求

  1. 熟练掌握 Go 语言
  2. 了解对接各种向量数据库的方式的优先考虑
  3. 有基于向量相似度进行 RAG 应用开发经验的优先考虑