其他
J-Tech & 开源之夏|什么是比快更快的向量搜索
分享 Jina AI 在开发过程中所积累的经验
本期 J-Tech Talk 邀请到了在开源之夏项目中脱颖而出的杨小燕,分享她负责的项目《支持 Redis 数据库作为 DocArray 的存储后台》帮助更多的开发者高效地进行向量检索。
作为 Jina 生态的底层模块,DocArray 是一种可扩展的数据结构,完美适配深度学习任务。总的来说,DocArray 能够把非结构化数据,统一成同一种数据结构。支持的数据类型包括文本、图像、音频、视频、3D mesh等,并且能够高效地处理、检索、推荐、存储及传输数据。在小燕的贡献下,DocArray 新增了 Redis 数据库的后端存储支持,现在 DocArray 支持了更多向量数据库作为存储后台,如 Annlite,SQLite,Qdrant 以及 Elasticsearch 等。
分享内容
什么是 DocArray
DocArray 是一种为机器学习而生的数据结构工具包。
如何实现 DocArray 的 Redis 后端存储
添加 Redis 支持,可以使用基于图的 ANN 搜索算法:HNSW,该算法能够最大程度地达到检索召回率和检索时间的平衡。
经验分享 - 在开源之夏和世界各地的工程师一起开发的体验
关于讲师
活动时间
2022 年 9 月 22 日 周四晚 19:00 - 19:45