重磅推荐:新一代神经搜索开源框架
【公众号回复 “1024”,免费领取程序员赚钱实操经验】
大家好,我是章鱼猫。
今天的开源项目来自于读者的投稿,是一款基于 Python 语言的神经搜索开源框架。
所谓的神经搜索 (Neural Search) 是指用非结构化数据,搜索非结构化数据。深度学习模型和向量索引是神经搜索的重要组成部分。 由于神经搜索是一个全新的领域,缺少系统搭建的统一工具,开发者通常需要同时了解包括分布式系统、深度学习框架以及网络服务方面的知识,为此设计了 Jina。
Jina 是一款主打易用性及云原生的神经搜索框架, 它将整个流程封装成一个完整系统,提供统一的接口,这极大降低了神经搜索系统的开发成本。2020 年 4 月 Jina 在 GitHub 开源,截至目前已收获 13.8k Star。
利用 Jina,开发者可搭建以图搜图、以文字搜图、Question-Answering(问答机器人)、照片去重、海量标签分类等多种应用。
Jina 具有以下优势:
⏱ 省时省力:将神经搜索系统搭建的整个流程,封装成一个完整系统,支持快速建立索引、查询、理解多/跨模态数据的解决方案;
🌩️ 本地和云端友好:分布式架构,支持可扩展和云原生,可以在本地、Docker Compose、Kubernetes 上部署 Jina;
🚀 服务、扩展及共享:通过 HTTP、WebSockets 或 gRPC 端点,几分钟之内即可服务本地项目;扩展神经搜索应用,满足用户对可用性和吞吐量的不同要求;通过 Jina Hub,开发者可以轻松分享和复用 Executor;
🍱 拥有自己的堆栈:对解决方案保有端到端的堆栈所有权,支持与神经搜索生态系统 (DocArray, Hub 及 Finetuner) 的整合。
这款开源框架极大简化了神经搜索系统的搭建流程,方便本地调试,也可以快速地以服务形式进行部署,Jina 原生提供 Swagger-UI,方便代码调试,几行代码即可将 Jina 部署到 Kubernetes 系统中。
对这个开源框架感兴趣的同学,可以去 GitHub 上研究学习。
开源项目地址:https://github.com/jina-ai/jina
开源项目组织:Jina AI
最近,章鱼猫建了一个「GitHub 精选交流群」,欢迎大家一起交流优秀开源项目,也可以宣传自己的开源项目,在 「GitHub 黑板报」公众号后台回复【加群】邀请你入群。
---特别推荐---
特别推荐:一个新的优质的专注分享各种浏览器插件、黑科技教程、各种你想不到的高效率软件及工具的公众号,「程序员掘金」,专注挖掘好东西,非常值得大家关注。点击下方公众号卡片,直接关注。