其他
分享回顾 | DocArray:为机器学习而生的数据结构!
Jina AI 高级工程师王峰应 CSDN 和示说技术沙龙邀请,进行了 DocArray 相关主题分享,本文为分享回顾。
没来得及观看直播的小伙伴,可点击下方小程序,查看完整回放:
【Show Notes】
00:39 Jina AI 简介
01:58 DocArray 介绍
04:18 DocArray 产生背景
05:30 传统搜索 vs 神经搜索
16:20 DocArray 的设计目标
17:28 DocArray 的三个重要概念
31:28 在用户开发体验上的支持
37:18 以图搜图实战案例分享
42:23 Jina 全家桶使用介绍
关注 Jina AI 公众号,后台回复【DocArray】,获取讲师文档。
Document 是最基本的数据类型,帮助用户快速对非结构化数据进行表征。
DocumentArray 是表达多个 Document 的数据结构,可以简单地理解成一个 Python 列表。
Dataclass 是对 Document 更高层次的封装,可以更好地表示一个多模态的文档。你可以利用装饰器@dataclass,将该图片信息表示为如下代码片段。
from docarray import dataclass, Document
from docarray.typing import Image, Text, JSON
@dataclass
class WPArticle:
banner: Image
headline: Text
meta: JSON
a = WPArticle(
banner='dog-cat-flight.png',
headline='Everything to know about flying with pets, from picking your seats to keeping your animal calm',
meta={
'author': 'Nathan Diller',
'column': 'By the Way - A Post Travel Destination',
},
)
通过一些简单的例子尝试用 DocArray 存储非结构化数据吧!
现已支持更多存储后端,如 ES,Qdrant 等
阅读原文,获取更详细的文档介绍
神经搜索、深度学习、推荐系统
教程、demo、干货分享
扫码备注加入讨论组
更多精彩内容(点击图片阅读)