其他
关注:美国地方、州和联邦政府将大量公共数据集通过SeedAI组织上传到Filecoin进行隐私安全AI分析和利用
美国地方、州和联邦政府将大量公共数据集通过SeedAI组织上传到Filecoin进行隐私安全AI分析和利用
Austin Carson是SeedAI的创始人,这是一个非营利、无党派的倡导组织,旨在帮助全国社区开发AI资源。
Filecoin Slingshot计划是Web3社区团结起来保护和访问大型数据集的一个很好的例子。
因此,政府几乎不可能将这些数据发布给公众或研究界。
由于数据量非常庞大,近年来,联邦政府在该领域取得了重大进展。
学术机构通常会编译或生成数据集,其中许多成为公共资源,例如Berkeley DeepDrive数据,这个数据集包含超过十万段驾驶视频,海量真实街景等。
——————————
详细内容:
他和团队的工作主要是将公共和私人服务聚集在一起,以开发AI模型计划、推动政策并促进投资,同样,他们还会对服务不足的社区进行特别关注。
接下来,我们一起了解一下去中心化存储AI数据集的相关知识。
可以简单了解一下这两个公开可用的数据集:它们分别为ImageNet及The Pile,前者有1400万张图像和共计150GB的数据集大小,可用于创建通用图像识别系统;The Pile则是一个大小为825G的语言示例集,可用于制作通用自然语言处理系统。
它们通常如何存储在当今的网络上?
因此,政府几乎不可能将这些数据发布给公众或研究界。
由于数据量非常庞大,近年来,联邦政府在该领域取得了重大进展。
纽约市将有关人口统计、空气质量和法律通知的公开数据上传到Filecoin网络
团队越鼓励维护,并负责任地公开AI数据集,其效果就越好——尤其是现在模型和数据集的数量正在加速增长的现在。
先前: