其他

谷歌开放图像数据集并行下载工具,5 天速度最高超过 200 M

2016-12-05 新智元

 新智元编译

来源:Github

译者:刘小芹

新智元启动新一轮大招聘:COO、执行总编、主编、高级编译、主笔、运营总监、客户经理、咨询总监、行政助理等 9 大岗位全面开放。 

简历投递:jobs@aiera.com.cn

HR 微信:13552313024

新智元为COO和执行总编提供最高超百万的年薪激励;为骨干员工提供最完整的培训体系、高于业界平均水平的工资和奖金。

加盟新智元,与人工智能业界领袖携手改变世界。


谷歌开放图像数据集并行下载工具可用于并行下载并缩放谷歌的开放图像数据集(Open Data Image)的 py2/py3 脚本。


如图可见,它在5天里最高达到200Mpbs以上的速率。




谷歌的开放图像数据集(Open Data Image)是一个含有约 900 万个图像URL的数据集,所有数据都经过标记,被分为超过6000个类别。访问地址:https://github.com/openimages/dataset


  1. 新发布的预训练 Inception v3模型 

  2. BigQuery 新 OpenImages 标记

  3. tzatter 非新预训Inception v3模型发布。

  4. BigQuery上的新OpenImages注释


所有标签均由 Google Inc.根据 CC BY 4.0 许可证书授予许可。这个库里的内容使用 Apache 2许可证发布。


设置


安装依赖项,运行:




按照 open image data repo 文件的指南得到图像 url 列表。


用法


两个要求参数是 input 和 output。input 是开放图像数据集的 url 的 csv 文件,output 是缩放后的图像的保存目录。


默认设置下,图像会以 256 的最小维度缩放(由 min-dim 参数控制)。为了提高效率,保存的图像会放在子目录中(数量由 sub-dirs 参数控制)。已保存图像的名称对应 Google 数据集的 ImageID,可用于在开放图像数据集中查找标签。


使用 --help 可以查看其他可选参数。





新智元招聘


职位  运营总监


职位年薪:36- 50万(工资+奖金)

工作地点:北京-海淀区

所属部门:运营部

汇报对象:COO

下属人数:2人

年龄要求:25 岁 至 35 岁

性别要求:不限

工作年限:3 年以上

语  言:英语6级(海外留学背景优先)


职位描述


  1. 负责大型会展赞助商及参展商拓展、挖掘潜在客户等工作,人工智能及机器人产业方向

  2. 擅长开拓市场,并与潜在客户建立良好的人际关系

  3. 深度了解人工智能及机器人产业及相关市场状况,随时掌握市场动态 

  4. 主动协调部门之间项目合作,组织好跨部门间的合作,具备良好的影响力

  5. 带领团队完成营业额目标,并监控管理项目状况

  6. 负责公司平台运营方面的战略计划、合作计划的制定与实施


岗位要求


  1. 大学本科以上学历,硕士优先,要求有较高英语沟通能力

  2. 3年以上商务拓展经验,有团队管理经验,熟悉商务部门整体管理工作

  3. 对传统全案公关、传统整合传播整体方案、策略性整体方案有深邃见解

  4. 具有敏锐的市场洞察力和精确的客户分析能力、较强的团队统筹管理能力

  5. 具备优秀的时间管理、抗压能力和多任务规划统筹执行能力

  6. 有广泛的TMT领域人脉资源、有甲方市场部工作经验优先考虑

  7. 有媒体广告部、市场部,top20公关公司市场拓展部经验者优先


新智元欢迎有志之士前来面试,更多招聘岗位请访问新智元公众号。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存