10月机器学习开源项目Top10
参加 2018 AI开发者大会,请点击 ↑↑↑
作者 | Mybridge
译者 | 林春眄
整理 | Jane
出品 | AI科技大本营
【导读】过去一个月里,我们对近 250 个机器学习开源项目进行了排名,并挑选出热度前 10 的项目。这份清单的平均 github star 数量高达 1345,涵盖了包括深度学习, Tensorflow, 图像分割, 漫画着色, 强化学习,Unity 等主题,希望你能从中找到一个你所感兴趣的项目深入探究。
▌Top 1 :fastai
fastai 库由 fast.ai 研究团队贡献,使用当前最佳的实践研究简化了快速准确的神经网络训练。你可以在 fastai 官网找到并使用它。fastai 库是基于 fast.ai 团队进行的深度学习最佳实践研究,包括对视觉,文本,表格和协作(协同过滤)模型的支持,方便研究者直接使用。你可以在示例文件夹中找到有关示例,也可以参阅完整的文档以便了解更详细的使用说明。
Github 地址:
https://github.com/fastai/fastai?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
官网:
https://docs.fast.ai/
▌Top 2:Deepvariant
Deepvariant 是由 Google 研究团队贡献的开源项目,通过运用深度神经网络来从下一代 DNA 序列数据中预测遗传变异。它是基于 Python/C++ 的程序,尚且只支持 Python 2.7,并能够在任何 unix 操作系统上运行。Deepvariant 具有高精度,强鲁棒性,快速高效,灵活性强,易于使用等优点。
Github 地址:
https://github.com/google/deepvariant?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
▌Top 3:Albumentations
Albumentations 是一个快速的图像增强库,它易于使用并封装了其他一些图像处理库的功能。此外,它还具有如下特点:
基于高度优化的 opencv 的快速扩充
具有超级简单但功能强大的使用界面,并广泛适用于不用的任务,如分割,检测等
易于定制
易于添加其他的框架,兼容性好
Github 地址:
https://github.com/albu/albumentations?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
▌Top 4:MangaCraft
MangaCraft 是当前最佳的半自动化漫画着色项目。
Github 地址:
https://github.com/lllyasviel/MangaCraft?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
参考视频:
https://www.bilibili.com/video/av32698923/
▌Top 5:Holodeck
Holodeck 是用于强化学习和机器人研究的模拟器,它具有高保真性。你可以访问该项目所提供的用户使用手册,以便更加详细的了解整个过程。
Github 地址:
https://github.com/byu-pccl/holodeck?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
使用手册
https://holodeck.readthedocs.io/en/latest/
▌Top 6:Petastorm
Petastorm 是 Uber ATG 研发的一个开源数据访问库。它可直接从 Apache Parquet格式的数据集中进行单机或分布式训练,以及深度学习模型的评估。此外,Petastorm 还支持当前流行的基于 Python 的机器学习(ML)框架,如 Tensorflow,PyTorch 和PySpark,也可以通过纯 Python 代码来使用它。
Github 地址:
https://github.com/uber/petastorm?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
▌Top 7:Ngx
Ngx 是一个基于神经网络的视觉生成器和混合器,能够利用神经网络进行 VJing 过程。它将 pix2pix (使用 cGAN 的图像到图像转换)作为 ad-hoc 的下一帧预测模型,使用从视频剪辑中提取的成对连续帧数据进行反复地训练,以便模型能够生成无限持续时间的图像序列。此外,它还能够混合(交叉淡化) 两个 pix2pix 模型,这些模型会产生变化,并转换为生成的视频。
Gituhub 地址:
https://github.com/keijiro/Ngx?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
▌Top 8:AlphaAI
AlphaAI 是一个使用无监督和监督学习进行股票预测的开源项目,通过堆叠神经网络的实现来预测股票的盈利值。它包含多个训练组件,使用者可以通过调整替换各种组件组成以便模型获得最佳的预测结果。
Gituhub 地址:
https://github.com/VivekPa/AlphaAI?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
▌Top 9:Blueoil
Blueoil 是一个将深度学习应用于小型设备的开源项目。它能够训练一个神经网络,并将训练好的模型转化为可执行的二进制库,以便通过 FPGA 进行加速。
Gituhub 地址:
https://github.com/blue-oil/blueoil?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
▌Top 10:Tencent-ml-images
Tencent-ml-images 是包含当前最大的多标签图像数据库(ml-images) 的开源项目,共由 11166 个图像类别,17609752 张训练图像和 88739 哥验证数据的URL 地址组成。此外,通过迁移学习,将ml-images 上预训练好的ResNet-101 模型迁移到 ImageNet 数据库上,能够实现 80.73% 的 Top1 精度。
Gituhub 地址:
https://github.com/Tencent/tencent-ml-images?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
--【完】--
2018 AI开发者大会
AI技术年度盛会即将开启!11月8-9日,来自Google、Amazon、微软、Facebook、LinkedIn、阿里巴巴、百度、腾讯、美团、京东、小米、字节跳动、滴滴、商汤、旷视、思必驰、第四范式、云知声等企业的技术大咖将带来工业界AI应用的最新思维。
如果你是某个AI技术领域的专业人才,或想寻求将AI技术整合至传统企业业务当中,扫码填写大会注册信息表,我们将从中挑选出20名相关性最高的幸运读者,送出单场分论坛入场券。大会嘉宾阵容和议题,请查看文末海报。
此外,如果你想与所有参会大牛充分交流沟通,点击阅读原文购票,使用优惠码:AI2018-DBY 购买两日通票,立减999元;此外大会还推出了1024定制票,主会+分会自由组合,精彩随心。
推荐阅读
Google最强模型BERT出炉,NLP还有哪些值得期待的发展?
宇宙第一 IDE Visual Studio 支持 Java 了!
点击「阅读原文」,查看大会更多详情。2018 AI开发者大会——摆脱焦虑,拥抱技术前沿。