Quantcast

袁伟时:中国的奴性和戾气从哪里来?

“芯片大学”虚晃一枪,人才断层问题不能跑步解决

两大中国首富双双被重挫-释放信号强烈

民间帝王赖小民和性感女星舒淇与许晴

深度解读 | 姜文《让子弹飞》

Facebook Twitter RSS

分享到微信朋友圈

点击图标下载本文截图到手机
即可分享到朋友圈。如何使用?

自由微信安卓APP发布,立即下载!

AI研习社

多目标追踪器:用OpenCV实现多目标追踪(C++/Python)

所以,为什么不在第一次检测后无限期地跟踪这个对象呢?一个追踪算法有时可能会丢掉它所追踪的目标的轨迹。例如,当目标的移动太大,一个追踪算法可能不能保持一直追踪。所以现实中许多应用将检测和追踪一起使用。
2018年10月22日

少数内测名额开放|一个为AI爱好者而生的社区诞生!

你在社区的每一个赞,每一个回答,每一个提问,每一次翻译都能够为你获得相应的积分。你可以使用这些积分,在社区上获取更多有价值的内容,或者直接兑换实际奖励。
2018年7月23日

CV 届的金鸡百花奖:盘点我心中的 CVPR 2018 创意 TOP10

来自动美化照片。最酷的部分是它是弱监督的,你不需要输入-输出图像对!你训练的网络需要的是一组“好看”的图像(对于输出的标注图像)和一组你想要增强的“难看”的图像(对于输入图像)。然后,对
2018年7月15日

云从、百度同台!中国首届生物特征识别大赛开幕!

70后进入大学校园使用的通讯设备为BP机和大哥大,课堂上使用大黑板和录音机。80后上大学进入一个新世纪、新时代,娱乐工具有了MP3、MP4,学习工具有了笔记本电脑,课堂也有传统的大黑板变成了投影仪。
2018年6月6日

科大讯飞李伟:人机交互如何选择合适的「耳朵」

李伟,科大讯飞产品经理,负责麦克风阵列和智能家电领域的语音交互解决方案,曾就职于惠而浦(中国)股份有限公司先后担任软件工程师和智能家电产品经理,重庆邮电大学生物信息学学士,重庆邮电大学软件工程硕士。
2018年5月31日
2018年5月31日

用中文传话游戏理解 RNN

https://medium.com/learn-love-ai/introduction-to-recurrent-neural-networks-rnns-43238d037a5c
2018年5月31日

深度学习的可解释性研究(一):让模型「说人话」

基于规则的方法比如我们提到的非常经典的决策树模型。这类模型中任何的一个决策都可以对应到一个逻辑规则表示。但当规则表示过多或者原始的特征本身就不是特别好解释的时候,基于规则的方法有时候也不太适用。
2018年5月31日

CS224d 更新 | 第三讲 高级词向量表示

作业3:在本作业中,您将学习关于命名实体识别和实现基线窗口模型以及循环神经网络模型。该任务还涵盖门控周期性单位,将其应用于简单的一维序列和命名实体识别。
2018年5月30日

中国程序员指南:支出多在房贷上,找对象,颜值排第一

相比整体受访者,受访程序员更为关注颜值、兴趣爱好和学历水平,但不太在乎对方的经济水平、家庭背景、工作性质、身高和户口。但是,值得注意的是,在这项调查结果中,程序员对颜值的期待依然排在第一位!
2018年5月30日

MIT 6.S094· 深度增强学习 | 学霸的课程笔记,我们都替你整理好了

但是,在这个案例中机器人的移动具有一定的不确定性,如图所示:机器人的每次移动具有随机性,向上移动的概率为80%,向左移动的概率为10%,向右移动的概率为10%。因而都需要采用非确定性的方法。
2018年5月30日

手把手教你训练 RNN

https://medium.com/learn-love-ai/step-by-step-walkthrough-of-rnn-training-part-ii-7141084d274b
2018年5月30日

Github 项目推荐 | SpaceX Falcon 9 Box2D 回收降落动作模拟器

有独立的包。作者在设计原型和训练模型时写了一些非结构化的脚本,所以库中有些未经测试的混乱代码,在此作者表示歉意。另外,一些训练好的模型存放在不同的目录下。
2018年5月29日

「2018 机器阅读理解技术竞赛」落下帷幕,看奇点机智如何从 800 多支队伍中杀出重围

研习社表示,比赛数据集都是用户的真实问答,有些问题在百度搜索里没有答案,而且问题不一定很直接。比如「响一声就说正在通话中」,这表面上并不是一个问题,用户描述了一个现象,这种问题回答起来更具挑战性。
2018年5月29日

抠图不再麻烦,Adobe 新算法让 P 图以假乱真

能学到像艺术风格这样的高级能力。本期论文使用专门的算法,确保本地数据迁移成功,为了适应抽象艺术和绘画类型的多样性,该算法根据绘画作品本身来调整迁移的参数。利用
2018年5月29日

OpenAI 发布完整版游戏强化学习研究平台 Gym Retro

在像沙罗曼蛇这样的游戏中(右图),角色可以通过射杀敌人得分,所以获得奖励和开始学习很容易。在这样的游戏中生存是基于你躲避敌人的能力,这对强化学习算法来说没有问题,因为强化学习算法可以逐帧地分析游戏。
2018年5月29日

数学来了 | 什么是向量,你心里难道没点数么

我们深知数学带给你的痛苦与无助,从即日起为大家送上这份《线性代数的本质》.avi,试图让你从跟数学战斗的1400万次战斗中,找到胜利的那一种结局。
2018年5月28日

如何测量 NLP 模型的性别偏见到底有多大?

模型可能产生的潜在问题,模型创建者和使用这些模型的从业者应该检查模型可能包含的不良偏差。我们已经展示了一些工具来揭示这些模型中特定形式的刻板印象偏差,但这当然不构成所有形式的偏差。即使是这里讨论的
2018年5月28日

谷歌的机器学习产品交互设计原则 —— 以人为中心

通过实操验证,让您的内容专家针对您希望您的人工智能生成的内容创建大量手工设计的示例组合。这些示例将为您提供一个数据收集路线图、一套用于开始训练模型的强大标签集,以及一个用于设计大规模标记协议的框架。
2018年5月28日

英伟达教你用深度学习做图像修复,确定不试一下?

应用合适的缩放系数去自适应不同的有效输入。在每个部分卷积运算之后,掩模被更新了。去掩模规则很简单,如果卷积运算可以使输出至少反应一个有效输入值,去掩模就是将那个位置的掩模去掉。这种运算表示为:
2018年5月27日

招募 | 咪咕文化招聘 AI 算法工程师和数据挖掘工程师

发至邮箱【zengbingyu@leiphone.com】或者【konglingshuang@leiphone.com】,我社帮你招人!
2018年5月27日

Kaggle 新赛:第二届 YouTube-8M 视频理解挑战赛

https://www.kaggle.com/juliaelliott/starter-kernel-yt8m-2018-sample-data
2018年5月27日

对谈清华大学邓志东:初创企业自动驾驶落地首选低速场景,巨头则应瞄准国外打 | CCF-GAIR 2018

现在基本上用的还是深度卷积神经网络算法,但我们也在做一些新的与知识推理相结合的算法,面向目标的检测、定位、分割和分类等问题,不仅使其具有强大的特征提取能力,同时还具有一定的推理能力和理解能力。
2018年5月26日

斯坦福发起医疗影像挑战赛,基于吴恩达团队 MURA 数据集

https://www.leiphone.com/news/201801/eqln3hVeq73WCDh3.html
2018年5月26日

nuTonomy 首席技术官:深度学习在自动驾驶领域的应用

Fridman,麻省理工学院研究员,致力于研究以人为中心的人工智能,主要研究深度学习在半自动驾驶环境下的应用,比如感知驾驶员状态、感知场景、运动控制和规划等等。
2018年5月26日

ICRA 2018 软体材料机器人挑战赛:浙大斩获超半数奖项

本赛事旨在展示新开发的软体机器人技术,包括新的传动装置、传感器和其它推动软体机器人发展的零件的技术。评委将会根据参赛作品的重要性、原创性、功能性呀以及文档的质量对它们进行评价。入围作品需要在
2018年5月25日

Github 项目推荐 | 半自动图像标记工具

在构建可以从任何场景检测物体的人工智能系统时,我们需要一个庞大的数据集来训练和测试模型,并发现模型的缺点。现有的图像注释工具能够提供一定的帮助,但是开发者仍要付出很大的努力。
2018年5月25日

图灵奖得主 Judea Pearl:机器学习是有局限的,AI 已经分化了

之间是一种确定关系。但是在数学范畴内却没有一门语言描述这样一个简单的事实:暴风雨的来临会导致温度计读数下降,而非其他。换句话说,数学领域还没有发展出一种非对称语言来描述我们对「X
2018年5月25日

机器翻译不可不知的 Seq2Seq 模型

Learning》,提出了完全使用CNN来构成Seq2Seq模型,用于机器翻译,超越了谷歌创造的基于LSTM机器翻译的效果。此网络获得暂时性胜利的重要原因在于采用了很多的窍门,这些技巧值得学习:
2018年5月25日

MXNet 宣布支持 Keras 2,可更加方便快捷地实现 CNN 及 RNN 分布式训练

https://github.com/awslabs/keras-apache-mxnet/blob/master/docs/mxnet_backend/multi_gpu_training.md
2018年5月24日

斯坦福大学提出自监督人脸模型:250Hz 单眼可重建

形态模型正则化的优点和经验纠正空间的外部泛化相结合。能够更好地推广到现实世界的人脸建模中,同时运行频率超过
2018年5月24日

Github 项目推荐 | 一个简单的英文字形转音素的 Python 模块

该功能在语音合成中是必不可少的。不像德语和西班牙语这类语言,英文的发音很难从拼写中推断出来,所以人们要知道某个单词的发音,最好的方式是查阅字典。但是,这种方法至少有两个问题。
2018年5月24日

谷歌的机器学习规则 (Rules of Machine Learning): 关于机器学习工程的最佳实践

如果您有一百万个样本,则使用正则化和特征选择(可能)使文档特征列和查询特征列相交。这样一来,您将获得数百万个特征;但如果使用正则化,则您获得的特征会有所减少。您会有千万个样本,可能会产生十万个特征。
2018年5月24日

CS224d 更新 | 第二讲 词向量表示 word2vec

作业3:在本作业中,您将学习关于命名实体识别和实现基线窗口模型以及循环神经网络模型。该任务还涵盖门控周期性单位,将其应用于简单的一维序列和命名实体识别。
2018年5月23日

遍地都是百万年薪机器学习专家?真的假的?

万刀。这位的背景怎么样呢?他是世界上五位最著名的机器学习研究人员之一,他发明了生成式对抗网络(GAN)并撰写了最受欢迎的深度学习教科书,也并没有拿到百万年薪。现在你们还觉得「个个都是人赢」吗?
2018年5月23日

Github 项目推荐 | 用 PyTorch 实现 OpenNMT

https://raw.githubusercontent.com/moses-smt/mosesdecoder/master/scripts/generic/multi-bleu.perl
2018年5月23日

放弃深度学习?我承认是因为线性代数

的更多文档请点击此处(https://pytorch.org/tutorials/beginner/deep_learning_60min_blitz.html)。
2018年5月23日

Python Matplotlib 绘图使用指南 (附代码)

https://s3.amazonaws.com/assets.datacamp.com/blog_assets/Python_Matplotlib_Cheat_Sheet.pdf
2018年5月22日

公开课 | 浅谈双麦克风阵列及行业应用

李伟,科大讯飞产品经理,负责麦克风阵列和智能家电领域的语音交互解决方案,曾就职于惠而浦(中国)股份有限公司先后担任软件工程师和智能家电产品经理,重庆邮电大学生物信息学学士,重庆邮电大学软件工程硕士。
2018年5月22日

MIT 6.S094· 自动驾驶 | 学霸的课程笔记,我们都替你整理好了

”蜥蜴-猫头鹰效应“:蜥蜴(大部分)的眼睛比头动得更多,而猫头鹰(小部分)头比眼睛动得更多。
2018年5月22日

ICRA 2018 前瞻,五大机器人赛事抢先看

本赛事旨在展示新开发的软体机器人技术,包括新的传动装置、传感器和其它推动软体机器人发展的零件的技术。评委将会根据参赛作品的重要性、原创性、功能性呀以及文档的质量对它们进行评价。入围作品需要在
2018年5月22日

谷歌 Open Images Challenge 2018 大赛正在进行中,为你送上更多信息

个对象类,将能够更精确地评估不同检测器在哪种情况下工作得最好。另外,这个数据集中包含许多带有注释的对象,我们可以用来进行视觉关系检测,这是一个热度日益增长的话题,社群也在逐渐壮大。
2018年5月21日

干货 |「论文笔记」用于在线视频理解的高效卷积网络

相结合的一篇精彩的工作。优秀的效果同时也离不开没有写出来的大量网络设计方面的工作(从网络结构看,参数量和计算量应该都比较小,不是很深的网络)。文章的写作和绘图等方面也蛮值得自己学习。
2018年5月21日

历经五次迭代,看饿了么方舟智能调度系统如何指挥 300 万骑手

当骑手遇到暴雨、下雪等极端天气时,由于天气与路况问题,骑手的行驶速度会变慢,这时候系统会分配给骑手更多的送餐时间,确保骑手不会因为担心送餐迟到而超速,降低骑手产生交通安全事故的概率。
2018年5月21日

如何从系统层面优化深度学习计算?

深度学习在近几年里取得了巨大的进步,它已经或者是有望成功地被应用在我们许多生活场景中,比如自动驾驶、安防、翻译、医疗等等。可以说,计算机的计算和通信能力的大幅提升是促使深度学习成功的重要因素。
2018年5月20日

招募 | KikaTech 招聘大量 AI 开发职位,用 AI 技术变革沟通与交互

深入理解Hadoop系统中MapReduce、Hive、Spark原理,有实际开发使用MapReduce、Hive、Spark相关经验,具备丰富的性能调优经验;
2018年5月20日

人脑的前额皮质里藏了一个强化学习系统,DeepMind 如是说

重要的是,大多数学习都产生在递归网络中,这为他们的看法提供了有力支撑,即多巴胺在元学习过程中扮演着超越以往认知的更加重要的角色。多巴胺可以通过加强前额系统中的突触联系来增强特定的行为。在
2018年5月20日

图灵奖得主 Joseph Sifakis:将模型检测从学术应用至产业界的功臣 | CCF-GAIR 2018

模型检测不同于步步按照公理系统进行证明和推论的定理证明,它依赖的是对程序行为空间的穷尽搜索,也就是自动化遍历。另外,我们还需验证模型是否满足给定的形式化规约(Formal
2018年5月19日

字节跳动举办 AI 实践训练营,报名已正式启动 | AI 影响因子

Smola、南京大学计算机科学与技术系主任教授周志华及北京大学计算机科学技术研究所教授万小军等人。理论知识分享涵盖机器学习和系统、深度学习、机器学习算法、计算机视觉、自然语言处理等多个方向。
2018年5月19日

数学来了 | 一口气吸完,线性代数的本质

我们深知数学带给你的痛苦与无助,从即日起为大家送上这份《线性代数的本质》.avi,试图让你从跟数学战斗的1400万次战斗中,找到胜利的那一种结局。
2018年5月19日

Waymo 技术总监 Sacha Arnoud :自动驾驶机器学习的兴起

Fridman,麻省理工学院研究员,致力于研究以人为中心的人工智能,主要研究深度学习在半自动驾驶环境下的应用,比如感知驾驶员状态、感知场景、运动控制和规划等等。
2018年5月18日

如何在 15 个月内占领 Kaggle 榜首?bestfitting 经验大放送

2)现在如果只使用多个弱模型的集成是很难去赢得比赛的。如果你想成为第一名,通常需要有非常好的单一模型。当我想在比赛中获得第一名的时候,我经常强迫自己设计不同的模型,这些模型可以在公共排行榜上取得前
2018年5月18日

Github 项目推荐 | 100+ Chinese Word Vectors 上百种预训练中文词向量

该项目提供了不同表征(密集和稀疏)上下文特征(单词,ngram,字符等)和语料库训练的中文单词向量。开发者可以轻松获得具有不同属性的预先训练的向量,并将它们用于下游任务。
2018年5月18日

想在手机上用自己的 ML 模型?谷歌模型压缩包你满意

通过移除那些对预测没有太大作用的的权重或者运算(比如低分权重)来修剪,降低模型尺寸。该操作尤其能使包含稀疏输入或输出的移动端模型的效率得到相当大的提升,虽然模型在尺寸上被压缩小
2018年5月18日

基于 Doc2vec 训练句子向量

预测新的句子,这里根据经验,alpha(学习步长)设置小一些,迭代次数设置大一些。找到训练样本中与这个句子最相近的10个句子。可以看到训练出来的结果与测试的新句子是有关联的。
2018年5月17日
2018年5月17日

Kaggler 看过来,CVPR 2018 Workshop 植物识别赛来袭

这次竞赛中,每一张图片都有一个基于事实的标签。被评估的算法将会产生每个图像的标签,然后对算法进行评估。如果预测标签与事实标签相同,那么这张图像的错误是
2018年5月17日

CCF-GAIR 2018「企业之夜」,专属定制晚宴虚位以待

以三界中的工业界需求为例,随着人工智能行业落地潮流的进一步推进,市场对企业给其输出对口产品和服务的需求越来越明晰,间接牵动着企业对各个细分领域的学术人才越来越重视,但全国每年区区几百的
2018年5月17日

Github 项目推荐 | 用 PyTorch 实现全局/局部一致图像补全

False,这个泊松融合脚本是从这个(https://github.com/parosky/poissonblending)库分出的。
2018年5月16日

测量神经网络真的难吗?Uber 说未必

过去十年来,神经网络彻底改变了机器学习。机器学习从一个相对晦涩的学术研究领域崛起成为工业支柱,在大量数据可用的地方为众多应用提供支持。Uber
2018年5月16日

旷视发布基准数据集 CrowdHuman,用于人群中的人类检测

https://scholar.google.com/citations?user=yuB-cfoAAAAJ
2018年5月16日

NLP 领域的 C 位课程!斯坦福 CS224d 中英字幕版重磅上线

作业3:在本作业中,您将学习关于命名实体识别和实现基线窗口模型以及循环神经网络模型。该任务还涵盖门控周期性单位,将其应用于简单的一维序列和命名实体识别。
2018年5月16日

ASC18 世界超算总决赛清华卫冕,「黑马」上科大摘得亚军及 AI 奖项

的支撑技术。该赛题针对网上提出的问题进行回答,回答是否精准是衡量指标,这就需要计算机准确理解问题的内涵。这一次我们取得了很好的成绩。这三个方面给了我很深的印象。
2018年5月15日

公开课 | 自然语言处理(NLP)应用和前沿技术回顾

等各大公司投入巨额资金和高端人力努力争夺的下一个互联网流量入口(智能助手、智能音箱等)。本次分享将介绍自然语言处理技术的一些基本知识、行业的发展现状和基于深度学习的通用的
2018年5月15日

英伟达发布新算法,可以重建缺失像素

在训练阶段,将空白或缺失部分引入上述数据集完整的训练集中,使神经网络能够学习复原缺失的像素。在测试阶段,将与训练阶段不同形状的马赛克图案应用于测试集的图像中,从而提高复原精度的范化能力。
2018年5月15日

Github 项目推荐 | 用 TensorFlow 实现基于 GAN 的极限图像压缩框架

https://github.com/Justin-Tan/generative-compression.git$
2018年5月15日

「我的第一次数据科学家实习经历」

我喜欢数据科学的一件事是你必须对你自己诚实。当你不知道你还不知道什么的时候,你就会开始觉得数据预处理已经足够干净,并准备把它用在你的模型上,此时就存在着用错误数据试图建立正确模型的风险。
2018年5月14日

直播 | Python+AI:Python 学习者的人工智能入门课

但在高需求的背后,人工智能的高门槛也成功“劝退”了许多初学者,收集一大堆的干货资料却不知如何看起,枯燥的代码推敲与复杂的数学模型让人望而生畏,没有节奏的学习过程始终让人提不起兴趣。
2018年5月14日

如何用 Python 处理自然语言?(Spacy 与 Word Embedding)

embedding.shape(18900,)可以看到,所有的向量内容,都被放在了一个长串上面。这显然不符合我们的要求,我们将不同的单词对应的词向量,拆解到不同行上面去。
2018年5月14日

语义技术全线免费,人脸识别离线能力开放,百度为 AI 开发者带来福利

从去年起,百度相继宣布人脸识别接口、语音全系列接口免费政策,本次再度公布语义技术全线永久免费。至此,百度已经免费开放从感知到认知的最常用
2018年5月13日

MSRA 系统研究员陈程:MMdnn 如何让模型在不同深度学习框架间转换?

的设计思路,做了这样一个针对深度学习框架界的项目,来增强不同深度学习框架的互操作性。这是一套实验性的开源代码,希望更多人可以一起来完善这个工作,并基于此开发更多新的功能。
2018年5月12日

腾讯围棋 AI 技术 PhoenixGo 正式开源,源码、模型全公开

BensonDarr(昵称「金毛」)的名义在腾讯野狐围棋平台上和全球顶尖职业棋手、围棋爱好者及各路围棋
2018年5月12日

全球超算总决赛融入微软 NLP 赛题,高性能计算和 AI 如何携手前行?

正在越来越多地拥抱人工智能。人工智能需要高性能计算的支持,也需要超算的强大计算辅助。如今,有更多的学生因为人工智能领域开始接触到高性能计算,对于这门科学而言,无疑也是一件好事。
2018年5月11日

Build 大会中的 AI:微软 AI 云服务全线更新

CV、财务预测和文本分析专用工具。根据微软数据科学团队过去多年的数据和客户服务经验,他们为各个公司都会遇到、但通常这些公司会各自开发专用程序的需求设计了通用的解决方案。Azure
2018年5月9日

神经网络图灵机:深度学习中与内存进行交互的基本方法

w表示我们记忆中当前的焦点(注意力)。在内容寻址中,我们的关注点只基于是新的输入。然而,这不足以解释我们最近遇到的问题。例如,你的同班同学在一小时之前发信息给你,你应该可以很容易
2018年5月2日

谷歌发布最大图像标注数据集,190 万张图片开启公开图像挑战赛

个类别能够更精确地评估不同探测器在哪些方面表现的更好。此外,拥有大量带有多个对象标注的图像,可以帮组你探索视觉关系检测,这还是一个热门的新兴话题,而且具有越来越多的子社区。
2018年5月2日

百度 PaddlePaddle AI 大赛冠军林天威专访:如何准确识别综艺视频中的「精彩片段」?

公开数据集,通过训练学习视频帧的图片特征序列,输出实际可用的影视行业预测精彩片段时间戳的算法模型,进而对任意一个未被标注精彩片段的长视频,输出其中精彩片段的时间戳,从而减轻视频剪辑师的工作压力。
2018年4月29日

云从周翔:三年打磨,云从如何成为计算机视觉国家队

周翔:在行人识别上,我们创新性地提出全局+局部多粒度的识别理论。我们能通过人的形态、服装等去做整体判断,然后再通过一些细节,比如衣物商标、挎包类型、服饰特征去判断,即聚合同一个人在不同情况下的照片。
2018年4月28日

基于中文知识图谱和机器翻译技术,搜狗搜索正式上线海外权威健康信息

万中医经典方剂等健康大数据检索信息,搜狗打造了中文知识图谱,支持为用户呈现丰富且编排有序的搜索结果。此外,搜狗搜索还应用自主研发的机器翻译技术,对医疗健康相关内容的翻译准确率达到
2018年4月28日

独家 | 阿里搜索事业部产品负责人深入解析:技术如何驱动商业腾飞?

这就需要算法和技术能快速发现这些新的用户需求和新兴市场,一方面让对应的用户群体能接触到,激发他们的兴趣;另一方面也让供给端的卖家能够注意到这些市场的潜力,快速填补空白,带来创新市场的快速繁荣。
2018年4月27日

累计设计 10 亿次海报,阿里 AI 设计师「鲁班」核心技术详解

答:鲁班的设计取决于人类输入,输入水平决定了输出水平,我们有一个专门的团队来训练「鲁班」,目前它学完之后可以达到中级设计师水平,而想要达到高级水平,需要用到更大规模的数据,预计在今年下半年可以实现。
2018年4月23日

神经网络这么弱?改一个像素就懵圈了

如果这个过程实现的很好,最终正确类别的置信值将会变的很低,因为神经网路将能预测另一个类别,一旦发生这种情况,代表神经网络成功被欺骗了,这也意味我们需要查看神经网路,并获得其置信值。
2018年4月23日

开放 EasyDL 平台,多项技术免费,百度 AI 开放平台给开发者发了三大福利

第一,百度宣布开放「深度学习工程师评价标准(http://ai.baidu.com/paddlepaddle)」,提供了包括通用能力、专业知识、专业能力、行业知识、组织管理
2018年4月22日

7 个开发者应该知道的机器学习相关 Github 项目

Caffe64是一个简单,小巧但功能非常强大的神经网络库。我们都知道安装神经网络库有多繁琐。根据其开发人员的说法,Caffe64放弃了所有的繁琐工作,并且是“目前最容易编译和最轻量级的神经网络库”。
2018年4月21日

专访蓝光辉教授:在随机优化算法的世界里徜徉

回忆起当时博士研究的经历,蓝光辉教授认为,机器学习在当时还没有这么火的原因,主要在于缺乏有效的算法去求解。「以往的算法,需要将数据从头至尾跑一遍,反复多次才能得到一个有效的结果,」蓝光辉教授向
2018年4月21日

用机器学习搞艺术,谷歌 Megenta 项目集锦(附 Github)

API实现的一个交互demo。你可以使用它来生成鼓点的二维调色板,并通过latent空间绘制路径以创建不断变化的节拍。四个角可以手动编辑,替换为预设,或从latent空间采样以重新生成调色板。
2018年4月21日

我是这样从零开始用深度学习做狗脸识别 iOS App 的

Matthijs(http://machinethink.net/blog/googles-mobile-net-architecture-on-iphone/)。感谢!
2018年4月20日

有道云笔记是如何使用 TensorFlow Lite 的?

https://github.com/tensorflow/tensorflow/blob/master/tensorflow/docs_src/mobile/tflite/demo_ios.md
2018年4月20日

干货 | 教程、视频、数据集、论文、项目,深度学习入门资源汇总

https://www.youtube.com/watch?v=TrWqRMJZU8A&list=PLwY2GJhAPWRcZxxVFpNhhfivuW0kX15yG&index=2
2018年4月20日

MIT 6.S094 授权中译版 | 第二讲 自动驾驶

Fridman,麻省理工学院研究员,致力于研究以人为中心的人工智能,主要研究深度学习在半自动驾驶环境下的应用,比如感知驾驶员状态、感知场景、运动控制和规划等等。
2018年4月20日

从聚合-转移框架浅谈卷积神经网络的架构设计

connection;同时表达式(2)即是中间featureX的表达。在得到表达式(1)和表达式(2)后,可将表达式(1)不断地循环地带入表达式(2)中,最后可以得到一个非常有意思的表达式。
2018年4月19日

【AI 求职季×商汤科技】人工智能的系统工程与系统工程中的人工智能应用

)是国内领先的IT专业图书社区,致力于优质学习内容的出版和分享,为读者提供优质学习内容,为读者和作者提供在线交流的平台。
2018年4月19日

Github 项目推荐 | 在 Spark 上实现 TensorFlow 的库 —— Sparkflow

spark_model]).fit(df)p.write().overwrite().save("location")
2018年4月19日

数据科学进阶之路:了解数据科学工作,管理数据科学家团队

当然我们不可能让队伍中每一位产品经理和团队中每一位数据科学家建立一条宽信道——这样不便于扩展。而这正是你作为数据科学家经理的职责,你需要负责确定哪些宽信道是需要建立的,一旦完成建立,你就可以离开了。
2018年4月19日

想去 Google AI 工作?请收下这 20 道面试题

https://medium.com/acing-ai/google-ai-interview-questions-acing-the-ai-interview-1791ad7dc3ae
2018年4月18日

【AI 求职季×阿里巴巴】阿里资深算法大牛的求职分享

领导的团队先后在各种机器翻译评测中取得优异成绩,比如获得了2017年WMT俄语到英语第一名,NIST2012机器翻译中文到英文第一名,2007和2005年IWSLT口语机器翻译比赛第一名等等。
2018年4月18日

京东转型技术公司次年,公开NeuHub AI 开放平台

该实验室将聚焦于深度学习、自然语言处理、语音识别和相关领域的基础研究和技术创新,并将其最新研究成果应用于京东零售、物流、金融、云计算等领域,通过技术平台和基础设施对京东及合作伙伴赋能。
2018年4月18日

LightGBM 大战 XGBoost,谁将夺得桂冠?

本节介绍如何在各种操作系统下安装LightGBM。众所周知,桌面系统目前使用最多的就是Windows、Linux和macOS,因此,就依次介绍如何在这三种操作系统下安装LightGBM。
2018年4月18日

Github 项目推荐 | 开源机器学习服务器 —— PredictionIO

http://predictionio.apache.org/community/projects/#docker-installation-for-predictionio
2018年4月17日

公开课 | CS231n 课后作业第三讲 : Assignment 3

是斯坦福大学开设的计算机视觉与深度学习的入门课程,授课内容在国内外颇受好评。但是只听课不做作业效果是要折半的,因此,让我们一起认认真真地完成这门课程的
2018年4月17日

【AI 求职季×云从科技】人脸识别技术简介与人工智能发展之路探索

)是国内领先的IT专业图书社区,致力于优质学习内容的出版和分享,为读者提供优质学习内容,为读者和作者提供在线交流的平台。
2018年4月17日

「全球最大同性交友平台」Github 十岁了,十年大事记一览

会取得今天的规模和成就,会有这么多的项目,有的项目已经成型,有的还在初期阶段,有的甚至有着庞大的规模和架构。除此之外,我们也未曾料想商业机构会像今天这样青睐开源社区,也没想过
2018年4月17日

用 TensorFlow 实现物体检测的像素级分类

的两个输出的基础上,添加一个掩码的输出,该掩码是一个表示对象在边框中像素的二元掩码。但是这个新添加的掩码输出与原来的分类和边框输出不同,它需要物体更加精细的空间布局和位置信息。因此,Mask
2018年4月16日

【AI 求职季×思必驰】人工智能需要科学家,也需要普通人

龙梦竹连续三年代表思必驰受邀出席“乌镇•世界互联网大会”并分享中国语音技术发展及应用现状,多次受邀参与T圈、创业邦、网易、机器之心等主办的专业论坛并做分享。
2018年4月16日

谷歌发布「与书对话」AI 工具,从字里行间邂逅心仪书籍

vectors)的发展,这一技术使算法能根据实际语言使用的例子来学习单词之间的关系。这些向量模型根据概念和语言的等价性、相似性或关联性,将语义相似的词或短语投影到临近点。
2018年4月16日

机器学习小白看过来,带你全面了解分类器评价指标

https://github.com/Donges-Niklas/Classification-Basics/blob/master/Classification_Basics.ipynb
2018年4月16日

AI 求职季本周回顾:Momenta/图森/旷视/码隆邀你搭乘 offer 直通车

庄晨帆老师在直播过程中以《它山之石:AI攻城狮的精进术》为主题带来分享。她从海量数据到极少样本出发,分享了目前极少样本在深度学习带来的挑战与机遇,并且阐述了从海量数据迁移到极少样本的思路。
2018年4月15日

招募 | 依图科技招聘 AI 算法工程师,NLP/CV/DL 专家在哪里?

依图从事人工智能创新性研究,致力于将先进的人工智能技术与行业应用相结合,建设更加安全、健康、便利的世界。依图带着国际视野组建世界一流的研发团队,用坚实的技术力量推动产业发展。
2018年4月15日

嘀~正则表达式快速上手指南(下篇)

将标题从邮件内容中分离出来是非常复杂的任务,尤其当文中有很多不同形式的标题。在原始混乱的数据中是很难找到一致性的规律,但是幸运的是这个工作有人帮我们解决了——Python的email
2018年4月15日

TensorFlow 中文社区论坛 (测试版) 上线

(tensorflow.google.cn),进一步我们建立微信公众号,现在我们联合合作伙伴发布了中文社区论坛,为中国的开发者们提供一个进行
2018年4月14日

Github 项目推荐 | 「迁移学习简明手册」的 LaTex 源码

欢迎有兴趣的学者一起加入,让手册更完善!现阶段有2个branch:master用于开发和完善,V1.0是稳定的1.0版本。后续可根据进度增加更多的branch。
2018年4月14日

嘀~正则表达式快速上手指南(上篇)

r"来分割呢?我们之所以知道这一点,是因为在编写脚本之前查看了文件。我们没有必要仔细阅读数千电子邮件。只需要通过前几行来大致看看数据的结构是什么样子的。正因为如此,每个电子邮件前面都是字符串
2018年4月14日

来了!2018 MIT 6.S094 中文译版「深度学习和自动驾驶课」今日上线

主讲老师,如Waymo的Sacha老师,妥妥的产业界大牛,讲课基本上是按照个人实际经验来的,一些关于Waymo研发过程的展示很有意思。总体来说,课程很适合想了解自动驾驶以及想深入自动驾驶领域的同学。
2018年4月13日

【AI 求职季×码隆科技】它山之石:AI 攻城狮的精进术

)是国内领先的IT专业图书社区,致力于优质学习内容的出版和分享,为读者提供优质学习内容,为读者和作者提供在线交流的平台。
2018年4月13日

如何在集群中高效地部署和使用 AI 芯片?

团队深度学习平台负责人,曾就职于阿里巴巴技术保障事业部,担任算法工程师;清华大学微电子硕士,主要研究方向:面向可重构芯片的编译器后端优化,指令级并行,高并发编程模型以及分布式计算。
2018年4月13日

干货 | 视频、书籍、源码、项目,Tensorflow 纯干货学习资源汇总

(https://www.youtube.com/watchv=TrWqRMJZU8A&list=PLwY2GJhAPWRcZxxVFpNhhfivuW0kX15yG&index=2)
2018年4月13日

干货 | 二十五个深度学习相关公开数据集,炼丹爱好者必备!

这个数据集是图像分类的另一个神级入门数据集。它由10个类别60,000个图像组成(每个类在上图中表示为一行)。总共有50,000个训练图像和10,000个测试图像。数据集分为6个部分
2018年4月12日

【AI求职季×旷视科技】计算机视觉前沿与实践

旷视科技Face++研究院算法总监,清华大学交叉信息学院毕业,拥有6年的计算机视觉算法研究经验,主要研究方向是3D人脸和活体检测,其技术已经在多款手机的解锁、相机中得到应用。
2018年4月12日

Github 项目推荐 | PyTorch 文本工具库/数据集

(http://pytorchnlp.readthedocs.io/en/latest/source/torchnlp.word_to_vector.html)
2018年4月12日

看阿里 AliOS 神灯团队在推荐系统上的独门秘籍

研习社说道,从模型上对比他们与冠军的方案,神灯团队更占优势,但冠军在特征工程上做得比他们更加细致。他以日期为例,对于这一参数,他们会将其转化成一个数值来构造特征,但冠军还会把日期转化成
2018年4月12日

【AI 求职季×图森未来】图森未来自动驾驶技术的深度解析

)是国内领先的IT专业图书社区,致力于优质学习内容的出版和分享,为读者提供优质学习内容,为读者和作者提供在线交流的平台。
2018年4月11日

狗狗视角看世界,用视觉数据预测狗的行为

摄像头拍摄的这些视频,采样频率为5fps。该团队使用4个惯性测量单元(IMUs)来测量狗的四肢的位置,一个单元测尾巴位置,还有一个测躯干位置。这些设备可以用角向移动来记录运动。
2018年4月11日

Github 项目推荐 | 包含文本数据的免费 / 公共领域的 NLP 数据集

http://aws.amazon.com/de/datasets/apache-software-foundation-public-mail-archives/
2018年4月11日

终于!Supervise.ly 发布人像分割数据集啦(免费开源)

在训练之前,我们在物体边缘添加了小波段以平滑锯齿状边缘并执行多种增强:翻转,随机裁剪,随机角度旋转和颜色转换。正如您所看到的,即使您需要在图像上注释多个对象类,这种方法也适用于许多计算机视觉任务。
2018年4月11日

数据分析秘籍在这里:Kaggle 六大比赛最全面解析(下)

最上面一行包含每个特征向量的数据分布(沿着「方向」的直方图),第二行包含了我们在前面的图中已经看到的方差方向,第四行包含了树叶的中值图像,值得注意的是,这一行对于所有的特征向量是相同的。
2018年4月10日

快来操纵你的 GPU:CUDA 编程入门极简教程

kernel的这种线程组织结构天然适合vector,matrix等运算,如我们将利用上图2-dim结构实现两个矩阵的加法,每个线程负责处理每个位置的两个元素相加,代码如下所示。线程块大小为(16,
2018年4月10日

Github 项目推荐 | 农业知识图谱(KG):农业领域的信息检索,命名实体识别

1、将hudong_pedia.csv导入neo4j:开启neo4j,进入neo4j控制台。将hudong_pedia.csv放入neo4j安装目录下的/import目录。在控制台依次输入:
2018年4月10日

【AI 求职季×Momenta】打造自动驾驶大脑:看 Paper Reading直播,拿 Momenta 顶级 offer

)是国内领先的IT专业图书社区,致力于优质学习内容的出版和分享,为读者提供优质学习内容,为读者和作者提供在线交流的平台。
2018年4月10日

数据分析秘籍在这里:Kaggle 六大比赛最全面解析(上)

建立准确模型的关键是全面了解正在使用的数据,但数据通常是混乱的。在我自学机器学习的前几个月,对如何理解数据并没有很多的想法。我假设数据来自一个自底向上组织完好的包,或者至少有一组明确的步骤可以遵循。
2018年4月9日

招募 | Roadstar.ai 自动驾驶研发部招大量 AI 开发职位

我们的核心技术团队汇集了斯坦福大学、弗吉尼亚理工大学、清华大学、德州大学达拉斯分校、上海交通大学、香港理工大学、新加坡国立大学、台湾大学等世界名校人才的硕博士,以及来自
2018年4月9日

机器学习者必知的 5 种深度学习框架

正如你所看到的,我首先为数据和权重创建随机张量。然后我计算正向传播过程中的预测和损失,并在反向传播过程中手动计算梯度。我也为每个权重设置梯度下降步长。最后,我通过多次运行该功能来训练网络。
2018年4月9日
2018年4月9日

干货 | 论机器学习的可重复性危机

她会记录所有运行过程得到的权重和对应的评分,然后当她没有时间做更多实验的时候就从里面挑出一组作为最终的模型。这些权重可能来自任何一个跑出来的结果,甚至来自于和她现在手上跑着的代码非常不同的代码。
2018年4月8日

如何让训练神经网络不无聊?试试迁移学习和多任务学习

在迁移学习中,我们希望利用源任务学到的知识帮助学习目标任务。例如,一个训练好的图像分类网络能够被用于另一个图像相关的任务。再比如,一个网络在仿真环境学习的知识可以被迁移到真实环境的网络。
2018年4月8日

一文读懂机器学习需要哪些数学知识

1、微积分(求导,极限,极值)例如传统的BP神经网络的训练算法实际上是基于复合函数求导的链式法则,又比如目前多数的监督学习训练算法都基于极大似然估计,而极大似然估计的求解往往涉及求导,求极值的内容。
2018年4月8日

都说 AllenNLP 好用,我们跑一遍看看究竟多好用

LSTM单元解决了这个问题。它们是一种特殊的RNN,能够学习长期的依赖关系。我们将只使用LSTM单元,而不是构建它们,因此对于我们而言,可以将LSTM单元看作具有不同架构并能够学习长期依赖性的单元。
2018年4月7日

OpenAI 启动迁移学习比赛,一起来玩刺猬索尼克游戏吧

表示,强化学习的下一步是利用以往经验快速在新环境中学习。目前的算法很容易记忆,但不能很好地适应新的情况。虽然这次比赛的重点是电子游戏,但他们希望获胜的技术能适用于更广泛的领域。
2018年4月7日

CCF-GAIR 2018 将在 6 月底席卷鹏城,三大新玩法了解一下?

都面临一票难求的火爆境地,所谓事不过三,今年您还在犹豫和观望吗?就看您信不信得过我们啦。
2018年4月7日

福利 | AI 求职季启动:阿里、商汤等八大明星企业资深算法工程师亲授独门秘籍

SDK、互联网金融等对外产品的初始版本,完善并标准化公司内部开发者工具,发明数个智能视频领域专利技术;与香港中文大学实验室合作,在国际顶级会议(NIPS2014)发表基于
2018年4月6日

Github 项目推荐 | Scikit-learn(sklearn)官方文档中文版

Windows(https://github.com/apachecn/scikit-learn-doc-zh/blob/0.19.X/help/vscode-windows-usage.md)
2018年4月6日

用 Keras 搭建 GAN:图像去模糊中的应用(附代码)

https://blog.sicara.com/keras-generative-adversarial-networks-image-deblurring-45e3ab6977b5
2018年4月6日

分享 | 学完李飞飞斯坦福CS231n,我离算法工程师还有多远?

结果,发现连锅炉师傅和挖掘司机都闹着要转行做AI。这时你眉头一皱,发现事情并不简单,问自己:我一个普普通通的小白,转行进入AI行业有多难?我到底离算法工程师还有多远?
2018年4月5日

不知道如何开始机器学习?这有份初学者指南!

这份指南是为了那些对机器学习感兴趣,但不知如何开始的朋友们准备的。我想大多厌倦在网上搜索大量资料的人都会有挫败感,也放弃了有人能指引他们如何入门的希望。
2018年4月5日

Github 项目推荐 | TensorFlow 的模型分析工具 —— TFMA

里定义的指标以分布式方式评估大量数据的模型。这些指标也可以在不同的数据片里计算,其结果可以在
2018年4月5日
2018年4月4日

Google 大牛课程 | 有限玻尔兹曼机器:扩展 —— 谷歌大脑 Hugo 的神经网络课第 44 期

Bengio在蒙特利尔的博士生,专攻计算机视觉和自然语言处理领域的深度神经网络。现仍任教于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学,兼任客座教授。
2018年4月4日

学不学吴恩达 deeplearning.ai 课程,看完这篇你就知道了

而获取到很多的知识。首先也是最重要的是,你学到了关于神经网络的基本概念,在简单的序列模型中一个前向传播是如何进行的,以及什么是反向传播等等。我曾经多次看到过并且听说过神经网络的这些基本构建块。但是
2018年4月4日

Kaggle 冰山图像分类大赛近日落幕,看冠军团队方案有何亮点

答:大概十年前,我首次接触机器学习,那时我开始学习梯度提升树和随机森林相关知识并将其应用到分类问题中。近几年,我开始更广泛地关注深度学习和计算机视觉。不到一年前,我开始参加
2018年4月4日

Caffe2 代码并入 PyTorch,贾扬清表示开发效率将迎来极大提升

基础上的重构和升级,一方面集成了诸多新出现的算法和模型,另一方面在保证运算性能和可扩展性的基础上重点加强了框架在轻量级硬件平台的部署能力,利于让开发者在移动设备上部署
2018年4月3日

Github 项目推荐 | 面向 JS 开发者的机器学习框架 TensorFlow.js 以及相关示例

https://github.com/tensorflow/tfjs-examples/tree/master/webcam-transfer-learning
2018年4月3日

专访讯飞病灶分割比赛优胜团队,年内会将该算法投入实用

团队并没有这样做。「我们参加比赛的目的主要是验证已有算法的有效性,是否能达到比较好的效果。眼底的疾病,不论是糖尿病视网膜病变,还是其他一些相关疾病,都是通过对病灶进行分割、检测来做辅助诊断。」
2018年4月3日

AWS 上可用的公用数据集,任何人都可以免费访问

https://amazonaws-china.com/public-datasets/deutsche-boerse-pds/
2018年4月3日

免费 | 60 分钟带零基础小白快速了解区块链!

然而,除去一夜暴富,区块链技术背后还有哪些值得关注的东西?比特币为何被称为新型信用机制?从信息技术到互联网再到移动互联再到现在的区块链经济,人们又遗漏了哪一个最重要的板块.....
2018年4月2日

DeepMind 新研究:使用强化对抗学习合成图像程序

最重要的是,这个框架也是可以解释的,因为它产生了一系列控制模拟画笔的动作。这意味着该模型可以将其在模拟绘图程序中学到的知识应用到其他类似环境中的字符重建中,例如用在仿造的或真实的机械臂上。
2018年4月2日

Google 大牛课程 | 有限玻尔兹曼机器:对比发散 —— 谷歌大脑 Hugo 的神经网络课第 44 期

Bengio在蒙特利尔的博士生,专攻计算机视觉和自然语言处理领域的深度神经网络。现仍任教于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学,兼任客座教授。
2018年4月2日

Kaggle 恶意评论(toxic comment classification)分类 top 1 %方案

跨领域的增量式词向量。这也是我的本科毕设,如何解决把细分领域的词向量放入一个已经预训练好的向量空间中,保持其聚类性质,线性性质。对于这部分感兴趣的可以参考论文。扩展一下,如何再GloVe的840B
2018年4月2日

对我影响最深的 10 位科技大佬

TR35。Srinivasan博士拥有斯坦福大学电气工程学士,化学工程硕士和化学工程硕士学位。他还在斯坦福大学偶尔上课,其中包括2013年的在线MOOC课程,该课程达到全球250,000多名学生。
2018年4月1日

招募 | 深鉴科技大量 AI 开发职位等你来投

深鉴团队拥有国际性的学术影响力和资深的工业经验。得益于我们在深度学习图像与语音处理上取得的成果,深鉴将为更多行业提供前沿的人工智能解决方案。
2018年4月1日

TensorFlow 开发者峰会:推出 TensorFlow.js,支持 Swift,TF 将更易于使用

可加速各种机器学习模型,比如进行图像分类、目标检测、机器翻译、语音识别、语言建模等。您可以快速地从一些高质量的开源代码开始,因为这些代码经过持续地针对准确性和性能的测试,而且有丰富的文档。
2018年4月1日

分享 | 李飞飞斯坦福CS231n,原来学霸们都是这么学的

3月28日起,雷锋字幕组联合AI慕课学院推出3期以“斯坦福深度视觉识别课CS231n”为主题的Live实战分享课。(原创代码+论文解读+场景应用+实用套路)
2018年3月31日

Github 项目推荐 | 用 Numpy 实现简单的 GAN

https://github.com/shinseung428/gan_numpy
2018年3月31日

Google 和 Nvidia 强强联手,带来优化版 TensorFlow 1.7

https://github.com/tensorflow/tensorflow/tree/r1.7/tensorflow/contrib/tensorrt
2018年3月31日

专访美团点评 AI 技术团队负责人何仁清:全球规模最大的智能配送调度系统是如何建成的

A:美团快送就是使用社会共享运力进行配送的一种形式,现在每天已经达到近几百万单的水平。由于是使用兼职运力,对骑手直接管理能力偏弱,因此如何保证稳定运力,达到体验和成本的最佳平衡,都是亟需解决的问题。
2018年3月30日

CVPR VUHCS Workshop 征稿啦,附带 5 项极具吸引力的比赛

的举办初衷在于鼓励来自人物视觉理解领域及其他相关领域的专家、学者、老师、同学们展示他们的科研成果,共同探讨、交流、构思新想法、新方案,并由此推动和促进实际应用场景下的有关技术与系统的性能和实用价值。
2018年3月30日

Google 大牛课程 | 有限玻尔兹曼机器:例子 —— 谷歌大脑 Hugo 的神经网络课第 43 期

Bengio在蒙特利尔的博士生,专攻计算机视觉和自然语言处理领域的深度神经网络。现仍任教于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学,兼任客座教授。
2018年3月30日

公开课 | 如何在集群中高效地部署和使用 AI 芯片

团队深度学习平台负责人,曾就职于阿里巴巴技术保障事业部,担任算法工程师;清华大学微电子硕士,主要研究方向:面向可重构芯片的编译器后端优化,指令级并行,高并发编程模型以及分布式计算。
2018年3月30日

比 TensorFlow 云快 46 倍!IBM 用 Snap ML 和 Tesla V100 秀肌肉

也尝试了不同的建模技术,看看能否继续降低训练损失。不过各种好方法基本都会带来更长的训练时间。最终他选用了深度神经网络,训练时有
2018年3月29日

Google 大牛课程 | 有限玻尔兹曼机器:Persistent CD —— 谷歌大脑 Hugo 的神经网络课第 42 期

Bengio在蒙特利尔的博士生,专攻计算机视觉和自然语言处理领域的深度神经网络。现仍任教于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学,兼任客座教授。
2018年3月29日

Github 项目推荐 | IBM 的深度学习平台 FfDL

https://developer.ibm.com/code/2018/03/20/fabric-for-deep-learning/
2018年3月29日

一场深度学习引发的图像压缩革命

方向的转变并非一帆风顺。「我们当时考虑把传统方法里的思路与深度学习想结合。比如传统方法有周围像素预测,我们结合这种方法进行研究,但发现预测效果不好。之后我们还想到了传统方法里的
2018年3月29日

Google 大牛课程 | 有限玻尔兹曼机器:对比发散(参数升级) —— 谷歌大脑 Hugo 的神经网络课第 41 期

Bengio在蒙特利尔的博士生,专攻计算机视觉和自然语言处理领域的深度神经网络。现仍任教于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学,兼任客座教授。
2018年3月28日

LF 深度学习基金会成立,作为初创会员的腾讯贡献其首个开源项目「Angel」

KVM、Docker、NVDIMM、Ceph、HBase、Hadoop、linux、Spark、Kubernetes、Torrent、Dht、Goprocinfo、Flannel、Netlink
2018年3月28日

YOLO 升级到 v3 版,速度相比 RetinaNet 快 3.8 倍

做了一些更新,在设计上进行了一些小改动,让它变得更好。当然,我们也训练了这个新网络,它的性能非常优秀。它比前一版本要大一点,但更准确。当然了,不必担心会牺牲速度,它仍然很快。YOLOv3
2018年3月28日

阿里将 TVM 融入 TensorFlow,在 GPU 上实现全面提速

神经机器翻译(NMT)是一种端到端的自动翻译方法,可能克服传统的基于短语的翻译系统的缺点。最近,阿里巴巴集团正致力于在全球电子商务中部署
2018年3月27日

Google 大牛课程 | 有限玻尔兹曼机器:对比发散 —— 谷歌大脑 Hugo 的神经网络课第 40 期

Bengio在蒙特利尔的博士生,专攻计算机视觉和自然语言处理领域的深度神经网络。现仍任教于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学,兼任客座教授。
2018年3月27日
2018年3月27日

送票 | 刚刷完李飞飞斯坦福CS231n,我反手就是满屏原创代码

3月28日起,雷锋字幕组联合AI慕课学院将推出3期以“斯坦福深度视觉识别课CS231n”为主题的Live实战分享课。(原创代码+论文解读+场景应用+实用套路)
2018年3月27日

微软开源 repo 1.0 ,旨在创造深度学习框架通用语言

通过在不同的框架中完成端到端解决方案,可以以多种方式比较框架。由于每个框架中使用的都是相同的模型结构和数据,所以框架间的准确度非常相似。此外,我们开发的目的是使框架之间的对比更简单,而不是为了加速。
2018年3月26日

Google 大牛课程 | 有限玻尔兹曼机器:自由能量 —— 谷歌大脑 Hugo 的神经网络课第 39 期

Bengio在蒙特利尔的博士生,专攻计算机视觉和自然语言处理领域的深度神经网络。现仍任教于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学,兼任客座教授。
2018年3月26日

Facebook事件背后:AI 已经控制着我们,但它本应成为我们的助力

问题。那么你就可以开始为其中的人类行为建立一个优化闭环。一个强化学习闭环。在这个闭环里可以观察到目标的当前状态,然后持续改进给他们看到的信息,一直改进到他们开始表现出你想看到的观点和行为为止。
2018年3月26日

Github 项目推荐 | 用 JavaScript 实现的神经网络 —— brain.js

开发者可以看看这个链接,它解释了如何使用真实世界的数据集来训练一个简单的神经网络:如何使用Brain.js在浏览器中创建一个神经网络。https://scrimba.com/c/c36zkcb
2018年3月25日

招募 | 京东金融城市计算事业部、牧星智能机器人事业部,AI 开发岗招聘

发至邮箱【zengbingyu@leiphone.com】或者【konglingshuang@leiphone.com】,我社帮你招人!
2018年3月25日

用 Hinton 的胶囊神经网络来识别空间关系 Part1: CNNs及其缺点

但是它也有一些问题,例如不能识别空间关系,比如说图片或其他数据里不同部分之间的相对位置关系。Hinton最近提出的胶囊神经网络也许能帮助我们解决包括这一问题和其他问题。
2018年3月25日

华为发布人工智能开发平台「HiKey 970」,提供更强大的 AI 算力

970提供了完善的多应用模式、机器学习框架支持,拥有更加完善的文档、更丰富高效的API、更快速上手的源码,可以开发者们更直接地感受AI在端侧的巨大潜力。
2018年3月24日

免费 | 从文本匹配到图文匹配:所见所想所找 - 基于生成模型的多模态检索

基于“文本匹配”及NLP的相关话题,AI慕课学院邀请了来自新加坡南洋理工大学的玖强博士3月27日(周二,晚8:30)为大家带来一次主题分享!
2018年3月24日

Lucid Robotics 创始人:我是怎么启动AI创业项目的?

的炒作是有道理的。然而你需要确切地知道,其他机器学习模型是怎么工作的。在无法获取大量数据的情况下,你只能建立一个简单的预测模型。这种情况下,支持向量机,甚至一个简单的决策树,都比深度神经网络更有用。
2018年3月24日

机器学习各种熵:从入门到全面掌握

以上扯了一堆废话,其实目的就是希望大家知道:熵的物理意义非常重大,不仅仅是冰冷冷的公式,而是接近生活、接近自然的,更是从生活而来,从各种层面理解它都有助于我们理解熵、理解公式、理解整个世界!
2018年3月23日

Google 大牛课程 | 有限玻尔兹曼机器:推理 —— 谷歌大脑 Hugo 的神经网络课第 38 期

Bengio在蒙特利尔的博士生,专攻计算机视觉和自然语言处理领域的深度神经网络。现仍任教于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学,兼任客座教授。
2018年3月23日

Github 项目推荐 | 用于运行和训练深度神经网络的开源 C++ 库 —— nGraph

目前支持三种流行的深度学习框架(neon、MXNet、TensorFlow),对于其他的深度学习框架,开发者可以根据官方的引导指南来创建用于编译和运行训练模型的自定义桥接代码。
2018年3月23日

国内首次零样本学习算法大赛开启报名,零样本数据集免费下载

被用于图像合成,取得了以假乱真的效果。但传统图像合成仅能合成见过的类别的图像。零样本图像合成希望模型能够合成从未见过的类别的图像。目前已有一些算法通过条件
2018年3月23日

Github 项目推荐 | 无监督神经机器翻译 —— UNdreaMT

是一个开源的无监督神经机器翻译系统,该系统的具体实现方式在以下的论文里有详细地描述:
2018年3月22日

AI 挑战赛 | 基于百度 ApolloSpace 数据集的自动驾驶挑战赛

在这个任务中,参与者会有一组每个像素都标记好的视频序列,车辆和行人等移动对象同样标注好,该任务的目标是评估视频场景解析的技术水平。
2018年3月22日

多图见证模拟机器人的逆天成长:论进化策略在强化学习中的应用

小时的速度驾驶汽车,并且还要保证不把杯子里的水洒出来,这会使得司机成为一个更好的非法街头赛车手。我们还可以训练智能代理去执行多项任务,以使得它们学习到更加稳定的策略。
2018年3月22日

Google 大牛课程 | 有限玻尔兹曼机器 :定义 —— 谷歌大脑 Hugo 的神经网络课第 37 期

Bengio在蒙特利尔的博士生,专攻计算机视觉和自然语言处理领域的深度神经网络。现仍任教于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学,兼任客座教授。
2018年3月22日

加速 AI 2.0,ARC 推理挑战赛等你来战!

问题集分成挑战集和简易集,挑战集只包含基于检索算法和单词共现算法出现的回答不正确的问题。该数据集仅包含问题(用于人类测试),也是该领域目前最大的公开数据集(共
2018年3月21日

经典课程 | 训练 CRFs :Pseudolikelihood —— 谷歌大脑 Hugo 的神经网络课第 36 期

Bengio在蒙特利尔的博士生,专攻计算机视觉和自然语言处理领域的深度神经网络。现仍任教于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学,兼任客座教授。
2018年3月21日
2018年3月21日

用 CNN 分 100,000 类图像

CUHK-PEDES,因为同一个人的描述都差不多。我们用的是同一个人看作一个类,所以每一类训练图片多一些。CUHK-PEDES
2018年3月21日

手把手教你用 R 语言分析歌词

在本教程中,该系列的第一部分,你将会使用整洁文本框架在一组歌词上使用文本挖掘技术。整洁数据集有一种特定的结构,其中每个变量是一列,每个观察是一行,每个观察单元是一个表。在清理和调整数据集之后,在观察
2018年3月20日

Github 项目推荐 | 给黑客使用的机器学习引擎 —— Juice

上也能够运行。它可以成为构建高性能机器学习智能应用的核心,使独立模块的发布更加容易,比如深度的增强学习、可视化和监控,网络分配,自动化预处理或可扩展的生产部署等。
2018年3月20日

经典课程 | 训练 CRFs :常规条件随机场 —— 谷歌大脑 Hugo 的神经网络课第 35 期

Bengio在蒙特利尔的博士生,专攻计算机视觉和自然语言处理领域的深度神经网络。现仍任教于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学,兼任客座教授。
2018年3月20日

Google 大牛课程 | 训练 CRFs :隐藏马尔科夫模型 —— 谷歌大脑 Hugo 的神经网络课第 34 期

Bengio在蒙特利尔的博士生,专攻计算机视觉和自然语言处理领域的深度神经网络。现仍任教于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学,兼任客座教授。
2018年3月19日

Kaggle 商品销量预测季军方案出炉,应对时间序列问题有何妙招

进行更深入的研究,以完成更复杂的任务。为了训练更深的网络,需要大量的数据。在未来,对不同类型和领域的数据进行分析可能是另一个有趣的方向。此外,将不同技术融合起来也能获得相当的准确性。
2018年3月19日

Uber 开源「神经演化」可视化工具 VINE

还可以与其他神经演化算法(例如前面提到的遗传算法等)进行无缝的协作。事实上,这个工具独立于任何特定的神经演化算法,用户所需要做的只是稍微修改一下他的神经演化代码保存它想要了解的行为特征。
2018年3月19日

「2018中国人工智能安防峰会」嘉宾名单正式公布

高文院士的研究领域为人工智能、模式识别与多媒体计算。近几年主要研究集中在视频编码与分析、计算机视觉等。主持973(首席)、863、国家自然科学基金等国家级项目二十余项。2008年被评为IEEE
2018年3月18日

媲美人类有何不可?深度解读微软新 AI 翻译系统四大秘技

根据论文中的测试,对偶监督学习模型在机器翻译、图像分类、句子情感分析三对任务中都取得了明显的提高。尤为让人印象深刻的是句子情感分析这一对任务:判断一个句子是正面还是负面情感,或者根据给定的正面
2018年3月18日

招募 | 阿里妈妈 2018 实习生招聘,19 届毕业生都往这看

发至邮箱【zengbingyu@leiphone.com】或者【konglingshuang@leiphone.com】,我社帮你招人!
2018年3月18日

Pytorch 中如何处理 RNN 输入变长序列 padding

个训练数据一起计算的时候,我们会遇到多个训练样例长度不同的情况,这样我们就会很自然的进行
2018年3月18日

Github 项目推荐 | Google 大脑神经音频合成器的物理接口 —— Open NSynth Super

Super,开发者可以通过简单易用的硬件界面创建和探索新的声音,该界面可以十分容易地集成到各种音乐制作平台上。详细信息,请查阅
2018年3月17日

AI 竞赛 | 2018 机器阅读理解技术竞赛

名。由主办方中国中文信息学会(CIPS)和中国计算机学会(CCF)为获奖者提供荣誉证书认证;由百度公司为获奖者提供奖励和参会交流赞助。
2018年3月17日

Google 发布官方中文版机器学习术语表

一种衡量指标,用于衡量模型的预测偏离其标签的程度。或者更悲观地说是衡量模型有多差。要确定此值,模型必须定义损失函数。例如,线性回归模型通常将均方误差用于损失函数,而逻辑回归模型则使用对数损失函数。
2018年3月17日

上交大 Acemap 团队发布学术知识图谱 AceKG,涵盖 1 亿多个学术实体

提供学术异构图谱,包含多样的学术实体与相应的属性,可以支持多样的学术大数据挖掘课题,例如现阶段异构网络向量化的诸多课题。
2018年3月16日

定了!Python 团队将于 2020 年 1 月 1 日停止支持 Python 2.7

将不会提供任何支持。如果你还想获得支持,那得付相关商业费用。当然,它是开源的,所以我们也欢迎大家
2018年3月16日

AI 挑战赛 | 基于一分钟渐进情绪行为数据集(OMG-Emotion)的情绪识别挑战赛

在最近的人工智能领域,认知系统已经将计算模型作为类似人类的感知分类任务。然而,该领域的大部分研究仍然基于瞬时表情分类,其任务是用不同的形式来描述单个情绪表达,这与情绪行为感知和学习发展不同。
2018年3月16日

如何构建商品定价模型?Mercari Price Suggestion Challenge 最佳方案出炉

「如何分析一件商品究竟值多少钱?」对于消费者和商品卖家来说,这着实是一个不小的挑战。在网上购物时,当只有文字描述时,这个问题显得更为突出。在商品价格上,一些极小的细节代表着巨大的价格差异。
2018年3月16日
2018年3月14日
2018年3月13日

Must Know! 数据科学家们必须知道的 5 种聚类算法

有关的另一种聚类算法,不同之处在于我们使用组的中值向量来重新计算组中心点。该方法对异常值不敏感(因为使用中值),但对于较大的数据集运行速度就要慢得多,因为在计算中值向量时,需要在每次迭代时进行排序。
2018年3月13日

Github 项目推荐 | 用 Keras 实现的神经网络机器翻译

https://github.com/lvapeab/nmt-keras/blob/master/examples/documentation/ensembling_tutorial.md
2018年3月12日

深度解密换脸应用 Deepfake

的整个流程包括三步,一是提取数据,二是训练,三是转换。其中第一和第三步都需要用到数据预处理,另外第三步还用到了图片融合技术。所以我在技术上主要分三个方面来剖析:图像预处理、网络模型、图像融合。
2018年3月12日

谷歌开源猎星代码,AI时代的天文爱好者们该换装备了!

我们知道,行星是不发光的,我们之所以能够看到水、金、火、木、土星,是因为它们反射了太阳光线,但这些光线相比于恒星来说是微不足道的。当距离遥远时,即使那些巨大的恒星都可能难以察觉,更何况那些系外行星。
2018年3月11日

招募 | 今日头条、SpeakIn 招聘 AI 相关职位,最高年薪可达 500 万!

等知名互联网企业的产品研发团队,具有极强的科研实力及产品研发能力。团队核心成员均来自哈佛大学、麻省理工学院、香港科技大学、中国科技大学、林肯实验室、微软亚洲研究院等国内顶尖高等学府和科研机构。
2018年3月11日

Github 「stars」 平均 3558,最棒的 30 个机器学习实例

开源项目对于数据科学家来说可能是很有用的。你可以通过阅读源代码以及在现有项目之上构建一些东西来学习。
2018年3月11日

Kaggle 图像识别新赛来袭,还有一家中国企业提供赞助

这次竞赛中,每一张图片都有一个基于事实的标签。被评估的算法将会产生每个图像的标签,然后对算法进行评估。如果预测标签与事实标签相同,那么这张图像的错误是
2018年3月10日

Roofline Model 与深度学习模型的性能分析

:由计算量除以访存量就可以得到模型的计算强度,它表示此模型在计算过程中,每Byte内存交换到底用于进行多少次浮点运算。单位是FLOP/Byte。可以看到,模计算强度越大,其内存使用效率越高。
2018年3月10日

百度发布了一个「超同类 10 倍」数据量的自动驾驶数据集,看看它有哪些亮点

的研究成果并非停留在实验室,而是与产业界结合紧密,目前合作伙伴有诸如博世、采埃孚等一级供应商,大众、本田、现代等车企,恩智浦、英伟达等芯片厂商,以及华为、驭势等中国公司均是其合作对象。
2018年3月10日

最实用的 50 篇文章,教你搭建机器学习 APP

的这篇文章提出了一个很惊人的思想,认为模型可以不通过对数据集上进行学习和预训练就能实现图像转换任务:例如去噪,超分,图像修复等任务,只需要调节一些超参数,例如网络训练次数和学习率等。
2018年3月9日

野外动物监测图像挑战赛:预测捕捉到的野外图像是否包含动物

本次比赛旨在预测白天和晚上从各个地点捕捉到的图像是否包括动物,其主要的挑战是推断出数据集中不存在的野外相机的位置。另一个挑战是某些图像可能包含会触发相机但是对结果毫无用处的信息,比如车辆和人。
2018年3月9日

重大更新!微软宣布推出人工智能平台 Windows ML

功能到应用程序中。例如,制造商可以使用基于现有照片的良好部件和损坏部件的图像分类器,并将所得到的模型用于构建可区分差异的应用程序。微软团队项目经理
2018年3月9日

14 段语录,听懂 “AI + 安防” 的冰与火之歌

领域,领先的算法是打造产品差异化的关键点。对此,商汤通过核心技术来打通上游的合作伙伴,帮助他们拓宽下游市场,同时为下游合作伙伴提供全链条的一站式解决方案,最大化地发挥其在应用场景的价值。
2018年3月9日

干货:Google 苏黎世算法与优化专题讲座总结(附演示文稿+视频)

Schulz(维也纳大学)就用于生成均衡图分割结果的不同技术展开了头脑风暴,这些结果优于近期一篇论文中所生成切割的质量。我们期待看到改进的结果。
2018年3月8日

Github 项目推荐 | 用 Pytorch 实现的 Capsule Network

https://github.com/danielhavir/capsule-network
2018年3月8日

谷歌大脑发布神经网络的「核磁共振」,并公开相关代码

语义词典让我们能够对某个激活进行细致的考察,即每一个单个神经元能够检测到什么。建立了这种表示之后,我们同样也可以将一个激活向量作为整体来考虑。这里不再是将单个神经元可视化,而是将在给定空间范围内处于
2018年3月8日

想快速部署机器学习项目?来看看几大主流机器学习服务平台对比吧

不是一个可行的商业模型。根据他的说法,这个模式定位在了使用开源产品的数据科学家和想要购买全套服务的商业高管之间的空白处。然而,目前业界似乎正在克服该模式长期存在的问题,最终我们会看到更多公司转向使用
2018年3月8日

Kaggle 大神 Eureka 的高手进阶之路

NLP,剩下的所有问题,都可以归结为此类问题。例如根据实际业务,做各种各样预测的问题(预测销量、点击率、推荐排序等),都可以定义为数据挖掘问题。或许我的定义并不准确,不过我没有想到一个更好的表达词。
2018年3月7日

这场 DeepMind 赞助的通用视频游戏 AI 挑战赛,能让你一边玩游戏一边玩 AI

http://groups.google.com/group/the-general-video-game-competition
2018年3月7日

Github 项目推荐 | 真实全景图像强化学习 AI 平台 —— Matterport3DSimulator

https://github.com/peteanderson80/Matterport3DSimulator/blob/master/tasks/R2R/README.md
2018年3月7日

喜大普奔,Keras 官方中文版文档发布啦!

management)基于变量属性;二是把层和模型中已经不再使用的约束属性移除(不会影响任何用户)。
2018年3月7日

2018 年,是时候来一场「体面」的人工智能安防峰会了

篇以上的「AI+安防」深度报道,已经成为这一方向的内容报道引领者。我们希望借助一年一届的「中国人工智能安防峰会」,汇聚全国一线权威人士,树立「AI+安防」峰会标杆,共同推动安防产业的智能化升级。
2018年3月6日

微软举办云 AI 挑战赛,对所有学科和领域开放

微软邀请了大学的研究者、学生、公共和私人组织的雇员参与到这次的挑战赛。参赛者团队可以在任意领域创建一个可用的交互式的软件应用程序,只要该应用的智能系统使用了微软
2018年3月6日

阿里巴巴 WSDM Cup 2018 夺得第二名,获奖论文全解读

被誉为信息检索领域最顶级的会议之一,会议的关注点为搜索、数据检索、数据挖掘、算法设计、算法分析、经济影响方面的实际且严谨的研究,以及对准确率和运行速度的深入实验探究。今年已经是
2018年3月6日

Github 项目推荐 | 用 Pytorch 实现的 WaveNet-Vocoder

"https://www.dropbox.com/s/xt7qqmfgamwpqqg/si-close_lr1e-4_wd0_bs20k_ns_up.zip?dl=0"
2018年3月5日

我们分析了最流行的歌词,教你用 RNN 写词编曲(附代码)

字符级语言模型,数据集来自最受欢迎以及最新发布的艺术家的作品。模型训练好之后,我们会选出几首歌曲,这些歌曲将会是不同风格的不同艺术家的有趣混合。之后,我们将更新模型使之成为一个条件字符级
2018年3月5日

谷歌开源 FHIR 标准协议缓冲工具,利用机器学习预测医疗事件

原始记录的表示。我们证明使用这种表示方法的深度学习方法能够准确预测来自多个中心的多个医疗事件,而无需特定地点的数据协调。我们使用来自两个美国学术医疗中心的去识别的
2018年3月5日

DeepMind 提出全新强化学习算法,教智能体从零开始学会控制

例如,激活手指上的触觉传感器,感知手腕的力度,利用本体感应器将关节角度调到最大,在视觉传感器范围内强制性移动物体。对于每个任务,如果实现目标,会提供相应的简单奖励。没实现目标的话,奖励为零。
2018年3月4日

在 fast.ai 课堂上,我总结的 8 个深度学习最佳实践

https://hackernoon.com/8-deep-learning-best-practices-i-learned-about-in-2017-700f32409512
2018年3月4日

如何用张量分解加速深层神经网络?(附代码)

)中我介绍了一些称为裁剪(pruning)的技术以减少模型中的参数数量。在一个数据集上正向传递(有时是反向传递)裁剪(pruning),然后根据网络中激活的一些标准对神经元进行排序。
2018年3月3日
2018年3月3日

微软认知服务再推三款 AI 工具:人脸 API、自定义影像服务、必应实体搜索 API

据介绍,使用该服务先上传带有标记的图像或使用自定义影像服务快速标记任何未经过标记的图像。然后使用这些带有标记的图像向自定义影像服务传授你希望其学习的概念,使用简单的
2018年3月3日

我用深度学习分析 LoL 小地图,自制数据集 DeepLeague 开源(下)

天哪!这真是太可怕了。我完全失去了游戏计时器的轨迹,因为这次中断,游戏时间戳和视频时间戳变得不对齐了!我的程序应该怎样了解如何从视频中提取数据,并将每一帧与我从网络套接字中获得的
2018年3月2日
2018年3月2日

Github 项目推荐 | 用 Python 实现的机器人算法示例集合 —— PythonRobotics

https://www.ri.cmu.edu/pub_files/pub1/fox_dieter_1997_1/fox_dieter_1997_1.pdf
2018年3月2日

Github 项目推荐 | 微软开源 MMdnn,模型可在多框架间转换

https://github.com/Microsoft/MMdnn/releases/download/0.1.3/mmdnn-0.1.3-py2.py3-none-any.whl
2018年3月1日

视频 | 从原理到代码,Hinton 的胶囊网络该怎么用?(附代码)

基本上常规的卷积网络的主要不同点是——向前传播有一个额外的外环,它要在所有单元(至少一个)上进行四个迭代去计算输出。数据流看起来有一丁点复杂,因为对于每个胶囊来说嵌套在一个图层中应用这些操作,无论是
2018年3月1日

传统算法和深度学习的结合和实践,解读与优化 deepfake

Deepfake出现后也有很多工作对deepfake进行优化,包括使用GAN的,这些优化的针对生成图像的质量,但目前看质量没有太大的提升,同时几乎没有工作是针对模型的训练速度和图像的后处理。
2018年3月1日

OpenAI Baselines 更新,新增 HER 强化学习算法

0。这其中有两个原因:探索行为的不连贯性,以及为了及时传播反馈中的信息需要引导更多次。如何设计一个可以高效利用样本、而且即便动作频率上升到无限大也能保持表现的算法呢?
2018年2月28日

视频特辑:香农熵和信息获得

添加雷锋字幕组微信号(leiphonefansub)为好友,备注「我要加入」,To
2018年2月28日

普通程序员想投身 AI 行业?知乎大 V 阿萨姆分享开发者转型的机遇与挑战

热之前,开发者也用线性回归等去拟合、预测数据或者是聚类、关联规则挖掘数据,只不过那时没有冠以「机器学习」的名号。您觉得现在机器学习浪潮会不会有些虚热?目前人工智能技术的落地和应用还有哪些困难?
2018年2月28日

看过 CVPR 2018 workshop 后,发现有一个我不认识的 Lady Gaga

然而,目前因为一些原因,他们还没能利用到这些潜在的信息。首先是数据质量很糟糕,此外缺乏数据标签,最后缺乏能够将数据转化为有用信息的高质量模型,另外还需要支持从端到云分析的平台来加速模型的开发和部署。
2018年2月27日

新加坡国立大学霍华德:NLP 都有哪些有意思的事儿?

幸运的是,人生不都是独立重复实验,有些因素是我们可以控制的,可以努力的,如多喝牛奶,多打篮球,多蹦多跳,这样就相当于提高了某几次投硬币得到正面的概率,让自己多长高一些。
2018年2月27日

Github 项目推荐 | GAN 的 Keras 实现案例集合 —— Keras-GAN

https://github.com/eriklindernoren/Keras-GAN/blob/master/context_encoder/context_encoder.py
2018年2月27日

软技能和硬技能哪个重要?科技行业需要重新思考这个问题

我们看到互联网上的焦虑反应,认为软技能可能会成为工程师的重要技能。有趣的是,人们如此关心软硬技能的相对价值,而不是整体的经济波动或工程师的过度供应,另外两件事情同样容易威胁到工程师的地位。
2018年2月26日

Github 项目推荐 | 用于 C/C++、Java、Matlab/Octave 的特征选择工具箱

包含以下实现:mim,mrmr,mifs,cmim,jmi,disr,cife,icap,condred,cmi,relief,fcbf,betagamma
2018年2月26日

Mercari Price 比赛分享 —— 语言不仅是算法和公式而已

cpu)中60分钟内完成预处理训练及预测。所以以往疯狂融合模型的套路走不通了,大家在同一起跑线拼的就是对数据和机器学习模型的理解。比赛的ab榜几乎没有shake,可以说是非常良心的比赛。
2018年2月26日

Github 项目推荐 | Nvidia 图片风格转换工具 —— FastPhotoStyle

的图片风格转换工具,其中包含了照片变为各种艺术风格的算法。通过给定的照片和风格,该工具可通过特定的算法何成为用户所需要的图片。代码详细的实现原理在
2018年2月25日

招募 | Face++旷视研究院、美团点评招 AI 相关职位,节后跳槽升职加薪走一波!

(https://arxiv.org/pdf/1711.07264.pdf)。除了公开发表的文章,我们内部有复现很多经典以及最新的检测工作。从产品角度来讲,我们建立了一套小的imagenet
2018年2月25日

混合整数规划/离散优化的精确算法--分支定界法及优化求解器

而工业界非常多的问题可以被建模成整数规划问题,例如物流、路径规划、航班调度等等。需要得到其精确解,便需要使用优化求解器。但是这些求解器都掌握在以上国外公司或机构,中国没有自己的优化求解器!
2018年2月25日

简简单单,用 LSTM 创造一个写诗机器人

同时也是一个诗人,我一直都十分喜爱这句话。然而,如果将这句话翻转过来,我不禁要问:「我能否通过代码写诗呢?我能否创造一个能够写出原创性诗词的机器?」于是,我做了一系列实验去探究这个问题的答案。
2018年2月24日

Github 项目推荐 | TensorFlow 概率推理工具集 —— probability

示例模型(tfp.examples):使用此包和tf.contrib.distributions中的工具在TensorFlow中实现常见概率模型。
2018年2月24日

专访百度 PaddlePaddle 开源平台负责人王益:国产深度学习平台是如何帮助开发者快速开发 AI 产品的?

领域每个层次上都有值得骄傲的工作在做值得骄傲的技术。如果有一个开放的软件平台把他们能连为一体,无疑是一件独具社会价值和面向长远未来的事儿。这是一个很有挑战的机会。另一个主要原因是百度的管理层都很支持
2018年2月24日

节后想去做 AI ?这里有一些 AI 转型和面试文章值得一看

本文作者刘若泽,南京大学计算机在读博士,EasyPR作者,他刚转入AI领域,所以结合自身经验来回答这个问题。他的回答有以下特色:较为简单,介绍学习资源不多,但有主次之分。
2018年2月23日

Github 项目推荐 | Basel Face Model 2017 完全参数化人脸

https://github.com/unibas-gravis/parametric-face-image-generator
2018年2月23日

Github 项目推荐 | 最小化类 AlphaGo Zero 引擎 —— Nochi

并做周期性快照(这些数字应该乘以线程数来获得真实的局数)。要恢复成其他的模式(比如开始
2018年2月22日

Google Brain 团队 Hugo Larochelle 教授「Neural Networks」课程合辑!

Brain是谷歌公司2011年启动的智慧产品,现有的20名核心团队成员,全部都是专注于机器学习领域的计算机科学专家,Jeff
2018年2月22日

我用 face-recognition.js 识别出谢耳朵,还做了基于 Node.js 的面部识别库

但是,这些面部识别器虽然速度很快,但是我发现他们的识别结果却并不可靠。更准确一点说,它们在识别正面面部图像时性能不错,但是当面部的姿态稍有不同(比如侧脸之类),它们的预测结果就不是很保险了。
2018年2月21日

新手必看的十种机器学习算法

例如,你不能说神经网络就一定比决策树好,反之亦然。要判断算法优劣,数据集的大小和结构等众多因素都至关重要。所以,你应该针对你的问题尝试不同的算法。然后使用保留的测试集对性能进行评估,选出较好的算法。
2018年2月21日

Facebook、微软、谷歌三大研究巨头齐聚首,共同探讨人工智能发展现状和趋势

建立的(概率编程可以看作图形模型的推广、类似可微编程是深度学习的泛化推广)。事实证明,在图模型中使用反向传播进行推理是非常有用的。当数据匮乏并且可以手动特征化时,SVM、核方法、树模型等更好用。
2018年2月20日

教你用 Python 和 Keras 建立自己的 AlphaZero

如果AlphaZero用的是世界上只有少数人能理解的超级复杂算法,那么这将是令人难以置信的成就。而让它特别的是,实际上论文中许多理念远没有以前的版本复杂。它的核心思路正是下面简单的学习口诀:
2018年2月20日
2018年2月19日

【中文分词系列】 1. 基于AC自动机的快速分词

目前中文分词主要有两种思路:查词典和字标注。首先,查词典的方法有:机械的最大匹配法、最少词数法,以及基于有向无环图的最大概率组合,还有基于语言模型的最大概率组合,等等。
2018年2月19日

Github 项目推荐 | TensorFlow 项目模板架构最佳实践

https://github.com/Mrgemy95/Tensorflow-Project-Template
2018年2月18日

代码+实战:TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

{feat_vals.add_float_val(vals_vec[i]);}feat_vals.mutable_tensor_shape()->add_dim()->set_size(1);
2018年2月18日

区块链能养猫养狗了?!手把手带你复现AI+区块链写码全过程!(附代码) | AI 热译

在这个视频中,我们重点讨论AI+BlockChain如何一起工作,如何在python中编写工作证明算法,然后在高层次上讨论一些其他的共识算法。
2018年2月17日

FAIR 开源 Tensor Comprehensions,让机器学习与数学运算高性能衔接

pipeline,随后在单独代码块中调度到硬件上,并且详细到如何平铺、矢量化、并行化和融合。对于具有专业知识的人而言,这是一种非常高效的语言;但对于机器学习从业者来说,这一难度并不小。Halide
2018年2月17日

特辑 | 新年来临之际,我们准备了一份 1196 页大礼包

京东金融全球数据探索者大会上,中国工程程院院士、北京大学教授高文应邀做会议演讲,我们全方位报道了高文院士的演讲内容——大数据和人工智能的联系与区别,人工智能到底走到了哪里、还要走多远。
2018年2月16日

如何解决自然语言处理中 90% 的问题

这两种颜色看起来更容易分离,我们的新向量应该可以帮助我们的分类器将两类分开。在第三次用同样的模型(逻辑回归)训练后,我们得到了一个77.7%的准确率,这是我们目前最好的结果!是时候检查我们的模型了。
2018年2月16日

Github 项目推荐 | 用 TensorFlow 实现的模型集合

保持同步。官方模型应该合理优化以实现更加高效的性能,同时易于阅读。
2018年2月15日

2017 年关于 Python 案例的 Top45 文章

https://lintlyci.github.io/Flake8Rules/?utm_campaign=read_more&utm_medium=blog&utm_source=mybridge
2018年2月15日

还在纠结 Python 的数据导入问题吗?有这张速查表就够啦

数据导入课程》(https://www.datacamp.com/courses/importing-data-in-python-part-1/)或者尝试一下我们的使用
2018年2月14日

我用深度学习分析 LoL 小地图,自制数据集 DeepLeague 开源(上)

小地图还提供了与游戏状态相关的惊人数量的信息。如果一个人每分钟看一次微型地图,他们就会很清楚地了解谁是赢家,有多少建筑被毁,守卫的位置等等。下一步你会搞清楚我是如何通过计算机视觉来收集这些数据的。
2018年2月14日

Github 项目推荐 | 用 AI 打造游戏,Unity 机器学习 Agent —— ml-agents

https://github.com/Unity-Technologies/ml-agents/blob/master/docs/Making-a-new-Unity-Environment.md
2018年2月13日

Quora Question Pairs 竞赛冠军经验分享:采用 4 层堆叠,经典模型比较给力

rescale)。对于第一层模型来说两者的效果都非常好,但是随着堆叠的深入,我们发现公共缩放不够强大,而外围缩放却有点过头。我们优化了缩放,使它的效果在这两种方法之间,与公共缩放相比,最终提高了
2018年2月13日

一起来涂鸦吧!用风格迁移把iPhoneX的照片变成艺术画

另外,剪影不一定要全部都是黑色的。其实各种颜色就像种子(生成随机数的种子)一样可以生成不同种类的艺术品。我们想要把哪种颜色作为主色来选择剪影颜色(注意:黑色就像一个分界颜色——它是中性的)。
2018年2月12日

特辑 | 人工智能从入门到实战,这里有一份1000+页的指南

掌握与人工智能强相关的基础知识,如深度学习相关理论与应用,人脸识别、声纹识别、语音分离、文本理解、自动驾驶等领域的基础概念,这是第一步。
2018年2月12日

招募 | 阿里、华为、搜狗杭州研究院招 AI 相关职位!你升职加薪的时候到了

深入理解OceanBase技术原理,针对业务特点设计合理的数据库解决方案,持续跟进业务遇到的各类问题,通过产品化方法实现解决方案、运维、技术支持和服务的规模化和自动化。
2018年2月12日

Github 项目推荐 | 在线新闻评论分析数据集——SOCC

http://www.sfu.ca/~mtaboada/docs/publications/Kolhatkar_etal_SOCC.pdf
2018年2月12日

从 Encoder 到 Decoder 实现 Seq2Seq 模型

我们可以看到最终模型的训练loss相对已经比较低了,并且从例子看,其对短序列的输出还是比较准确的,但一旦我们的输入序列过长,比如15甚至20个字母的单词,其Decoder端的输出就非常的差。
2018年2月11日
2018年2月11日

比特币区块链数据集:完整的历史实时比特币区块链数据

经过近十年的发展,比特币技术有了爆炸式的增长,另一方面,比特币的价值也经历了大量的波动。与此同时,随着比特币和区块链技术应用范围的扩大,应用案例的增加,各种争议和炒作也越来越多。
2018年2月11日

公开课年度盘点,AI 研习社的人工智能视频学习资料全在这里了!

内容简介:由于FPGA独特的可编程硬件结构,它们的片上电路随应用的改变而改变,这为FPGA的动态电压调节带来了极大的困难。本次公开课,赵舒泽将分享他们提出的基于自测量的FPGA动态电压调节解决方案。
2018年2月10日

特辑 | 2017年,人工智能圈迸发出哪些火花和观点?

麦卡锡和明斯基被后世誉为人工智能之父,均凭借在人工智能领域的卓越贡献,获得计算机领域最负盛名的奖项——图灵奖。作为信息论的创建者,香农则在通信领域做出划时代的贡献。
2018年2月10日

北航张欢:如何运用深度学习进行位姿测量?| 分享总结

Lepetit等把匹配问题转化成分类问题,把物体每个关键点的所有可能的外观集归成一类。每个关键点至少一张样本图,然后根据样本图生成样本集训练分类器,使用随机森林作为分类器,对每个关键点进行分类。
2018年2月10日

DeepMind 推出分布式训练框架 IMPALA,开启智能体训练新时代

https://github.com/deepmind/lab/tree/master/game_scripts/levels/contributed/dmlab30
2018年2月9日

招人 | AI 科技评论 & AI 研习社招人啦,编辑、运营、兼职虚位以待!

欢迎投递简历到:guoyixin@leiphone.com,也欢迎转给身边热爱未来科技的朋友,期待你的加入!
2018年2月9日

一个快速方便的图形化 Python 调试器 —— birdseye | Github 项目推荐

https://github.com/alexmojaki/birdseye/blob/master/example_usage.py
2018年2月9日

AI Chat | 谷歌编程马拉松入场 Girl:“Keep looking Don't settle”

在这里,为了完成翻译任务,我需要认真仔细地品读每一个单词,这样才能把它们更好地转换成大家都能理解的句子。这个过程中,由于全身心的投入,我对翻译内容的掌握不断加深,最后的效果就是学到了新的知识。
2018年2月9日

谷歌大脑提出TCN,能让机器人边看视频边模仿

通过视频的分解镜头来学习,将时间作为监督信号,发现视频的不同属性。这组嵌入向量经由一组非结构化和未标记的视频训练,里面含有和任务相关的有效动作,也有一些随机行为,来体现真实世界中的各种可能状态。
2018年2月8日

一周 Github Trending 热门项目,最全中华古诗词数据库 | Github 项目推荐

需要花费很多的时间和资源。如果此数据库对您有很大的帮助,请酌情考虑打赏作者(https://jackeygao.io/donation.html)。
2018年2月8日

我们从李飞飞斯坦福CS231n课程讲义里,扒来了最全的计算机视觉术语表

学习过课程的同学都知道,课程除了视频、讲义,还有课后练习项目,只听课不做作业效果是要折半的,这里,我们奉上往期代码实现的公开课,希望大家看完课程,也能敲代码做项目:
2018年2月8日

如何对非结构化文本数据进行特征工程操作?这里有妙招!

一个单词只是一个标记,通常被称为单元(unigram)或者一元(1-gram)。我们已经知道,词袋模型不考虑单词的顺序。但是如果我们也想要考虑序列中出现的短语或者词汇集合呢?N
2018年2月7日

CS231n 课后作业第二讲 : Assignment 2(含代码实现)| 分享总结

传统机器学习往往需要对输入数据做一个归一化,通常使用的是零均值和方差归一,这样会保证输入的数据特征会有比较好的分布,使得算法可以比好好的学习。对于深度学习神经网络,使用
2018年2月7日

用于快速开发 3D 数据处理软件的开源数据处理库 —— Open3D | Github 项目推荐

写成的精心挑选的数据结构和算法,后端高度优化并设置为并行。Open3D
2018年2月7日

特辑 | 站在学术大牛的肩膀上,看2017年的AI圈

过去的一年间,我们有幸与这些业界领军人物进行交谈,谈论目前落地的技术,面临的难题,需要的人才等各个方面。从这里,大家可以知悉业界的最新成果和需求,看到他们的远见,了解学界与业界的研究差异。
2018年2月7日

NumPy 将停止支持 Python 2,这里有一份给数据科学家的 Python 3 使用指导

https://stackoverflow.com/questions/38987/how-to-merge-two-dictionaries-in-a-single-expression
2018年2月6日

特辑|回看 2017,哪个学术会议给你留下最难忘的回忆?

我们关注到的或许只是大会的一角,覆盖的方向也许并不全面,但就如同之前所说,希望我们的报道能成为大家了解人工智能学术趋势的一个补充:希望在现场的你们,能收获更多;不在现场的你们,胜似在现场。
2018年2月6日

上交大卢策吾团队开源 AlphaPose, 在 MSCOCO 上稳超 Mask-RCNN 8 个百分点

上的分区域多人姿态识别算法(RMPE),该算法主要为了解决在人物检测结果不准的情况下进行稳定的多人姿态识别问题。雷锋网
2018年2月6日

基于结构化 SVM 进行序列标注

可能的状态数。所以在求解过程中需要先将上述优化问题转换成对偶形式,采用割平面训练法,具体优化过程不考虑所有约束条件,从无约束问题出发,逐步选择约束直到精度满足期望后停止。
2018年2月6日

AI+BlockChain 区块链火之后,人工智能凉了吗? | AI 热译

经过时间的检验,就知道哪些模型的预测结果是最准确的。预测结果最准的人不仅能够收回成本,同时也能获得奖励。这个奖励系统面向所有人,目的就是提高预测准确性。但是,如果你预测得不够好,那你的钱就输掉了。
2018年2月5日

如何上手使用 Facebook 的开源平台 Detectron?

这个模型对普通对象的遮蔽(masking)效果非常好,不过有的开发者会需要更多的实例来学习,我会在后续的教程中教你如何构建自己的对象遮蔽模型。
2018年2月5日

数据挖掘竞赛的套路就在这里了,看完本文全明白!

这一点我不谈具体的技术,因为这些技术名词时老生常谈,什么归一化,标准化恐怕数据挖掘的第一课就是谈这些东东,这里只讨论两个问题,你知道什么时候该用什么技术手段进行预处理吗?你知道预处理的目标是什么吗?
2018年2月5日

TensorFlow | 自己动手写深度学习模型之全连接神经网络

https://github.com/wangle1218/Depp-learning-TensorFlow-tutorials/blob/master/fc_clf.pygithub.com
2018年2月4日

给数据科学家的 Python 3 指导;简单 chatbot 代码实现| Github 项目推荐

Github:https://github.com/arogozhnikov/python3_with_pleasure
2018年2月4日

阿里、第四范式机器学习岗位招聘!更多 AI 职位虚位以待!

model等模型有深入研究,掌握至少一种常用深度学习的框架Theano,Keras,Mxnet,Caffe,Tensorflow,有实践经验,掌握调参策略
2018年2月4日

用高分辨率图像分析灾害损失,航拍影像机器学习挑战赛开始报名!

获胜的队伍会获得公开的赞誉以及一份成就证书,至于奖金数额,主办方将会在不久之后宣布。另外,我们鼓励学生积极参与该挑战赛,这对于提高简历含金量来讲非常有帮助。
2018年2月3日

干货 | 普通程序员如何转向 AI 方向?

深度学习:深度学习是目前最火热的研究方向。有以下特点:知识更新快,较为零碎,没有系统讲解的书。因此学习的资源也相对零散,下面是一些资源介绍。其中不推荐的部分并不代表不好,而是在这个初学阶段不合适:
2018年2月3日

刷爆朋友圈的 deepfakes 视频人物换脸是怎样炼成的?

不过这不是我们今天讨论的话题(正经脸),我们在RussellCloud上复现了一个换脸的实例——尼古拉斯-凯奇和特朗普的换脸人生。这里我们会阅读一些项目的代码让增进对这个项目的技术了解。
2018年2月3日

谷歌正式开源 Hinton 胶囊理论代码,即刻用 TensorFlow 实现吧

--hparams_override=num_prime_capsules=64,padding=SAME,leaky=true,remake=false
2018年2月2日

谷歌人小课堂:训练CRFs损失函数 | Neural Networks #28

Brain的蒙特利尔办公室担任助理研究员一职,同时也在位于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学任教,兼任客座教授。
2018年2月2日

技术大牛讲解 CS231n 课后作业——第一讲(含代码实现)| 分享总结

Recognition,即面向视觉识别的卷积神经网络。该课程是斯坦福大学计算机视觉实验室推出的入门课程,授课内容在国内外颇受好评。所有课程资料、PPT
2018年2月2日

深度学习对话系统实战篇 -- 简单 chatbot 代码实现

#--------------------接下来就是将数据进行reshape操作,变成序列长度*batch_size格式的数据------------------------
2018年2月2日

北邮张庆恒:如何基于 rasa 搭建一个中文对话系统 (有源码视频)| 分享总结

第三种方法是分类思想,先对一句话提取特征,再根据有多少个槽值或意图训练多少个分类器,输入一句话分别给不同的分类器,最终得到包含槽值的概率有多大,最终得到这个槽值。
2018年2月1日

谷歌人小课堂:10分钟搞懂分类 | Neural Networks #27

Brain的蒙特利尔办公室担任助理研究员一职,同时也在位于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学任教,兼任客座教授。
2018年2月1日

详解深度学习中的 Normalization,不只是 BN

每一层神经元的输出依赖于底下各层的计算结果。如果没有正则化,当下层输入发生伸缩变化时,经过层层传递,可能会导致数据发生剧烈的膨胀或者弥散,从而也导致了反向计算时的梯度爆炸或梯度弥散。
2018年2月1日

Kaggle Carvana 图像分割比赛冠军模型 TernausNet 解读

是一个可用于密集图像分割的深度学习模型,能够根据使用者的要求,对原始图像进行划分,将原始图像分成有不同意义的若干部分。避免传统的手动图像分割的耗时耗力的麻烦,达到高效、高质量、标准化的图像分割要求。
2018年1月31日

谷歌人小课堂:10分钟搞懂置信传播算法 | Neural Networks #26

Brain的蒙特利尔办公室担任助理研究员一职,同时也在位于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学任教,兼任客座教授。
2018年1月31日

视频 | 对抗攻击:骗过神经网络,改变一个像素就够了

想要骗过神经网络,也不要什么超高伎俩,随便动动手脚,在原图上增加一点噪音,或是更改一些像素点就成了。但是想骗过人类就难了,我们通常都能知道某张图是伪造的或是人为制作出来的。
2018年1月31日

TensorFlow 中层 API TFRecordDataset

pd.DataFrame({'name':['scalar','vector','matrix','matrix_shape','tensor','tensor_shape'],
2018年1月30日

谷歌人小课堂:10分钟搞懂因子图 | Neural Networks #25

Brain的蒙特利尔办公室担任助理研究员一职,同时也在位于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学任教,兼任客座教授。
2018年1月30日

DeepMind 开源虚拟实验室 Psychlab,利用认知心理学对智能体进行研究

例如,他们可能会使用两个独立的测试来分析超市中的那种场景——包括「视觉搜索」测试,要求受试者对特定的形状进行定位,用来探测注意力,同时他们可能会让受试的人回忆看过列表的中的条目,来测试他们的记忆力。
2018年1月30日

43位顶级学术IP演讲全收录,最值得收藏的30万字「全文+PPT」精华 (1195页PDF)

回顾了其十年前顶着「学术警察」对于机器学习这门新学科的质疑前进的过程,并提出经过十年的发展,机器学习需要从野蛮生长到建立一个完整的体系的过程,并号召大家去为机器学习的理论框架添砖加瓦。
2018年1月30日

谷歌人小课堂:10分钟搞懂马尔可夫网络 | Neural Networks #24

Brain的蒙特利尔办公室担任助理研究员一职,同时也在位于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学任教,兼任客座教授。
2018年1月29日

AI科技评论年度巨献,五大特辑连接学术&产业

科技评论不断报道与人工智能技术相关的公开课程,请来多个相关领域的资深学者,持续解读基础概念,为大家答疑解惑。该栏目涵盖深度学习以及相关应用和延伸,涉及自动驾驶、语音、医疗、人脸识别等方方面面。
2018年1月29日

从NLP到CV+NLP: 计算机视觉和自然语言处理结合介绍 | 公开课

通过此次分享会让大家对自然语言的发展方向有更广阔的认识。无论对自然语言处理还是计算机视觉的从业者,学科的交叉总会给我们带来很多意想不到的有趣应用。
2018年1月29日

如何用 Python 和深度神经网络发现即将流失的客户?

答案自然是否定的。我们其实还是打算用数值描述分类而已。但是取值有数量的序列差异,就会给机器带来歧义。它并不清楚不同的取值只是某个国家的代码,可能会把这种大小关系带入模型计算,从而产生错误的结果。
2018年1月29日

如何在 Keras 中从零开始开发一个神经机器翻译系统?

虽然我们有一个良好的数据集来进行建模,但是我们会稍微简化这个问题,以极大地减少模型所需的模型的大小,并将所需的训练时间转换成适合模型的时间。
2018年1月28日

干货 | 请收下这份2018学习清单:150个最好的机器学习,NLP和Python教程

https://www.analyticsvidhya.com/blog/2017/01/introduction-to-reinforcement-learning-implementation/
2018年1月28日

用深度学习玩「英雄联盟」;Facebook 开源物体检测平台 | Github 项目推荐

的基础上建立一个快速、灵活的物体检测系统,内部开发过程也就从此开始。经过一年半的开发之后,代码库已经成熟了,而且其中集成了许多
2018年1月28日

谷歌 2018 技术实习生正式开放申请!还有这些 AI 职位虚左以待! | 招聘

深圳博思微视是由国家“青年千人计划”特聘教授、临床医学专家及资深投资人士联合创立的致力于病理学数字图像人工智能辅助诊断的行业先进公司,已完成近千万元天使轮投资,估值近亿元。
2018年1月28日

微软推出开源自动驾驶仿真平台 AirSim 教程,机器学习新手也能快速上手自动驾驶

写的这本「神经网络和深度学习」(http://neuralnetworksanddeeplearning.com/)非常不错,可在网上免费获取,它能够让你在一周之内构建坚实的神经网络知识基础。
2018年1月27日

谷歌人小课堂:10分钟搞懂因子、充分统计量、线性链CRF | Neural Networks #23

Brain的蒙特利尔办公室担任助理研究员一职,同时也在位于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学任教,兼任客座教授。
2018年1月25日

谷歌人小课堂:10分钟搞懂计算边际值 | Neural Networks #22

Brain的蒙特利尔办公室担任助理研究员一职,同时也在位于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学任教,兼任客座教授。
2018年1月24日

Facebook 开源 CV 开发平台 Detectron,打包支持各种物体识别算法

在背后支持的算法为实例分割之类的重要计算机视觉任务提供了直观的模型,也在视觉感知系统这一整个研究社区的研究重点近几年的飞速发展中起到了重要作用。
2018年1月24日

谷歌人小课堂:计算配分函数 | Neural Networks #21

Brain的蒙特利尔办公室担任助理研究员一职,同时也在位于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学任教,兼任客座教授。
2018年1月23日

人工智能的听觉,多的是你不知道的事:J叔带你全盘剖析智能语音【微课程】

2017年,最火爆的产品无疑是智能语音了。J叔这次就为大家带来国、内外行业的最新讯息,以及产业链各环节的参与各方及其所处的技术状态。
2018年1月22日

10分钟搞懂Context window | Neural Networks #20

Brain的蒙特利尔办公室担任助理研究员一职,同时也在位于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学任教,兼任客座教授。
2018年1月22日

AI 职位内推时间!这些 AI 职位你不能错过 | 招聘

深圳宜思智能科技有限公司(简称A.E.S)是一家新兴无人驾驶创业公司,站在外太空看地球,人类出行出了问题,污染、拥堵、没有车位。“智能(Artificial
2018年1月21日

不会做特征工程的 AI 研究员不是好数据科学家!下篇 - 离散数据的处理方法

variables)中,这些也经常被称为类别或者标签。这些离散值在自然界中可以是文本或者数字(甚至是诸如图像这样的非结构化数据)。分类数据有两大类——定类(Nominal)和定序(Ordinal)。
2018年1月20日

不会做特征工程的 AI 研究员不是好数据科学家!上篇 - 连续数据的处理方法

变换是很有用的,因为他们倾向于拉伸那些落在较低的幅度范围内自变量值的范围,倾向于压缩或减少更高幅度范围内的自变量值的范围。从而使得倾斜分布尽可能的接近正态分布。让我们对先前使用的开发者数据集的
2018年1月19日

10分钟搞懂线性链 CRF | Neural Networks #19

Brain的蒙特利尔办公室担任助理研究员一职,同时也在位于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学任教,兼任客座教授。
2018年1月18日

今日头条推荐算法原理首公开,头条首席算法架构师带来详细解读

当然,只有实验平台是远远不够的。线上实验平台只能通过数据指标变化推测用户体验的变化,但数据指标和用户体验存在差异,很多指标不能完全量化。很多改进仍然要通过人工分析,重大改进需要人工评估二次确认。
2018年1月18日

OpenAI 开源最新工具包,模型增大 10 倍只需额外增加 20% 计算时间

大家可以为检查点提供一系列张量(gradients(ys,xs,checkpoints=[tensor1,tensor2])),或者可以使用如下几个关键词('collection'、'memory'
2018年1月17日

10 分钟搞懂 Motivation| Neural Networks #18

的蒙特利尔办公室担任助理研究员一职,同时也在位于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学任教,兼任客座教授。
2018年1月16日

10分钟搞懂优化 | Neural Networks #17

Brain的蒙特利尔办公室担任助理研究员一职,同时也在位于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学任教,兼任客座教授。
2018年1月15日

AlphaZero 实战:从零学下五子棋(附代码)

手段,首先当前最新模型相比于历史最优模型一般不会差很多,所以对局数据的质量其实也是比较有保证的,同时模型的不断变化使得我们能覆盖到更多典型的数据,从而加快收敛。
2018年1月14日

亚马逊 Alexa Prize 比赛冠军团队专访:聊天机器人的突破与创新

在决赛阶段中,一个很重要的工作是由程浩完成的——根据网上爬取的关于电影的知识图谱来进行一小段比较有深度的对话。同时,在决赛阶段,我们也改进了内容管理模块,包括扩展内容爬取范围,部署新的内容处理模型。
2018年1月13日

YOLO,一种简易快捷的目标检测算法

,简单点来说,既然每个格子会生成B个框(一般B>1)这样就有可能同时两个框都框中了物体,那么到底采用那个框作为预测结果呢?答案是采用IOU值高的那个框,而IOU值小的,就会不被重视而受到抑制。
2018年1月12日

拿到吴恩达 DeepLeaning 的课程证书能找到机器学习工作吗? | 社区问答

社区目前主要功能是问答和博客,支持文字、图片、视频、代码、公式、超链接,这些功能可以让你在描述问题
2018年1月12日

10分钟搞懂模型选择 | Neural Networks #16

Brain的蒙特利尔办公室担任助理研究员一职,同时也在位于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学任教,兼任客座教授。
2018年1月11日

10分钟搞懂参数初始化 | Neural Networks #15

Brain的蒙特利尔办公室担任助理研究员一职,同时也在位于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学任教,兼任客座教授。
2018年1月10日

从星际2深度学习环境到神经机器翻译,上手机器学习这些开源项目必不可少

机器学习是用数据来学习、概括、预测的研究。近几年,随着数据的开发、算法的改进以及硬件计算能力的提升,机器学习技术得以快速发展,不断延伸至新的领域。从模式识别到电子游戏,开发者们通过训练
2018年1月10日

10分钟搞懂正则化| Neural Networks #14

Brain的蒙特利尔办公室担任助理研究员一职,同时也在位于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学任教,兼任客座教授。
2018年1月9日

10分钟搞懂反向传播| Neural Networks #13

Brain的蒙特利尔办公室担任助理研究员一职,同时也在位于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学任教,兼任客座教授。
2018年1月8日

深度学习在文本分类中的应用

进行特征提取,可以达到比较好的效果,但是也存在一些问题,如参数较多导致训练时间过长,超参数较多模型调整麻烦等。下面两篇论文提出了一些简单的模型用于文本分类,并且在简单的模型上采用了一些优化策略。
2018年1月8日

程序员想转型 CV 方向,请问该重点关注那几个数学方向? | 社区问答

https://book.douban.com/subject/3555724/https://book.douban.com/subject/10590856/
2018年1月8日

产生和防御对抗样本的新方法 | 分享总结

对抗样本是一类被恶意设计来攻击机器学习模型的样本。它们与真实样本的区别几乎无法用肉眼分辨,但是却会导致模型进行错误的判断。本文就来大家普及一下对抗样本的基础知识,以及如何做好对抗样本的攻与防。
2018年1月7日

谷歌发布 TensorFlow 1.5,全面支持动态图机制和 TensorFlow Lite

快速:针对移动设备进行了优化,包括大大减少了模型加载时间、支持硬件加速。
2018年1月6日

AI 玩微信跳一跳的正确姿势——跳一跳 Auto-Jump 算法详解

值是(245,245,245),这就让我找到了一个非常简单并且高效的方式,就是直接去搜索这个白点,注意到白点是一个连通区域,像素值为(245,245,245)的像素个数稳定在
2018年1月6日

资深算法工程师万宫玺:Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 分享总结

去声明一个具体的张量时候,是在堆外内存存储张量对象,堆上内存只存储张量对象的引用。设计的原因主要是我们所依赖张量运算库,大部分的运算空间都是在堆外内存上,把数据放到堆外内存可提高运行效率。
2018年1月5日

Facebook 发布 wav2letter 工具包,用于端到端自动语音识别

https://s3.amazonaws.com/wav2letter/models/librispeech-glu-highdropout.bin注意:该模型是在
2018年1月4日

10分钟搞懂参数梯度 | Neural Networks #12

Brain的蒙特利尔办公室担任助理研究员一职,同时也在位于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学任教,兼任客座教授。
2018年1月4日

从深度学习到机器人控制,2017 人工智能新开发工具盘点

年,在深度学习技术的加持下,CV、NLP、数据分析等领域全面开花,同时大量新开发工具和开源软件的涌现,降低了人工智能开发的门槛,加速了深度学习的普及。本文从深度学习、CV、NLP
2018年1月4日

10分钟搞懂激活函数求导 | Neural Networks #11

Brain的蒙特利尔办公室担任助理研究员一职,同时也在位于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学任教,兼任客座教授。
2018年1月3日

Adam那么棒,为什么还对SGD念念不忘 (3)

制定一个合适的学习率衰减策略。可以使用定期衰减策略,比如每过多少个epoch就衰减一次;或者利用精度或者AUC等性能指标来监控,当测试集上的指标不变或者下跌时,就降低学习率。
2018年1月3日

2017 深度学习框架发展大盘点——迎来 PyTorch,告别 Theano

模型的训练和部署,人们通常都会联想到大数据中心或超级计算机。之所以会出现这种现象,是因为小型计算设备在大规模图像、视频、文本和语音处理上具有明显的短板,无论在速度还是可靠性上都远远不及大型数据中心。
2018年1月2日

Adam那么棒,为什么还对SGD念念不忘 (2)

另一方面,Adam之流虽然说已经简化了调参,但是并没有一劳永逸地解决问题,默认的参数虽然好,但也不是放之四海而皆准。因此,在充分理解数据的基础上,依然需要根据数据特性、算法特性进行充分的调参实验。
2018年1月2日

Adam那么棒,为什么还对SGD念念不忘 (1) —— 一个框架看懂优化算法

由于AdaGrad单调递减的学习率变化过于激进,我们考虑一个改变二阶动量计算方法的策略:不累积全部历史梯度,而只关注过去一段时间窗口的下降梯度。这也就是AdaDelta名称中Delta的来历。
2018年1月1日

10分钟搞懂隐层梯度 | Neural Networks #10

Brain的蒙特利尔办公室担任助理研究员一职,同时也在位于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学任教,兼任客座教授。
2018年1月1日

2017年度好视频,吴恩达、李飞飞、Hinton、OpenAI、NIPS、CVPR、CS231n全都在 | 雷锋字幕组

完全无需人工特征、无需任何人类棋谱、甚至无需任何特定优化,只需要几个小时的训练时间,就可以超越此前最好的算法甚至人类世界冠军,这是算法和计算资源的胜利,更是人类的顶尖研究成果。
2017年12月31日

GAN 做图像翻译的一点总结

在图像翻译任务上的方法越来越多,pix2pix,CycleGAN,UNIT,DTN,FaderNets,DistanceGAN,GeneGAN,pix2pixHD,StarGAN
2017年12月30日

现在 tensorflow 和 mxnet 很火,是否还有必要学习 scikit-learn 等框架?

主要适合中小型的、实用机器学习项目,尤其是那种数据量不大且需要使用者手动对数据进行处理,并选择合适模型的项目。这类项目往往在
2017年12月29日

10分钟搞懂输出层梯度 | Neural Networks #9

Brain的蒙特利尔办公室担任助理研究员一职,同时也在位于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学任教,兼任客座教授。
2017年12月28日

初学者应该参加哪些 Kaggle 比赛? | 社区问答

具体来说,我会按顺序推荐以下内容:二进制分类:泰坦尼克号:从灾难中学习机器(https://www.kaggle.com/c/titanic
2017年12月28日

2017 十大最受欢的迎机器学习 Python 库

管理工作流程。但是,你如何向那些不知道怎样使用这些工具的人分享你的工作呢?你该怎样构建一个交互界面,使人们可以轻松地处理数据,并让整个过程可视化?过去,你需要一个专业的
2017年12月27日

10分钟搞懂损失函数 | Neural Networks #8

Brain的蒙特利尔办公室担任助理研究员一职,同时也在位于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学任教,兼任客座教授。
2017年12月27日

10分钟学会经验风险最小化 | Neural Networks #7

Brain的蒙特利尔办公室担任助理研究员一职,同时也在位于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学任教,兼任客座教授。
2017年12月26日

深度学习如何影响运筹学?

问题;训练神经网络的梯度下降算法,是在使得训练误差极小化意义下的一个局部优化算法。推而广之,绝大部分机器学习模型的训练过程,都是首先将其建模为一个运筹学问题,然后采用相应算法来求解的。
2017年12月25日

基于典型相关分析的词向量

1.0]其中每个元素的具体数值则由训练来确定。这样一来就克服了在深度学习中可能的维度灾难,而且充分利用了空间,如果使用适当的训练方法训练出来的词向量还可以直接根据两个词之间的距离来计算相似性。
2017年12月25日

10分钟探索神经网络背后的生物学启发 | Neural Networks #6

Brain的蒙特利尔办公室担任助理研究员一职,同时也在位于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学任教,兼任客座教授。
2017年12月25日

一次 PyTorch 的踩坑经历,以及如何避免梯度成为NaN

-th.log(((probnb*gtind).sum(-3)*gtdf).sum(-3)/gtdf.sum(-3))otherSideEdgeLossMap[~tots(edge)]
2017年12月24日

深度学习的教学和课程,与传统 CS 的教学和课程有什么区别?

Windows。这一点对于本科学生来说更不友好,因为从成本角度学校很难提供硬件支持,也没有导师愿意购买设备供大家使用。我个人比较看好的方法还是学校和云服务厂商合作,保证注册课程的学生在上课期间可以有
2017年12月23日

转行人士如何在人工智能领域保持一定的竞争力?

那如果我只想去互联网公司呢?建议还是找有关联的部门,比如你以前做游戏方向的可以去游戏部门,做财务的去互联网金融部门。我觉得最需要避免的就是学金融的非要去设计游戏AI,学化学的非要做底层算法库开发。
2017年12月21日

10分钟搞懂神经网络的容量 | Neural Networks #5

Brain的蒙特利尔办公室担任助理研究员一职,同时也在位于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学任教,兼任客座教授。
2017年12月21日

10分钟搞懂多层神经网络 | Neural Networks #4

Brain的蒙特利尔办公室担任助理研究员一职,同时也在位于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学任教,兼任客座教授。
2017年12月20日

继 “Angel” 开源后,腾讯又开放 TDinsight 机器学习平台

机器学习平台是为政企提供的一站式机器学习平台。用户通过可视化的拖曳布局,组合各种数据源、组件、算法、模型和评估模块,支持各种主流的开源机器学习框架,包括
2017年12月20日

10分钟搞懂单个神经元的能力 | Neural Networks #3

Brain的蒙特利尔办公室担任助理研究员一职,同时也在位于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学任教,兼任客座教授。
2017年12月19日

分享一波关于做 Kaggle 比赛,Jdata,天池的经验,看完我这篇就够了。

这些比赛的套路从根本上都是一毛一样的,我下面可以和大家探讨一个大致的做题套路以及怎么往高分走的方向,但是总结来说这就是个拼体力的任务,和智力无关。(虽然锻炼了动手能力,极大强化了我在
2017年12月17日

如何用 RNN 实现语音识别?| 分享总结

把语音数据特征提取完之后,其实就和图像数据差不多了。只不过图像数据把整个矩阵作为一个整体输入到神经网络里面处理,序列化数据是一帧一帧的数据放到网络处理。
2017年12月16日

如何成为一名对话系统工程师?

上面的各种机器人都是为解决某类特定问题而被提出的,我们前面也分开介绍了各个机器人的主要组件。但这其中的不少组件在多种机器人里都是存在的。例如知识图谱在检索型、任务型和闲聊型机器人里也都会被使用。
2017年12月16日

2017 Google 开发者大会全记录

体验,现在在测试阶段,提供流畅的用户体验,并在所有网络条件下可靠无缝地运行。用户可以通过手机网站撰写和分享自己的微博信息,即使在网络条件较差的情况下,也可以继续浏览微博内容,欣赏图片和视频。
2017年12月14日

10分钟搞懂常用激活函数 :linear、Sigmoid、tanh、Relu | Neural Networks #2

Brain的蒙特利尔办公室担任助理研究员一职,同时也在位于加拿大的蒙特利尔大学、舍布鲁克大学等多所大学任教,兼任客座教授。
2017年12月14日

微软发布量子开发工具包免费预览版 | 快讯

量子开发工具包是微软建立强大成熟的量子计算系统计划的重要组成部分,量子计算系统涵盖了从量子计算硬件到完整软件堆栈的各个方面,微软的研究人员还在开展量子计算领域的密码学和安全特性等有针对性的项目研究。
2017年12月14日

Google Brain 大牛亲授!只需10分钟!好看好上手的神经网络在线课!

Brain是谷歌公司2011年启动的智慧产品,现有的20名核心团队成员,全部都是专注于机器学习领域的计算机科学专家,Jeff
2017年12月13日

TensorFlow实现神经网络入门篇

每个库都有自己的“实施细节”,即按照其编码模式编写的一种方法。例如,在执行scikit-learn时,首先创建所需算法的对象,然后在训练集上构建一个模型,并对测试集进行预测。例如:
2017年12月12日

开源神经网络框架Caffe2全介绍

在这项任务里,我们把本来需要好几天的训练量,用1个小时的时间训练完了。而且我们用的是全开源的软件框架,深度学习用Caffe2,网络调度同步用我们开源的gloo,硬件就是你也能买得到的英伟达的GPU。
2017年12月11日

比AlphaGo Zero更强的AlphaZero来了!8小时解决一切棋类!| 快讯

个人一直认为MCTS+深度网络是非常强的组合,因为MCTS可为深度网络补充逻辑性。我预测,这个组合未来会在更多场合显示威力,例如有可能真正实现自动写代码,自动数学证明。
2017年12月7日

图片数据集太少?Keras Image Data Augmentation 各参数详解

data_format=K.image_data_format())官方提供的参数解释因为太长就不贴出来了,大家可以直接点开上面的链接看英文原介绍,我们现在就从每一个参数开始看看它会带来何种效果。
2017年12月4日

用GPU加速深度学习: Windows安装CUDA+TensorFlow教程

而现实生活中我们都有各种各样的制约,比如系统版本限制、比如有限的显卡预算。这也是我写这篇教程的目的,我不希望这些原因成为阻碍你探索研究的障碍。希望我的这篇文章为你的深度学习之路做出了一点微小的贡献。
2017年11月29日

如何在NLP领域干成第一件事?

3.文本挖掘(或者文本数据挖掘):包括文本聚类、分类、信息抽取、摘要、情感分析以及对挖掘的信息和知识的可视化、交互式的表达界面。目前主流的技术都是基于统计机器学习的。
2017年11月27日

内推时间 | AI研习社帮你找了30个职位

百度多模搜索部语音搜索业务,让无线搜索插上翅膀,打造最酷的语音搜索。期待你加入我们,参与定义未来搜索的交互体验。豪华的团队,战略级业务,最牛的技术,最好的产品,一起战斗!我们在等你,一起改变世界!
2017年11月27日

深度学习入门指北——从硬件到软件

内容过于简单笼统,以至于不能提供如何将深度学习应用在实践中或者创造最先进模型所需的信息或技能。如果你仅仅需要一个整体的概览,这些内容没有问题。但是如果你想学会如何应用深度学习,这却是远远不够的。
2017年11月26日

深度学习岗位面试问题一览

1.CNN最成功的应用是在CV,那为什么NLP和Speech的很多问题也可以用CNN解出来?为什么AlphaGo里也用了CNN?这几个不相关的问题的相似性在哪里?CNN通过什么手段抓住了这个共性?
2017年11月21日

AI研习社问答社区开业大吉!欢迎你来~

自今年2月14日以来,AI研习社已经正式运营了九个月,社长一直努力为大家推送更好、更实用的内容,期望能够在大家的学习、研究、工作中也做出一份自己的贡献。很惭愧,就做了一点微小的工作。
2017年11月20日

【回顾】天池医疗AI大赛冠军团队算法分享:肺部结节智能检测

分享人:王东,北京大学信息科学技术学院硕士研究生。所参与团队曾获得LUNA2016结节检测竞赛第一名,Kaggle
2017年11月19日

从事人脸识别研究必读的N篇文章

2013.入选理由:LFW是目前最接近实际数据的人脸识别库,虽然其测试协议有一些不尽合理的地方,但是如果能在LFW上面取得非常好的效果,说明方法还是比较好的。而这篇MSRA
2017年11月18日

Google正式发布TensorFlow Lite预览版,针对移动/嵌入设备的轻量级解决方案

可以在许多平台上运行,从机架上大量的服务器到小型的物联网设备,但近几年,随着大家使用的机器学习模型呈指数级增长,因此需要将训练模型的平台扩展到移动和嵌入式设备上。TensorFlow
2017年11月16日

谷歌的新CNN特征可视化方法,构造出一个华丽繁复的新世界

近日,来自谷歌大脑和谷歌研究院的一篇技术文章又从一个新的角度拓展了人类对神经网络的理解,得到的可视化结果也非常亮眼、非常魔性,比如下面这样,文中的结果也在Twitter上引发了许多关注和讨论。
2017年11月14日

TensorFlow全新的数据读取方式:Dataset API入门教程

在Eager模式中,创建Iterator的方式有所不同。是通过tfe.Iterator(dataset)的形式直接创建Iterator并迭代。迭代时可以直接取出值,不需要使用sess.run():
2017年11月13日

谷歌推出开源 Python 库“Tangent”,支持前向模式自动微分

在图像、视频、音频和文本机器学习模型中,神经网络(NNs)的出现带来了巨大的进步。其实在这些任务中,训练神经网络的基本概念已经存在30年了,我们通常称之为反向模式自动微分(reverse-mode
2017年11月13日

最好奇的Top5连问:你是怎么踏入深度学习大门的?

A:大概两个多月前,偶然在朋友圈看到字幕组翻译的一篇文章,觉得选材和排版都很好,又正好看到文章最后在招人,就果断入了,在此特别感谢囧囧的姐姐,负责字幕组的组织协调工作。
2017年11月11日

【回顾】视见医疗陈浩:从MICCAI2017一窥医疗影像的最近进展

此次公开课我们请到香港中文大学博士陈浩为大家介绍“人工智能在临床医学影像计算与分析中的应用”这一研究热点,主要从方法、思路、如何结合问题解决的角度介绍了医疗影像领域重要会议MICCAI
2017年11月10日

CS231n 2017 今天正式开课!双语字幕版独家上线!

通过查看官方课程表,我们可以看到CS231n课程资源主要由授课视频与PPT,客座讲座,授课知识详解笔记,课程作业,课程项目五部分组成。其中:
2017年11月10日

深度学习中如何选择一款合适的GPU卡的一些经验和建议分享

有了这篇文章中提供的所有信息,你应该能够考虑选择哪一种合适的GPU,综合考虑所需的内存大小,带宽(GB/s)大小和GPU的价格,这一思路在未来很久也适用。最后,如果有足够的资金,建议购买GTX
2017年11月9日

如何有效处理特征范围差异大且类型不一的数据?

代表该变量可取的值得总数。此处也要注意,不是每种顺序对每个问题都是有意义的。比如假设一个变量可以取三个值:“头等舱”,“商务舱”,“经济舱”,对于票价而言是有顺序的,但对于到达时间,这三者是无序的。
2017年11月7日

玩机器学习要知道哪些开源数据库?

地址:http://metamind.io/research/the-wikitext-long-term-dependency-language-modeling-dataset/
2017年11月5日

如何看待 Hinton 那篇备受关注的Capsules论文?

document.getElementById('js_content').addEventListener("selectstart",function(e){
2017年11月3日

OpenAI 提出层级强化学习,给长序列动作学习带来新的曙光

的研究人员们提出了一种基于层次化强化学习的解决方案。这种方法中,智能体用几个高层次动作组成的序列表征复杂的行为。这样一来,智能体就可以解决复杂得多的任务:整个解决方案中可能需要
2017年11月2日

【回顾】深鉴科技姚颂:深度学习处理架构的演进

“人工智能等于深度学习”,但其实人工智能的范围大于机器学习,机器学习的范围又大于深度学习。人工智能由三方面共同组成,算法、数据以及计算平台,这个领域的上升也是三方面技术的共同发展合力造成的。
2017年11月2日

深度学习面试你必须知道这些答案

;非参数模型不依赖于特定的概率模型,它的参数是无穷维的,数据集的规模的大小影响着模型使用更多或者更少的参数来对其进行建模。(并未在书中找到准确的答案,若有更好的回答,请联系我改正)
2017年11月1日

如何准备机器学习工程师的面试?

(编程、基础算法、机器学习算法)。从本次关于算法工程师常见的九十个问题大多是各类网站的问题汇总,希望你能从中分析出一些端倪,文末附了部分参考的答案。
2017年10月30日

【回顾】基于 LSTM-RNN 的语音声学建模技术

月毕业于西北工业大学并获得硕士学位。研究方向是语音识别声学建模,深度学习,机器学习。
2017年10月29日

全文翻译Hinton那篇备受关注的Capsule论文

的数据及上测试了胶囊模型,在用了不同的超参和7个模型集成(其中每个模型都通过图像中24x24的小块进行三次路由迭代)后得到10.6%的错误率。这里的图片都是三个颜色通道的,作者们一共用了64种不同的
2017年10月29日

强化学习在生成对抗网络文本生成中扮演的角色(Role of RL in Text Generation by GAN)(下)

出完整序列来给鉴别器打分,而另一种则直接将部分序列加入鉴别器的训练过程,得到可以为部分序列打分的鉴别器,一个较慢,另一个快却损失准度,如何选择就看大家了。
2017年10月28日

【回顾】如何用超大规模真实驾驶视频数据集做端到端自动驾驶

自动驾驶是人工智能落地的重要应用之一,许多业界公司和学校实验室都在以自己的方法研究自动驾驶系统。AI研习社请到了许华哲博士介绍他们团队研究的端到端自动驾驶系统。
2017年10月28日

PyTorch 到底好用在哪里?

深度学习炼丹的过程中,我们肯定都有许多奇思妙想,但这些奇思妙想需要做实验来验证。如果实现比较困难费时,在不确定这个想法是否有效的情况下,我们很容易打退堂鼓。PyTorch
2017年10月28日

强化学习在生成对抗网络文本生成中扮演的角色(Role of RL in Text Generation by GAN)(上)

Learning,RL)由于其前卫的学习方式,本不如监督学习那么方便被全自动化地实现,并且在很多现实应用中学习周期太长,一直没有成为万众瞩目的焦点,直到围棋狗的出现,才吸引了众多人的眼球。
2017年10月27日

如何通过剃度上升实现可视化卷积核?

同理,第2张图,第3张图,都是这样的结果,连我学文科的妹纸看到这些图就yaya叫,这是什么,好恶心,怎么第3张有点像鸟但是有不是鸟的呢。对,我们搞神经网络的就喜欢这些恶心的图片。越恶心特征越明显。
2017年10月26日

为什么『无监督集成学习』乏人问津?

在监督学习中,即使每个基学习器的类型不同,最终的输出可能都是预测分类,比如0或者1。而无监督学习不同,基学习器的预测结果可能有不同的含义,比如K-means的输出结果是距离,而Isolation
2017年10月25日

Kaggle亚马逊比赛冠军专访:利用标签相关性来处理分类问题

近日,我们采访到本次比赛的冠军选手bestfitting,在访谈中,他为我们详细讲述了他是如何集成11个精细调节的卷积网络以及怎样利用标签相关性结构的,此外,他也谈到为了避免过拟合的一些想法。
2017年10月24日

Intel发布开源增强学习框架Coach

在Coach中集成了过去几年引入的各种Agent类型的实现方式,这让用户解决具有不同需求和与代理交互的方式的环境,例如连续和离散的动作空间,视觉观察空间或仅包括原始测量的观察空间。
2017年10月23日

【回顾】从数据采集与标记行业看数据与深度学习之关系

标注平台数据科学家,专注于数据众包策略研究、深度学习模型数据采集与标记方案咨询及优化。
2017年10月23日

基于深度学习的医疗影像论文汇总(Deep Learning Papers on Medical Image Analysis)

PS:暑假师兄做的work投到了TBME,最近我接着师兄的work继续做。我们的任务是Kaggle比赛的糖尿病视网膜病变检测(Diabetic
2017年10月22日

学术青年分享会每周预告(10.24-10.26)

分享人:陈浩,视见医疗创始人兼首席科学家,在香港中文大学取得博士学位并获得香港政府博士奖学金,本科毕业于北京航空航天大学并获得金质奖章。研究兴趣包括医学影像计算,机器学习(深度学习),
2017年10月22日

【AI听】AlphaGo Zero实力碾压旧狗!世界首款人工智能芯片华为发布,英特尔新推Nervana神经网络处理器……

无需进行随机推演(Rollout)——这是一种在其他围棋程序中广泛使用于胜负的快速随机策略,从而通过比较确定每一手之后输赢的概率选择最佳落子位置,相反,它依赖于高质量的神经网络来评估落子位置。
2017年10月22日

用一张单色图像生成高质量3D几何结构 | 2分钟读论文

人类可以轻易地基于2D彩色图片,建立3D几何模型。在电子游戏和动画电影中,这样的例子不胜枚举。如果我们想要在游戏中新增一种武器,通常美术师可以根据简单的一副照片,就可以绘制出一个相似的3D几何模型。
2017年10月21日

100:0!Deepmind Nature论文揭示最强AlphaGo Zero,无需人类知识

无需进行随机推演(Rollout)——这是一种在其他围棋程序中广泛使用于胜负的快速随机策略,从而通过比较确定每一手之后输赢的概率选择最佳落子位置,相反,它依赖于高质量的神经网络来评估落子位置。
2017年10月20日

如何理解Nvidia英伟达的Multi-GPU多卡通信框架NCCL?

N/B,条件是S远大于K,即数据的份数大于节点数,这个很容易满足。所以通信时间不随节点数的增加而增加,只和数据总量以及带宽有关。其它通信操作比如reduce、gather以此类推。
2017年10月19日

复旦大学Ph.D沈志强:用于目标检测的DSOD模型(ICCV 2017) | 分享总结

2017上的工作,主要是做网络压缩。我们用了一个衡量channel是否重要的值来训练模型,然后剔除掉不太重要的特征层。论文代码我们也放在github上了。具体细节大家可以参见论文Learning
2017年10月19日

史上最好记的神经网络结构速记表(上)

所以我决定写篇文章归纳归纳,各种神经网络结构。它们大部分都是神经网络,也有一些是完全不同的结构。虽然所有结构说起来都是新颖而独特的,但当我画出结点的结构图时……它们之间的内在联系显得更有意思。
2017年10月19日

机器学习经典算法优缺点总结

在某些噪声较大的分类和回归问题上会过拟合。对于有不同级别的属性的数据,级别划分较多的属性会对随机森林产生更大的影响,所以随机森林在这种数据上产生的属性权值是不可信的。
2017年10月18日

Video ++孙兆民:人工智能行业报告——视频内容识别行业分析 | 分享总结 | 雷锋网

当前基于大数据、云存储为代表的技术革命爆发,加上运算速度的大幅提升、算法瓶颈的突破以及相关政策法规的推进,人工智能在近几年出现了突飞猛进的发展,特别是在智能医疗、无人驾驶、智能安防和文娱社交等领域。
2017年10月18日

电子科大PhD:基于深度学习的中文唇语识别 | 学术青年分享会

戴锡笠,电子科技大学计算机系二年级博士生,他的研究方向在于计算机视觉,移动计算,深度学习。曾于海康威视研究院实习,研究内容为基于序列的行人再检索。
2017年10月18日

PyTorch vs. TensorFlow月度使用体验总结

Hannun也曾发文撰写了这两个框架之间的主要差异,详情可以参见用PyTorch还是TensorFlow?斯坦福大学CS博士生带来全面解答(http://t.cn/RN8Pr6S)。
2017年10月18日

电子科大PhD:基于深度学习的中文唇语识别 | 学术青年分享会

戴锡笠,电子科技大学计算机系二年级博士生,他的研究方向在于计算机视觉,移动计算,深度学习。曾于海康威视研究院实习,研究内容为基于序列的行人再检索。
2017年10月17日

【回顾】深度学习在语音生成问题上的典型应用

单通道语音增强的方法主要分为三大类。基于深度学习的语音增强方法下面会做详细一些的介绍。这里也是利用了深度学习强大的非线性建模的能力,在匹配的环境下优势很明显,在处理非平稳噪声的时候也有一定的优势。
2017年10月17日

YOLO9000好棒好快好强壮 阅读笔记

box,如果有大神知道代表什么,十分欢迎指出)来限制输出的大小。当网络遇到检测数据集中的图片时则正常地反方向传播,当遇到分类数据集图片的时候,只使用分类的loss功能进行反向传播。
2017年10月17日

FPL 2017最佳论文:如何对FPGA云发动DoS攻击?

允许用户自己设置FPGA实现运算加速的系统中,无疑暴露了巨大的安全隐患。这导致整台服务器需要重新启动。如果系统是通过不可替换的电池供电的话,FPGA将陷入永久的DoS状态。
2017年10月16日

深鉴科技姚颂:深度学习处理架构的演进 | 学术青年分享会

姚颂,深鉴科技联合创始人、CEO。毕业于清华大学电子系,斯坦福大学研究访问学者。曾任清华电子系科协主席,本科期间发表多篇论文。入选2017福布斯中国30位30岁以下精英榜。
2017年10月16日

CNN到底认为哪个投影方向是重要的?——SVDNet for Pedestrian Retrieval

文中关于上述保距去相关的证明公式非常明了,然而,“想”一个做法比“证明”一个做法远远要难的多。作者这个做法其实最早来自于一个直观解读:CNN的每个线性层把输入投影到了新的特征空?
2017年10月16日

分分钟带你杀入Kaggle Top 1%

我们应该尽可能多地抽取特征,只要你认为某个特征对解决问题有帮助,它就可以成为一个特征。特征抽取需要不断迭代,是最为烧脑的环节,它会在整个比赛周期折磨你,但这是比赛取胜的关键,它值得你耗费大量的时间。
2017年10月15日

微软携手亚马逊推出全新Gluon深度学习库,全面支持符号式和命令式编程

Gluon通过hybridization实现这一点:静态计算图先被计算出来,然后在随后的迭代中缓存和重用。计算图也可以被导出,例如给移动设备提供服务。
2017年10月15日

深度学习目标检测概览

在拥有廉价无人机和可支付的起的卫星服务之前,我们从没有这么多地球的俯视图。可是那时候就已经有公司开始使用目标检测技术来计算卫星图中的车,树和轮船了,就像Planet和Descartes
2017年10月14日

谷歌发布TensorFlow Lattice:得益于先验知识,提升模型泛化能力

tutorials地址:https://github.com/tensorflow/lattice/blob/master/g3doc/tutorial/index.md
2017年10月14日

下周学术青年分享会预告

分享人:姚颂,深鉴科技联合创始人、CEO。毕业于清华大学电子系,斯坦福大学研究访问学者。曾任清华电子系科协主席,本科期间发表多篇论文。入选2017福布斯中国30位30岁以下精英榜。
2017年10月14日

DeepMind AI 是如何识别音视频概念的? | 2分钟读论文

无监督学习在过去的几十年里一直在持续发展,但是像本期论文这样振奋人心的研究成果并不多见,可以说是意义深远,希望在不久的将来,会有更多更好的研究成果,一直不断推动机器学习领域的发展。
2017年10月13日

IJCAI 2017提名最佳学生论文作者解读 | 学术青年分享会

论文地址:https://pdfs.semanticscholar.org/aca8/c4a62ed6e590889f1e859d7bc79311fa6f4d.pdf
2017年10月13日

这六段代码隐藏着深度学习的前世今生!

勒让德将最小二乘法运用于计算彗星轨道,首先是猜测彗星将来出现的位置,然后计算这一猜测值的平方误差,最后通过修正猜测值来减少平方误差的总和,这就是线性回归思想的源头。
2017年10月13日

【回顾】借鉴师生互动模式来训练机器学习模型

张鹏博,香港科技大学博士在读,于工程学院工业工程与物流管理系(即统计与运筹学系)从事机器学习的相关研究工作。他的研究兴趣包括机器学习、深度学习、优化、智能系统。
2017年10月12日

IJCAI 2017提名最佳学生论文作者解读 | 学术青年分享会

论文地址:https://pdfs.semanticscholar.org/aca8/c4a62ed6e590889f1e859d7bc79311fa6f4d.pdf
2017年10月12日

卷积神经网络工作原理直观的解释?

的提出,通过对图片进行五层(不知道有没有记忆错误)的卷积,然后后面三层的全连接,我们可以得到一个很好的结果,特别的相对于更大的数据集而言,最好参数越多越好,也就是网络最好更加深,更加的宽。
2017年10月12日

Kaggle 机器学习之模型融合(stacking)心得

因为这张图极具‘误导性’。(注意!我没说这图是错的,尽管它就是错的!!!但是在网上为数不多教学里有张无码图就不错啦,感恩吧,我这个小弱鸡)。
2017年10月11日

NIPS 2017论文作者解读 | 学术青年分享会

在此之前,他曾在芝加哥大学自然科学学院获得硕士学位,并在华中科技大学电子信息工程系获得学士学位。他曾在微软研究院和丰田技术研究所实习。
2017年10月11日

数值计算——「Deep Learning」读书系列分享第四章分享总结

假设这是其中的两个列向量,取了其中一个列向量上的点。这两个列向量过于接近的话,对点进行一个微小的变化,它就有可能跑到了另外一个向量上,就是说它的解发生了发生了很大的变化;按理说这个点是属于向量
2017年10月11日

【回顾】搜狗研究员讲解基于深度学习的语音分离

种真实噪声和噪声基产生的数据混合在一起,性能可以比单独使用真实噪音的情况得到进一步提高。这也说明噪声基生成的噪声和真实噪声数据之间有着互补性,在实际应用中也可以解开一些真实噪声数据不足带来的限制。
2017年10月10日

【直播】搜狗研究员:基于LSTM-RNN的语音声学建模技术 | 学术青年分享会

张弼弘,2017年4月毕业于西北工业大学并获得硕士学位。研究方向是语音识别声学建模,深度学习,机器学习。目前就职于搜狗。
2017年10月10日

Theano 停止更新之后,开发者们怎么说?

都是是深度学习开发与研究的行业标准。比起深度学习库,它更像是一个研究平台,你需要从底层开始做许多工作,来创建自己需要的模型,这就意味着它的灵活性很强。
2017年10月10日

UC Berkeley 博士:端到端自动驾驶与自动驾驶前沿研究内容 | 学术青年分享会

。本次工作的核心是定义了如何从视觉的角度通过深度学习来实现自动驾驶,并且与英伟达、CMU的ALVINN的工作不同,不仅仅在路况简单的情况下可以实现“车道跟随”(lane
2017年10月9日

如何用 MOOC 组合掌握机器学习?

通过前面两门课,你理解了什么是机器学习和深度学习。但是你可能不愿意只停留在概念理解上,却很想做出些东西来实践。实践应用一方面可以检验你学习的效果,另一方面可以帮助你积累经验,同时还可以带来成就感。
2017年10月9日

从DL到Hinton到GANs再到PyTorch,这里全都有了!| 国庆特辑巨无霸 · 最终回

document.getElementById('js_content').addEventListener("selectstart",function(e){
2017年10月8日

PyTorch 合辑 | 国庆特辑

医疗大赛初赛结束,官方正在为复赛进行平台调试,复赛时间一拖再拖。看着几位同学在比赛中排名都还很不错,于是决定抽空试一试。结果一发不可收拾,又找了两个同学一起组队(队伍
2017年10月7日

GANs合辑 | 国庆特辑

为例进行介绍,两者在本质上没有差别,只在细微的参数上有所调整。由于穷学生资源有限,没有对模型增加迭代次数,也没有构造更深的模型。并且也没有选取像素很高的图像,高像素非常消耗计算量。
2017年10月6日

入门合辑,不知道该怎么入门的可以看这里 | 国庆特辑

因此,这篇文章对于已经身处机器学习领域可能帮助不大。同时再次声明这只是我的个人看法,请大家有选择的性阅读,探索适合自己的学习方法。
2017年10月5日

2分钟论文系列合辑 | 国庆特辑

几年前,我们见证了神经网络和学习算法的快速兴起。人工智能时代正在到来,探索过程中也不可避免出现一些失败的尝试,有些失败的项目往往有迹可循,因为算法足够简单,我们可以以管窥豹,做出合理的猜想。
2017年10月4日

深度学习之父Geoffrey Hinton的神经网络合集(中文字幕首发)| 国庆特辑

本期课程以经典的手写数字识别问题为例,详细讲解神经网络是如何从杂乱无章的图像中学习到潜在特征,并完美地区分不同数字的。主要步骤:设计简单的双层网络结构,数据准备,权值初始化,模型训练及权值动态更新。
2017年10月3日

Deep Learning解读合辑 | 国庆特辑

这一部分主要是深度学习的一些基本介绍、一些发展历史。可以看一下这个封面,一幅漂亮的风景画,纽约中央公园遍地盛开的杜鹃花,仔细看有点不太正常,对了,这就计算机生成的,确切的说,是
2017年10月2日

【AI听】微软刷新了SQuAD记录!聊天机器人居然懂人类情感?谷歌大脑「神经网络优化器搜索」又双叒叕更新……

SQuAD很讨产业界的喜欢,参赛者包括来自微软总部及微软亚洲研究院、Salesforce、科大讯飞、谷歌以及卡内基·梅隆大学、复旦大学等知名企业研究机构和高校,目前在排行榜上,前三名均来自产业界。
2017年10月1日

Theano 退役,Bengio 发出告别信

不再是赋能创新研究思路发展和应用的最佳方式。即使来自行业和学术界的外部贡献越来越多,维护较老的代码库,跟上竞争对手的步伐可能也会阻碍创新。
2017年9月30日

输了输了! DOTA世界冠军被OpenAI完虐 | 2分钟读论文

不过,Denbi再怎么厉害,还是敌不过OpenAI的Bot。人机大战中,OpenAI的Bot不仅取得了胜利,还让Dendi的彻底崩溃了。Dendi在比了两场之后就悻悻退出。
2017年9月30日

【回顾】「Deep Learning」读书系列分享第二章:线性代数

从上到下是维度的逐渐提升。反过来从下往上,张量、矩阵、向量、标量,是不断降维的过程。所以前面的类型只是后面的一个特殊形式,比如说任意一个向量,是张量的一种特殊形式。简而言之,张量囊括一切。
2017年9月29日

【回顾】基于生成对抗网络的图像编辑方法—优必选悉尼 AI 研究院王超岳

常见的图像编辑有图像去雨(雪)、图像填充、素描到照片、风格转换、图像超分辨率、图像上色、图像旋转、时间变换等,抽象来说就是给定一张图像以及要求,来生成新的图像。即让机器理解图像和生成图像。
2017年9月29日

是时候回顾一下这些经典paper了 | AI阅读研究所·第2期

gradients),摒弃传统的顺序同步更新思维,通过预测梯度,异步更新。首先其思想就值得学习,目前深度学习多瓶颈,就需要创新的甚至是颠覆性多思维出现。”
2017年9月29日

如何用 3 个月零基础入门机器学习?

使用机器学习实现了交易策略案例。虽不可尽信,但对特定领域的深刻理解往往就是捅破窗户的那最后一层纸,只理解模型但不了解数据和数据背后的意义,导致很多机器学习模型只停留在好看而不实用的阶段。
2017年9月28日

Deep Learning读书分享——深度网络的正则化

『分享会』通过邀请学术界、工业界学者进行高质量内容分享,让广大学术青年了解最前沿的学术与行业技术进展,成为连接学术界与工业界之间的桥梁,并希望能够从中发现一大批优秀
2017年9月28日

基于深度学习的电商交易欺诈检测系统

在用户浏览行为里有一个非常重要的信息叫停留时间,停留时间比较难获取,我们采用了统计上比较符合常理的做法——把下一个页面点击的时间和上一个页面点击的时间减一下,然后认为是用户在这个页面上整体停留时间。
2017年9月27日

Deep Learning 读书分享 :前馈神经网络

『分享会』通过邀请学术界、工业界学者进行高质量内容分享,让广大学术青年了解最前沿的学术与行业技术进展,成为连接学术界与工业界之间的桥梁,并希望能够从中发现一大批优秀
2017年9月27日

英伟达发布 TensorRT 3 可编程推理加速器,比起 CPU 能实现高达 40 倍吞吐率

万台云服务器、上亿台汽车和制造机器人中;最终,以万亿计的物联网设备和传感器将智能地监测一切,从心率和血压监测,到需维修设备的震动监测;AI
2017年9月27日

浅析Geoffrey Hinton最近提出的Capsule计划

invariance,也就是对物体的平移之类的不敏感(物体不同的位置不影响它的识别)。这当然极大地提高了识别正确率,但是对于移动的数据(比如视频),或者我们需要检测物体具体的位置的时候,CNN
2017年9月26日

第17期 · 分享回顾 | 吴楚:Deep Learning 读书分享-机器学习基础

『分享会』通过邀请学术界、工业界学者进行高质量内容分享,让广大学术青年了解最前沿的学术与行业技术进展,成为连接学术界与工业界之间的桥梁,并希望能够从中发现一大批优秀
2017年9月24日

达观数据张健分享文本分类方法和应用案例 | 学术青年分享会

在序列标注/命名实体识别问题中,每个词都会有各自的标签;选用的词汇标签体系越复杂,标注精度就越高,但同时训练也就越慢。所以需要根据人力、时间等成本选择合适的标签体系。
2017年9月24日

DeepMind发布《星际争霸 II》深度学习环境 | 2分钟读论文

》行动和奖励规范,并提供一个开源的Python界面,用于与游戏引擎进行通信。暴雪提供游戏输入输出的API,DeepMind又做了层基于Python的封装。
2017年9月22日

CNN 中千奇百怪的卷积方式大汇总

个值,取完了这些值,就可以顺利使卷积核形变了。第二处就是使用变形的卷积核来卷积,这个比较常规。(这里还有一个用双线性插值的方法获取某一卷积形变后位置的输入的过程)
2017年9月22日

深度学习如何入门?

其实不必有畏难的情绪,个人很推崇李书福的精神,在一次电视采访中,李书福说:谁说中国人不能造汽车?造汽车有啥难的,不就是四个轮子加两排沙发嘛。当然,他这个结论有失偏颇,不过精神可嘉。
2017年9月21日

想知道机器学习掌握的怎么样了吗?这有一份自测题(附答案和解析)

首先使用所有特征来计算模型的准确度。我们选择一个特征,然后将测试集的该特征的数值都打乱,然后对打乱过的数据集进行预测。经过对预测模型的分析,如果模型准确率提高,则删掉这个属性
2017年9月20日

第14期 · 分享回顾 | 张东红:大数据环境下的恶意样本检测

『分享会』通过邀请学术界、工业界学者进行高质量内容分享,让广大学术青年了解最前沿的学术与行业技术进展,成为连接学术界与工业界之间的桥梁,并希望能够从中发现一大批优秀
2017年9月20日

深度学习要另起炉灶,彻底抛弃反向传播?

invariance,也就是对物体的平移之类的不敏感(物体不同的位置不影响它的识别)。这当然极大地提高了识别正确率,但是对于移动的数据(比如视频),或者我们需要检测物体具体的位置的时候,CNN
2017年9月19日

多任务深度学习框架在 ADAS 中的应用 | 分享总结

系统,基本上包括这些功能:夜视辅助、车道保持、司机提醒、防撞提醒、车道变换辅助、停车辅助、碰撞疏解、死角障碍物检测、交通标志识别、车道线偏移提醒、司机状态监测、远光灯辅助等。这些功能是
2017年9月18日

第 12 期 · 分享回顾 | Jackie:深度学习算法中的数值计算问题分析

分享人:Jackie,名古屋大学计算力学方向博士,主要从事计算力学数值方法研究
2017年9月18日

如何在 Kaggle 中高效搜索数据集?快吃下这枚安利

团队成员手工挑选的,有良好的文件记录、已经被清洗过并且随时可以使用。不过,并不是所有的数据集都是精选数据集,一些高质量的数据集可能还没有被精选。如果你想看到所有数据集,可以点击页面上
2017年9月18日

【AI 听】斯坦福 AI 算法辨别 Gay,30 秒发现九成肺癌乳腺,TensorFlow 新功能解锁……

一切关于农作物的播种等工序都由机器人代替。其中包括:根据大麦种子需要播种的特定深度来钻孔松土,并由自主劳作机器人控制大麦生长所需的间隔;在必要时,按需喷洒杀真菌剂、除草剂和化肥;自主收获。
2017年9月17日

第 9 期 · 分享回顾 | 袁雪:多任务深度学习框架在 ADAS 中的应用

分享人:袁雪,北京交通大学电子信息工程学院副教授,博士生导师。
2017年9月17日

如何利用机器学习预测房价?

Redfin(美国的两家大型房地产网站)或其他公司能够仅仅依靠一些房屋的文字数据来预测它们的价格呢?他们不能。这就是为什么我要把对房屋门口照片的分析作为其中一个特征纳入预测模型的原因。
2017年9月17日

「Deep Learning」读书系列分享第三章:概率和信息论 | 分享总结

常用的概率分布,均匀、伯努利;范畴分布里面就不再是一个值,而是多个值,实验一次有多种结果,相当于扔的是色子,而前面扔的是硬币,那么硬笔只有两种取值;还有高斯分布,也叫正态分布。
2017年9月16日

我搭的神经网络不 work 该怎么办!看看这 11 条新手最容易犯的错误

如果你的数据是图像,那么情况就很简单,相应的动画数据很好生成。但如果你的数据比较奇葩,也要找出一种合适的方法,能够在预处理、网络训练和数据传递的每个阶段来检查数据的正确性,将其与原始的真实数据比较。
2017年9月15日

Python赶超R语言,成为数据科学、机器学习平台中最热门的语言?

语言,成为分析、数据科学和机器学习平台中使用频率最高的语言。有关此次问卷更具体的情况如何?AI研习社将
2017年9月15日

我们应当如何理解视频中的人类行为?

即在时序动作边界模糊的情况下,我们是否能够来评估时序动作定位(时序动作检测)呢?略去实验,该文给出的结论是:尽管时序边界存在模糊性,目前的数据集还是允许我们对动作的时序边界进行理解,学习以及评估的。
2017年9月15日

第19期 · 分享回顾 | 人工智能行业报告:视频内容识别行业分析

关注公众号AI研习社(ID:okweiwu),回复“视频内容识别”即可获得PPT下载链接。
2017年9月15日

「用 AI 识别 xxx」,真的靠谱么?

尽管在机器学习方面,这篇文章做得很好,但是其余领域暴露出不少遗憾。这我可以归结为认知心理学与计算机科学的差异,至少在认知心理学方面伦理是极其需要看重的,所以我们先从伦理出发。
2017年9月14日

用验证机制加强神经网络的能力:研究者提出机器学习防御措施 | 2分钟读论文

几年前,我们见证了神经网络和学习算法的快速兴起。人工智能时代正在到来,探索过程中也不可避免出现一些失败的尝试,有些失败的项目往往有迹可循,因为算法足够简单,我们可以以管窥豹,做出合理的猜想。
2017年9月14日

TensorFlow 中 RNN 实现的正确打开方式

兼容。可以阅读此处的文档(地址:http://www.tensorflow.org/api_docs/python/tf/contrib/seq2seq)学习它的使用方法。
2017年9月13日

文档乱、调试难… TensorFlow 有那么多缺点,但为何我们依然待它如初恋? | 雷锋网

document.getElementById('js_content').addEventListener("selectstart",function(e){
2017年9月13日

如何用 TensorFlow 生成令人惊艳的分形图案

最后再安利一下项目地址:https://github.com/hzy46/tensorflow-fractal-playground。如果代码有什么问题可以直接发在评论里或者在
2017年9月12日

自拍抠图抠到手软?详解如何用深度学习消除背景

躯干——由于我们是通过程序自动化地过滤了数据集,所以无法判断一张包含有人物的图片是真的有一个人,还是说仅仅只有一些躯干,比如手或者脚。这些图像并不在我们的目标范围内,但是它们还是出现在了数据集中。
2017年9月12日

第18期 · 分享回顾 | 达观数据 NLP 技术的应用实践和案例分析

AI研习社,雷锋网旗下关注AI开发技巧及技术教程订阅号。
2017年9月12日

第17期 · 分享回顾 | 吴楚:Deep Learning 读书分享-机器学习基础

分享人:吴楚,数学专业硕士研究生,数据挖掘算法工程师,极其屌丝的程序猿
2017年9月12日

如何在 Kaggle 首战中进入前 10%

我们可以对数据进行一些统计上的测试来验证一些假设的显著性。虽然大部分情况下靠可视化就能得到比较明确的结论,但有一些定量结果总是更理想的。不过,在实际数据中经常会遇到非
2017年9月11日

如何使用高大上的方法调参数

这些问题,有些是重要的,有些是不那么重要的。有些如果设错了没有什么关系,有些设错了会导致神经网络直接就没用了。尤其是对于一个新的应用场景而言,找到那些对它最关键的问题并给予正确的答案,至关重要。
2017年9月11日

为什么说随机最速下降法 (SGD) 是一个很好的方法?

下面讨论一下证明,主要讨论一下第二篇。第一篇论文其实就是用数学的语言在说"在鞍点加扰动,能够顺着负的特征值方向滑下去"。第二篇非常有意思,我觉得值得介绍一下想法。
2017年9月10日

【直播】Deep Learning 读书分享 :机器学习基础

分享人:吴楚,数学专业硕士研究生,数据挖掘算法工程师,极其屌丝的程序猿
2017年9月9日

2017 知乎看山杯从入门到第二

http://t.cn/R924VDF)。这些为我们的入门打下了良好的基础,在比赛过程中也是反复研读和实践,在此感谢两位前辈的无私分享。
2017年9月9日

未来 3-5 年内,哪个方向的机器学习人才最紧缺?

使用机器学习实现了交易策略案例。虽不可尽信,但对特定领域的深刻理解往往就是捅破窗户的那最后一层纸,只理解模型但不了解数据和数据背后的意义,导致很多机器学习模型只停留在好看而不实用的阶段。
2017年9月9日

如何优雅地躲避学术地雷 | AI阅读研究所·第1期

https://www.exastax.com/artificial-intelligence/the-future-of-artificial-intelligence-predictions/
2017年9月8日

说到修图这件事,你还真是比不上AI | 2分钟读论文

首先,简单介绍一下“照片-风格”方面的技术革新。这是由微软亚洲研究院视觉计算组发明的一种新的前馈网络,适用于接近实时结果的前馈式风格转换,可以同时学习多种艺术风格,而训练和运行时间也都有很大的提升。
2017年9月7日

知乎“看山杯”夺冠记

“w2w34w234w54w909w2343w1"这种经过映射的词的形式,或者是”c13c44c4c5642c782c934c02c2309c42c13c234c97c8425c98c4c340"
2017年9月6日

完全图解RNN、RNN变体、Seq2Seq、Attention机制

可能有小伙伴发现没有LSTM的内容,其实是因为LSTM从外部看和RNN完全一样,因此上面的所有结构对LSTM都是通用的,想了解LSTM内部结构的可以参考这篇文章:Understanding
2017年9月5日

AMiner发布计算机领域知识图谱,包括20多万条专家信息、50多万篇出版论文

这个计算机领域的知识图谱包含1万个知识概念、概念关系以及概念定义,20万专家信息(专家和知识概念对应)以及50万相关论文。这个数据可以用来做一些领域信息理解,信息推荐和检索。
2017年9月5日

第16期 · 分享回顾 | 李柏顺:word2vec 技术在文本分析中的应用

分享人:李柏顺,本科毕业于湘潭大学数学专业,硕士毕业于中科院天体物理专业。2016
2017年9月5日

第15期 · 分享回顾 | 陈启峰:级联优化网络生成逼真图像

AI研习社,雷锋网旗下关注AI开发技巧及技术教程订阅号。
2017年9月5日

可能是最好玩的深度学习模型:CycleGAN的原理与实验详解

为了训练这么一个模型,我们需要分别准备好男性的图片和女性的图片。在实践中,我使用了CelebA数据集,分别取出其中男性和女性的图片并统一缩放到256x256的大小,然后存入两个文件夹中:
2017年9月4日

前Twitter资深工程师详解YOLO 2与YOLO 9000目标检测系统

9000,可以产生9418个类别的目标检测。首先是需要建立一个基于wordNet结构的wordTree。这个树包含imagenet上最流行的9000个分类,还有COCO的80个大类。YOLO
2017年9月3日

变形卷积核、可分离卷积?卷积神经网络中十大拍案叫绝的操作

标准的卷积过程可以看上图,一个2×2的卷积核在卷积时,对应图像区域中的所有通道均被同时考虑,问题在于,为什么一定要同时考虑图像区域和通道?我们为什么不能把通道和空间区域分开考虑?
2017年9月2日

DeepMind提出增强想象智能体 这次能帮你赢游戏 | 2分钟读论文

但是,就早期的算法而言,只要玩游戏的时间一长,它的表现就会变差。(比如,你家小汪在第一次吃到狗粮时开心得抓狂,但是越到后面刺激越弱,它也就不会为狗粮激动了。)
2017年8月31日

BAT资深算法工程师Deep Learning读书分享

什么是深度学习?书里面提到一句话“AI系统必须具备从原始数据提取模式的能力”,这个能力指的是机器学习。算法的性能在很大程度上是依赖于数据表示的,也就是“表示学习”,这是ML里的一大方向。
2017年8月30日

干货:图像比赛的通用套路有哪些?Kaggle比赛金牌团队为你解答

模型集成在一般比赛中都会用到,它是很重要的一个环节。在图像比赛中的地位相对来说没有那些文本比赛那么重要,因为图像比赛中,我们主要用的都是卷积神经网络之类,这些模型之间并不会有特别大的不同。
2017年8月29日

内推时间 | AI研习社帮你找了28个职位

岩心科技是一家创业公司。公司目前正运营一款基于移动购物场景的虚拟信用卡AKULAKU,已成为区域内第一家、规模最大、团队最成熟和发展速度最快的APP。
2017年8月28日

面试官如何判断面试者的机器学习水平?

如果你假装自己很了解一个不明白的领域,我们一般会问的更深入。你成功的引起了我的注意,那个时候就真的收不了场了。相似的,简历上请真的不要夸大其词的描述自己的经历。我见过很多人只用过Naive
2017年8月28日

七夕,用Geek的方式说爱你

AI研习社,雷锋网旗下关注AI开发技巧及技术教程订阅号。
2017年8月25日

看过10万个视频 AI才能识别你的脑残操作 | 2分钟读论文

此前这类数据集极少。但在最新发布的数据集中,有10万个贴有标签的视频可供学习。
2017年8月24日

人工智能开始玩《星际争霸2》 我们对它的研究环境进行了测试

(2)然后在国服下载mac版的星际争霸客户端:https://www.battlenet.com.cn/account/download/,mac版的,然后安装,30个G,3.16.1版本。
2017年8月23日

CVPR 2017精彩论文解读:显著降低模型训练成本的主动增量学习 | 分享总结

首先,把所有的未标注图片数据在大量自然图像中训练的网络,大家知道现在有很多常用的网络,从最初的LeNet、AlexNet、GoogLeNet、VGG、ResNet这样的网络中去测试一遍,得到预测值。
2017年8月22日

哇!原来你看到的小视频都出自他们之手 | 雷锋字幕组访谈录

后来,又在朋友圈看到了郭主编转发的一篇AI研习社招募字幕翻译志愿者的消息,还是Hinton大佬的视频,觉得蛮有趣的,才有幸邂逅了超赞的田老大以及字幕组的各位伙伴。
2017年8月19日
2017年8月17日

用GAN来做图像生成,这是最好的方法

为例进行介绍,两者在本质上没有差别,只在细微的参数上有所调整。由于穷学生资源有限,没有对模型增加迭代次数,也没有构造更深的模型。并且也没有选取像素很高的图像,高像素非常消耗计算量。
2017年8月11日

普林斯顿联合Adobe 连声音都能PS了 | 2分钟读论文

一般来讲,我们可以获取语音波形,也可以对语音波形进行编辑。但手工波形则非常困难,因为传统技术通常无法准确地找到波形中单词或字母的分界,更不用说编辑了。
2017年8月10日

第6期·分享回顾 | 王奇文:解读 Deep learning

分享人:王奇文(前百度、阿里资深算法工程师),先后做过推荐系统、分布式、数据挖掘、用户建模、聊天机器人
2017年8月10日

第1期·分享回顾 | 孙嘉睿:解读2017CVPR获奖论文

AI研习社,雷锋网旗下关注AI开发技巧及技术教程订阅号。
2017年8月10日

别人在刷屏而我在读书!吴恩达这本书是你踏入deeplearning.ai的必修课

目前已经更新到14章,它详细介绍了建立开发和测试集的方法,包括如何使用拜厄斯和方差来决定该做什么,为读者介绍学习曲线、调试推理算法等基本原理,以及提供不同情境下是否使用端到端的深度学习的建议等。
2017年8月9日

Google AI 实力打脸:你真的懂机器学习嘛?

如果你还不知道啥是高维空间,现在闭上眼睛想象,人是高维的,一个人的出生日期、出生地、研究领域,就是他的一个维度。
2017年8月8日

雾霾太重?深度神经网络教你如何图像去雾(附直播微信群)

Pooling)是深度卷积神经网络的经典操作。局部极值约束了透射率的局部一致性,可以有效抑制透射率的估计噪声。此外,局部极值也对应于暗通道先验(DCP)的局部最小值和最大对比度(MC)的局部最大值。
2017年8月7日

论黑科技的极致,大概就是谷歌Deepmind吧 | 2分钟读论文

第2期介绍谷歌Deepmind团队脑洞全开的黑科技PixelCNN,想要看大佬们怎么玩算法,猛戳下方视频。
2017年8月3日

看硅谷数据工程师如何使用TensorFlow构建、训练和改进RNN

这种典型的以人为中心的语音数据转换是计算梅尔频率倒谱系数(MFCC),有13或者26种不同的倒谱特征,可以作为这种模型的输入。经过这种转换,数据被存储在一个频率系数(行)随时间(列)的矩阵中。
2017年8月1日

GAN 的理解与 TensorFlow 的实现

representation?比如人脸数据集中有各种不同的属性特点,如脸部表情、是否带眼睛、头发的风格眼珠的颜色等等,这些很明显的相关表示,
2017年7月31日

GAN 学习指南:从原理入门到制作生成 Demo,总共分几步?

code:zhangqianhui/AdversarialNetsPapers(https://github.com/zhangqianhui/AdversarialNetsPapers)
2017年7月30日

CVPR 2017 精彩论文解读:显著降低模型训练成本的主动增量学习

Incrementally」(用于生物医学图像分析的精细调节卷积神经网络:主动的,增量的)。它主要解决了一个深度学习中的重要问题:如何使用尽可能少的标签数据来训练一个效果有潜力的分类器。
2017年7月29日

七步即可学会R语言,从此数据分析不再怕!

里面创建你自己的互动网站应用,比如这些(http://shiny.rstudio.com/gallery/)。网上有完整的学习门户,能专门建立自己的
2017年7月28日
2017年7月27日

让深度学习帮你创作爵士乐

我们会把损失函数定义为分类交叉熵,用两种概率分布间的交叉熵测量平均位数,需要从一系列的可能性中确定一个事件。因为数据已经输入序列中,交叉熵就能够测量出真正的下个音符与我们预测的下个音符之间的区别。
2017年7月26日

看完立刻理解 GAN!初学者也没关系

有一个初步的了解。从最终的模型结果来看,生成的图像能够将背景与数字区分开,黑色块噪声逐渐消失,但从显示结果来看还是有很多模糊区域的。
2017年7月25日

凭什么苹果夺得CVPR最佳论文?看完本文你就清楚!

我们请到了来自都柏林城市大学的叶腾琪Ph.D.来与我们共同分享这篇论文!
2017年7月24日

用Python做中文分词就是这么简单!

掌握了本方法后,你自己做出了一张什么样的中文词云图?除了做词云以外,你还知道中文分词的哪些其他应用场景?欢迎留言,分享给大家。我们共同交流讨论。
2017年7月21日

通过一个 Kaggle 实例学习解决机器学习问题

在这篇文章中可以学到一个完整的运用机器学习解决分析问题的过程,它包括了解决问题的一般流程,描述性统计的常用方法,数据清洗的常用方法,如何由给定的普通变量启发式思考其他影响因素,sklearn
2017年7月20日

手把手教你用Python 和 Scikit-learn 实现垃圾邮件过滤

词典创建好之后,我们只要在上面函数的基础上再加几行代码,就可以移除之前提到的那些非文字类符号了。这里我还顺手删掉了一些与垃圾邮件的判定无关的单字符,具体参见如下的代码,注意这些代码要附在
2017年7月20日

CVPR文章抢先看!这5篇最有趣,不容错过!(附视频讲解)

我们精选其中5篇论文,带大家概览国际学术界在动作识别、计算呈像、视觉跟踪、时间定位、图像数据库方面的创新成果,除了论文下载、项目地址等资源链接,还有即将呈现在大会现场口头报告的视频,让大家先睹为快。
2017年7月20日

从零开始教你用 Python 做词云

通过这张词云图,我们可以看到不同单词和词组出现的频率高低差别。高频词的字体明显更大,而且颜色也很醒目。值得说明的是,最显眼的单词Hacker并不是指黑客,而是指这部剧的主角之一——哈克首相。
2017年7月18日

传统程序员要不要转行到AI?看完本文思路更清晰

循环通常就行不通了,而大多数的循环操作可转化成矩阵之间的乘法运算,这就和线性代数有莫大的关系了。向量的内积运算更是随处可见。矩阵乘法与分解在机器学习的主成分分析(PCA)和奇异值分解(SVD)
2017年7月15日

CNN中的maxpool到底是什么原理?

的功能。假如有两个节点,其中第一个节点会在某些输入情况下最大,那么网络就只在这个节点上流通信息;而另一些输入又会让第二个节点的值最大,那么网络就转而走这个节点的分支。
2017年7月14日

我是这样学习 GAN 的——开发者自述

大家都知道,神经网络只要有非线性激活函数,就可以去拟合任意的函数,那么分布也是一样,所以可以用一直正态分布,或者高斯分布,取样去训练一个神经网络,学习到一个很复杂的分布。
2017年7月13日

不可错过的TensorFlow工具包,内含8大算法,即去即用!

k-均值聚类,你首先要创建一个k-均值聚类对象,在这里你会通过一系列诸如集群数量、训练方法、初始化方法等等选项。接下来调用拟合函数并通过它的输入来决定。它为你创建图形,将运行训练迭代配置运行时间
2017年7月12日

一文详解卷积神经网络的演变历程!

还是ResNet?它们之间有哪些差别和特点,又经历了怎样的发展和演变?本文将针对这一话题展开讨论。原文作者杨熹,载于作者的个人博客,AI研习社经授权发布。
2017年7月11日

可能是史上最全的机器学习和Python(包括数学)速查表

来源:https://docs.microsoft.com/en-us/azure/machine-learning/machine-learning-algorithm-cheat-sheet
2017年7月8日

如何用Python从海量文本抽取主题?

假如你是个研究生,教科书和论文就是你不得不读的内容。现在有了各种其他的阅读渠道,微信、微博、得到App、多看阅读、豆瓣阅读、Kindle,还有你在RSS上订阅的一大堆博客……情况就变得更严重了。
2017年7月6日

只需 130 行代码!用 GAN 生成二维样本的小例子

理论上讲神经网络作为一种通用的近似函数,只要capacity够,学习多少维分布都不成问题,但是这样写法显然极大增加了收敛难度。更自然的做法应该是:判别网络只接受单个二维样本,通过batch
2017年7月1日

视频 | 如何用 AI 预测股价?

我们用这个公式对每个值都归一化,以此来反映与起始点的比例的变化,所以把每个价格除(pi)除以初始价格(p0)然后减1,当我们的模型做出预测之后,我们就用这个公式把数据去归一化,再由其得到实际的数据。
2017年6月30日

手把手教你如何用 Python 做情感分析

注意在引号前面我们加了一个字母u,它很重要。因为它提示Python,“这一段我们输入的文本编码格式是Unicode,别搞错了哦”。至于文本编码格式的细节,有机会我们再详细聊。
2017年6月30日

最容易做的图像分割教程:用英伟达 DIGITS 进行图像分割,看一遍你也会做!(上)

分类网络的另一个限制是它们不能分辨出图像中对象的位置。这是可以理解的,因为它们不是被训练来做这个的。尽管如此,这却是计算机视觉的一个主要障碍:如果一辆自动驾驶车不能检测到道路的位置,它没法行驶很远!
2017年6月29日

AI 助你无码看片,生成对抗网络(GAN)大显身手

X和Y分别是两种不同类型图的集合,比如穿衣服的女优和没穿衣服的女优。所以给定一张穿了衣服的女优,要变成没穿衣服的样子,就是个图片翻译问题。CycleGAN示意图中(b)和(c)就是Dual
2017年6月28日

你听说过英伟达深度学习学院 DLI 吗?

的深度学习培训项目在国际上享有盛誉,但在中国市场发力较迟。目前,线上实验室只有英文版。在大陆开展的线下训练营,就成为国内开发者、深度学习学习者参与该培训项目的的唯一渠道。
2017年6月28日

杂谈CNN:如何通过优化求解输入图像

networks》中的另一个发现是,CNN中表示高层学习到的语义信息的,并不是某一个神经元,而是高层神经元构成的空间。这个看上去有些显然的结论的一种佐证方式又是对输入图像进行优化:
2017年6月27日

一文详解 Word2vec 之 Skip-Gram 模型(训练篇)

模型的系列教程,依次分为结构、训练和实现三个部分,本文为第二部分:训练篇,最后一部分我们将随后发布,敬请期待(在文末可以看到结构篇)。原文作者天雨粟,原载于作者知乎专栏,AI研习社已获授权。
2017年6月24日

教你用Keras做图像识别!只会图像检测并不强力

使用编译方法来计算学习过程。这里把损失函数定义为二进制交叉熵,通常都用它定义二进制分类问题的损失函数,优化器是rmsprop——它是做梯度下降,因为这是一个分类问题,度量指标设置为accuracy。
2017年6月24日

一文详解 Word2vec 之 Skip-Gram 模型(结构篇)

word都会被我们进行one-hot编码。仔细想一下,我们的输入被one-hot编码以后大多数维度上都是0(实际上仅有一个位置为1),所以这个向量相当稀疏,那么会造成什么结果呢。如果我们将一个1
2017年6月23日

视频 | 手把手教你构建图片分类器,备战 kaggle 大赛!

使用编译方法来计算学习过程。这里把损失函数定义为二进制交叉熵,通常都用它定义二进制分类问题的损失函数,优化器是rmsprop——它是做梯度下降,因为这是一个分类问题,度量指标设置为accuracy。
2017年6月23日

2017,最受欢迎的 15 大 Python 库有哪些?

Keras真的容易上手,并在持续完善它的快速原型能力。它完全用Python编写,可被高度模块化和扩展。尽管它以易上手、简单和以高层次为导向,但是Keras足够有深度并且足够强大,去支持复杂的模型。
2017年6月22日

入门必读的机器学习名词解释,你都懂了吗?

川普爸爸近来又搞了个大新闻,多国移民禁止入境。理由当然是防止恐怖分子混入美利坚大地啦,你们这些国家的人素质太差动不动搞恐怖袭击,我实在没精力去一个个查,所以你们通通别来了,我乐得轻松。
2017年6月18日

如何实现模拟人类视觉注意力的循环神经网络?

只通过一个带宽限制的传感器观察环境,每一步处理一次传感器数据,再把每一步的数据随着时间融合,选择下一次如何配置传感器资源;每一步会接受一个标量的奖励,这个
2017年6月18日

一文详解如何用 R 语言绘制热图

unit(3,“cm”))来控制热图大小。注意,当组合多个热图时,第一个热图被视为主热图。剩余热图的一些设置根据主热图的设置自动调整。这些设置包括:删除行集群和标题,以及添加拆分等。
2017年6月17日

谷歌大脑识别涂鸦原理揭秘!模型、数据、论文全都有

机器成功识别出的图像就被收录到数据集中。与通常的图像数据集不同,谷歌捕捉了这些简笔画的绘制过程,存为一组带时间戳的向量,并加上了元数据信息标签,包括所画内容和玩家地点等。
2017年6月14日

如何解决机器学习中的数据不平衡问题?

相反,当数据量不足时就应该使用过采样,它尝试通过增加稀有样本的数量来平衡数据集,而不是去除丰富类别的样本的数量。通过使用重复、自举或合成少数类过采样等方法(SMOTE)来生成新的稀有样品。
2017年6月13日

谷歌工程师亲自讲解:开源TensorFlow模型在图像、语言和艺术的应用

大家如果希望对图像识别和自然语言处理的基本理论进一步夯实与加强,可以查阅AI研习社往期发布的深度学习祖师爷Hinton的经典课程《面向机器学习的神经网络》。
2017年6月13日

深度神经网络的应用 - 深度学习之父 Geoffrey Hinton 的神经网络第 16 课(中文字幕)

这是本课程的最后一节课,也是选修章节,主要介绍了深度神经网络的应用以及最新(截止2012年)的研究进展,包括从图片中提取语义特征以及对超参数的贝叶斯优化,是对前面所讲章节的延伸和扩充。
2017年6月12日

最简单易懂的感知机教程:从理论到实践(附代码)

超平面分离定理是应用凸集到最优化理论中的重要结果,这个结果在最优化理论中有重要的位置。所谓两个凸集分离,直观地看是指两个凸集合没有交叉和重合的部分,因此可以用一张超平面将两者隔在两边。
2017年6月12日

这可能是史上最简单易懂的 GAN 教程(附实现代码)

知道了GAN大概的目的与设计思路,那么一个很自然的问题来了就是我们该如何用数学方法解决这么一个对抗问题。这就涉及到如何训练这样一个生成对抗网络模型了,还是先上一个图,用图来解释最直接:
2017年6月11日

增强学习对于机器人运动控制的六字真言

那么,针对机器人的运动控制问题,增强学习技术的运用存在哪些难点?我们又可以采取哪些有效的解决方法?今天,我们为大家奉上六字真言:高、大、少;虚、先、近。
2017年6月10日

数据预处理和挖掘究竟该怎么做?硅谷网红告诉你

深度学习系列,从机器学习和神经网络架构类型到数据可视化、小样本学习等从基础到应用的技巧,争取带领希望掌握神经网络的神奇魔力和想成为深度学习工程师的大家伙早日入坑!哦不,走向巅峰!!
2017年6月10日

英伟达内部对深度学习是如何看待的?

的深度学习培训项目在国际上享有盛誉,但在中国市场发力较迟。目前,线上实验室只有英文版。在大陆开展的线下训练营,就成为国内开发者、深度学习学习者参与该培训项目的的唯一渠道。
2017年6月10日

机器人参加高考数学22分钟拿105分,究竟怎么做到的?

分),一时引发了公众的普遍关注和讨论。本文将试着从数学解题思维的角度出发,对比机器学习的一般性认知逻辑,为大家揭秘高考机器人的内部工作原理。原文作者怒放的生命,原载于芥末堆,AI研习社已获授权。
2017年6月9日

数据预处理和挖掘究竟该怎么做?硅谷网红告诉你

深度学习系列,从机器学习和神经网络架构类型到数据可视化、小样本学习等从基础到应用的技巧,争取带领希望掌握神经网络的神奇魔力和想成为深度学习工程师的大家伙早日入坑!哦不,走向巅峰!!
2017年6月9日

史上最详尽的感知机教程:从原理到实践

L(x,y)最大的一个样本(xi,yi)、用它来计算梯度、然后梯度下降即可(注意如果(xi,yi)是被正确分类的话,说明所有样本都已被正确分类,所以此时应该停止模型的训练【事实上也训练不动了……】)
2017年6月8日

神经网络的模型分层结构 - 深度学习之父 Geoffrey Hinton 的神经网络第 15 课(中文字幕)

相关视频内容。目前,雷锋字幕组已经与全球范围内多所高校包括多伦多大学、伦敦大学学院等达成课程内容汉化授权协议。如果您对我们的工作内容感兴趣,欢迎添加微信
2017年6月7日

怎样信息最大化?什么是“范例卷积神经网络”?这篇文章告诉你答案

上图中的X表示“种子图像”,Tαx表示转换后的图像(随机抽样变换参数α),Z=g(Tαx;Θ)表示采用了随机图像并计算了其表征的一个映射。所以,从Tαx到的Z箭头事实上是一个确定性映射。
2017年6月6日

深度学习没那么难,小白也可以快速入门。时间要多久?12个小时!

这位人类最优秀的棋手最终没能在最后一局反转令人惋惜,尽管很多人一开始就预知了这样的结局。而从另一个角度,机器能在学习短短数周之后打败一个学棋20多年的顶尖选手,人工智能的强大令人惊叹。
2017年6月6日

用Python支持 7 亿月活用户的应用?Instagram 是这样实现的

分支的代码,都将在一个小时内被发布到线上环境。而这样的发布过程每天将会发生上百次。在这么频繁的发布频率下,如何在满足之前的那两个前提下来完成迁移变得尤其困难。
2017年6月6日

最简单易懂的 GAN 教程:从理论到实践(附代码)

知道了GAN大概的目的与设计思路,那么一个很自然的问题来了就是我们该如何用数学方法解决这么一个对抗问题。这就涉及到如何训练这样一个生成对抗网络模型了,还是先上一个图,用图来解释最直接:
2017年6月5日

生成预训练的深度神经网络 - 深度学习之父 Geoffrey Hinton 的神经网络第 14 课(中文字幕)

相关视频内容。目前,雷锋字幕组已经与全球范围内多所高校包括多伦多大学、伦敦大学学院等达成课程内容汉化授权协议。如果您对我们的工作内容感兴趣,欢迎添加微信
2017年6月5日

如何用深度学习推荐电影?教你做自己的推荐系统!

看起来并不是很好。我觉得这四部电影不应该通过搜索《盗火线》推荐给我,他们看起来与《盗火线》完全不相关,这四个电影是浪漫、戏剧类。如果我找的是一部有大明星的美国犯罪电影,我凭什么会想要看戏剧电影?
2017年6月5日

无监督聚类问题中,如何决定簇的最优数量?

truth——类的真实数目。但情况并不会总是如此。譬如说,或许数据中不存在定义明确的类(簇)。而无监督学习本来的意义,便是探索数据,找出使簇、类得数目达到最优的结构。
2017年6月4日

这个可以框架解决几乎所有机器学习问题

调参之后,也并不就是大功告成,这个时候还是需要去思考,是什么原因造成精度低的,是哪些数据的深意还没有被挖掘到,这个时候需要用统计和可视化去再一次探索数据,之后就再走一遍上面的过程。
2017年6月3日

硅谷网红从基础教深度学习中的数学,视频演示不可错过

作为超参数。可以用概率方法来决定权值。有一个简单的方法是用小方差的正态分布随机初始化每一个权值,也就是这些权值会彼此很接近。给定我们输入的矩阵的维数,将用这个方法来创建一个(3,4)维的权矩阵。
2017年6月2日

AI股市预测实战:用LSTM神经网络预测沪深300未来五日收益率

天收盘价变化的趋势的总括,因此最终的预测结果以及回测结果都不是很理想。之后尝试增加了features(每日Open,High,Low,Close,Amount,Volume),效果依然不是很好。
2017年6月1日

你在数据预处理上花费的时间,是否比机器学习还要多?

对于机器学习项目,数据预处理都是基础。相比实际的机器学习,开发者花在数据预处理上的时间往往还要更多。有的数据预处理任务只针对特定问题,但大多数,比如把数据分割为训练和测试组、给样本分层和创建
2017年6月1日

不是你无法入门自然语言处理(NLP),而是你没找到正确的打开方式

中的一个关键概念描述清楚:语言模型。语言模型包括文法语言模型和统计语言模型。一般我们指的是统计语言模型。之所以要将语言模型摆在词表示方法之前,是因为后面的表示方法马上要用到这一概念。
2017年5月31日

深度置信网络 - 深度学习之父 Geoffrey Hinton 的神经网络第 13 课(中文字幕)

相关视频内容。目前,雷锋字幕组已经与全球范围内多所高校包括多伦多大学、伦敦大学学院等达成课程内容汉化授权协议。如果您对我们的工作内容感兴趣,欢迎添加微信
2017年5月31日

手把手教你用 TensorFlow 实现文本分类(上)

上面提到文本分类需要得到能表征各类文本的汉语词典,这部分的主要思路是实现tf_idf算法自动提取关键词,根据词频(TF)和逆文档频率(IDF)来衡量词汇在文章中的重要程度。这里词频的计算采用公式:
2017年5月30日

数据太大爆内存怎么办?七条解决思路 | 机器学习开发手册

你还可以考虑:相对于模型技巧,做一个数据大小的敏感性分析。或许,对于你的随机小样本,有一个天然的边际效应递减分水岭。越过这个关口,继续增加的数据规模带来的好处微乎其微。
2017年5月30日

开发者自述:我是怎样理解支持向量机(SVM)与神经网络的

犹如复杂性科学般,处于高层的我们并不能知道底层的”愚群“为何能涌现。两者一比起来,SVM似乎也没有深度学习等那么令人狂热,连Hinton都开玩笑说SVM不过是浅度学习(来自深度学习的调侃)。
2017年5月29日

榨出聊天机器人的价值!用 Tensorflow 搭建能理解语境的客服小二!

如果是新手,看看“7行代码搞定深度学习”(https://chatbotslife.com/deep-learning-in-7-lines-of-code-7879a8ef8cfb);如果还不清楚
2017年5月29日

25 行 Python 代码就能实现人脸识别?这篇文章告诉你详情

个分类器,每一个都需要成功匹配(当然,有容错率),才能检测出人脸。但这有一个问题:对于人脸识别,算法从左上角开始计算一个个数据块,不停问“这是张脸吗”。每个数据块有超过
2017年5月28日

机器学习算法究竟需要试验多少次,才能有效反映模型性能?

假设我们将一个神经网络模型或其它随机算法,在数据的训练集上重复训练了1000次,并且记录了模型在测试集上的均方根误差(RMSE)。作为本教程后续分析的前提,假设我们所用的数据呈正态分布。
2017年5月27日

从零开始用 TensorFlow 分析情绪,硅谷网红带你飞

导入数据后将被自动分为训练集和验证集,可以进一步将这些集合拆分为评论和标签,分别赋值为X和Y。训练集是用来训练模型的,帮助找到合适的权重;验证集则调整结果以防过度拟合,用来将预测值与真实值进行比较,
2017年5月26日

干货 | 用深度学习揭开人脸结构的秘密

deformation),我们给用户提供了简易修改的绘制方案。对于不精于从空白纸张绘制肖像的用户,或者不想生成复杂人脸形状的用户,可跳跃第一步直接进行连续绘制。在连续绘制模式下,由单向工程(二维
2017年5月25日

来吧!带你漫游 Wasserstein GAN 的世界!

往错误的方向前进。这么说来,就好像老婆和老妈掉进河里,你救谁一样,怎么回答的火候是难以把握的。
2017年5月25日

限制玻尔兹曼机 - 深度学习之父 Geoffrey Hinton 的神经网络第 12 课(中文字幕)

相关视频内容。目前,雷锋字幕组已经与全球范围内多所高校包括多伦多大学、伦敦大学学院等达成课程内容汉化授权协议。如果您对我们的工作内容感兴趣,欢迎添加微信
2017年5月24日

不是你无法入门自然语言处理(NLP),而是你没找到正确的打开方式

中的一个关键概念描述清楚:语言模型。语言模型包括文法语言模型和统计语言模型。一般我们指的是统计语言模型。之所以要将语言模型摆在词表示方法之前,是因为后面的表示方法马上要用到这一概念。
2017年5月23日

不是你无法入门自然语言处理(NLP),而是你没找到正确的打开方式

中的一个关键概念描述清楚:语言模型。语言模型包括文法语言模型和统计语言模型。一般我们指的是统计语言模型。之所以要将语言模型摆在词表示方法之前,是因为后面的表示方法马上要用到这一概念。
2017年5月23日

Hopfield 网络和玻尔兹曼机!深度学习之父 Geoffrey Hinton 的神经网络第 11 课(中文字幕)

相关视频内容。目前,雷锋字幕组已经与全球范围内多所高校包括多伦多大学、伦敦大学学院等达成课程内容汉化授权协议。如果您对我们的工作内容感兴趣,欢迎添加微信
2017年5月22日

NBA 史上实力最弱的球队是哪个?用 Python + SQL 我们找到了答案

一个数据库由若干个表(table)组成,就像每个Excel文件里有多个Sheets。每个表又包含行(row)与列(column),这就比较好理解了。一行代表一个样本,而多列定义了各个维度上的属性。
2017年5月21日

入门深度学习必知的知识点:视觉的深度学习与网络

类方法就像在万米悬崖峭壁贴身攀岩,向上的每一步很费时且充满未知。因为,从海量的数据中去试图进行全脑网络的微观拼图,是一个大随机性的事件,即使有超级计算机或其他先进微观技术的帮助,欧美两个脑项目的
2017年5月20日

入门级难度构建Pyhton神经网络,硅谷AI网红手把手带你入坑

1至1,平均值为0。接下来将写激活函数,在这个例子中是sigmoid函数,它描述了s形曲线。我们将输入值乘以权值的总和传入到神经元,将把它们转换为在0到1之间的概率值,这一概率将有助于进行预测。
2017年5月19日

和比特币关系最紧密的技术:区块链原来是这么玩的

Application),很多人发现这跟我们做一个传统的企业级应用或者互联网应用的思路是不太一样的。因为它所带来的去中心化的思路,会对我的整个架构设计思路产生影响,在这种情况下应该如何设计我的软件?
2017年5月18日

解惑:Python是否值得学习?最强语言展露端倪

库。最近两年人工智能火起来,非常重要的一个原因是深度学习火了,深度学习被证明非常有效,尤其在数据量特别大的情况下去洞见一些特征的时候,比人工寻找更有效一些。在深度学习领域几乎没有任何其他语言可以跟
2017年5月18日

手把手教你用 TensorFlow 实现卷积神经网络(附代码)

卷积步骤完成后,再使用MaxPooling算法来缩减像素采样数组,按照2×2来分割特征矩阵,分出的每一个网格中只保留最大值数组,丢弃其它数组,得到最大池化数组(Max-PooledArray)。
2017年5月17日

结合多重神经网络提高泛化能力!深度学习之父Geoffrey Hinton的神经网络第十课(中文字幕)

相关视频内容。目前,雷锋字幕组已经与全球范围内多所高校包括多伦多大学、伦敦大学学院等达成课程内容汉化授权协议。如果您对我们的工作内容感兴趣,欢迎添加微信
2017年5月17日

用 Python 分析四年NBA比赛数据,实力最强的球队浮出水面

用通俗的话说,相异度就是两个东西差别有多大,例如人类与章鱼的相异度明显大于人类与黑猩猩的相异度,这是能我们直观感受到的。但是,计算机没有这种直观感受能力,我们必须对相异度在数学上进行定量定义。设
2017年5月16日

用RNN实现机器写诗,机器写作思路发展历程你必须了解!

框架,将历史已经生成的内容作为源语言,将下一句话作为目标语言进行翻译。需要用户提供第一句话,然后由第一句生成第二句,第一,二句生成第三句,并不断重复这个过程,直到生成完整诗歌。基于
2017年5月15日

提高网络模型的泛化能力!深度学习之父Geoffrey Hinton的神经网络第九课(中文字幕)

相关视频内容。目前,雷锋字幕组已经与全球范围内多所高校包括多伦多大学、伦敦大学学院等达成课程内容汉化授权协议。如果您对我们的工作内容感兴趣,欢迎添加微信
2017年5月15日

最经典的SVM算法在Spark上实现,这里有一份详尽的开发教程(含代码)

kernelTransIM.dotMultiply(labelsvsM.multiply(alphassvsM).transpose()).dotValue()
2017年5月14日

用Python分析周杰伦6.5W字的歌词,原来他是这样的人

google、baidu,终于找到别人整理好的歌词全集。ok,就这样歌词文件搞定了,一共也没多大,也就207K(想想周董这么多年唱的歌词大半都在这207K的txt文件里就不免有些感慨)。
2017年5月13日

一个框架解决几乎所有机器学习问题

调参之后,也并不就是大功告成,这个时候还是需要去思考,是什么原因造成精度低的,是哪些数据的深意还没有被挖掘到,这个时候需要用统计和可视化去再一次探索数据,之后就再走一遍上面的过程。
2017年5月12日

如何用深度学习推荐电影?教你做自己的推荐系统!

看起来并不是很好。我觉得这四部电影不应该通过搜索《盗火线》推荐给我,他们看起来与《盗火线》完全不相关,这四个电影是浪漫、戏剧类。如果我找的是一部有大明星的美国犯罪电影,我凭什么会想要看戏剧电影?
2017年5月12日

远场语音交互体验的思考:Alexa 为什么不用屏幕和多轮对话?| 深度

这个问题之前,可以先回忆一下,我们平时能看到身边多少人在用语音交互?事实上这很少,除了汽车导航的时候,可能大部分时候只是偶尔秀一下,而且还是对着手机喊话。这就说明了问题,语音交互其实根本就不成熟。
2017年5月11日

英伟达股价暴涨17%、5大AI新品,GTC上黄仁勋都讲了啥?(含PPT)

第一天的内容集中在图像处理不同,在两个小时的演讲中里,只有在开场不久列举深度学习对图像处理效果的改善以及中途演示《最终幻想》两处与图像处理有关,其他的时间中,老黄大谈特谈的是
2017年5月11日

循环神经网络RNN(二)深度学习之父的神经网络第八课(中文字幕)

相关视频内容。目前,雷锋字幕组已经与全球范围内多所高校包括多伦多大学、伦敦大学学院等达成课程内容汉化授权协议。如果您对我们的工作内容感兴趣,欢迎添加微信
2017年5月10日

为什么PyTorch这么火?一线开发者这样说

迁移成本。作为Torch用户,我已经很习惯它的一套开发流程了,也能够比较高效的实现定义的模型了。如果要迁移到PyTorch平台,需要学习下里面的一些函数定义和使用,不想换平台的时候太麻烦。
2017年5月10日

读了这些书,才能正确入门深度学习

Jeffries,他以自己的阅读体验,对当前含金量极高的几本深度学习书籍进行点评;对每本书的内容重点、所适合的读者群进行了总结。非常适合学习者在购书前进行参考,以免白费时间。AI
2017年5月10日

循环神经网络RNN(一)深度学习之父的神经网络第七课(中文字幕)

相关视频内容。目前,雷锋字幕组已经与全球范围内多所高校包括多伦多大学、伦敦大学学院等达成课程内容汉化授权协议。如果您对我们的工作内容感兴趣,欢迎添加微信
2017年5月8日

手把手教你如何用 TensorFlow 实现 CNN

还有一个特点就是它是全卷积结构(FCN)的,网络的最后没有使用全连接层,一方面这样可以减少参数的数目,不容易过拟合,一方面也带来了一些空间信息的丢失。代替全连接层的是全局平均池化(Global
2017年5月8日

按照这几个步骤操作,不实现 RNN 都难!

可知,Y与X有两个依赖关系,一个是t-3,一个是t-8。我们实验的目的就是检验RNN能否捕捉到Y与X之间的这两个依赖关系。实验使用交叉熵作为评价标准,则有下面三条理想的实验结果:
2017年5月7日

从原理到实战 英伟达教你用PyTorch搭建RNN(下)

Tracker,来解析输入语句,而不需要任何外部解析数据。本质上,这样的模型以随机的猜想开始,当它的解析在整体分类任务上生成较好精度时,奖励它自己,以此来学习。研究人员们写道,他们“使用
2017年5月6日

禅与奶罩识别艺术(下)

如果正确地添加了Dropout,则得到的验证精度(val_acc)应为0.7390。而其他的指数,如训练精度(acc)却大致相等。可见,Dropout的作用是消解过拟合,提高模型泛化能力。
2017年5月6日

从原理到实战 英伟达教你用PyTorch搭建RNN(上)

manipulation,非常倚赖控制流,比如“for”和“if”statement,来定义某个特定句子的计算图结构。在更复杂的例子里,你也许想要搭建结构取决于子网络输出的模型。
2017年5月5日

禅与奶罩识别艺术(上)

卷积滤波器是一个比图片尺寸小的矩阵,这里设为3x3。我们把图片缩放至像素级(猜猜这是哪个部位),这里每一个小方格背后就是0或1了。卷积核在输入图像上来回滚动、摩擦,那么基本上会遇到三种区域(橙框):
2017年5月5日

在 PyTorch 上跑 GAN 只需要 50 行代码,不试试?

地址:https://github.com/devnag/pytorch-generative-adversarial-networks
2017年5月4日

李开复让非专业人士也能完全理解深度学习

APP,最基本的思路就是按照从简单到复杂的顺序,让小朋友反复看每个汉字的各种写法(大一点的小朋友甚至要学着认识不同的书法字体),看得多了,自然就记住了。下次再见到同一个字,就很容易能认出来。
2017年5月4日

英伟达深度学习学院(DLI)现场教你如何实操深度学习,作为 AI 开发者的你不来看看?

高级工程师的现场指导下,先学习深度学习相关的理论知识,再接入英伟达官方服务器进行一次关于图像分割的代码实操,理论结合实践,在一天时间内一举入门深度学习!
2017年5月3日

模型优化:如何加快学习!深度学习之父的神经网络第六课(中文字幕)

相关视频内容。目前,雷锋字幕组已经与全球范围内多所高校包括多伦多大学、伦敦大学学院等达成课程内容汉化授权协议。如果您对我们的工作内容感兴趣,欢迎添加微信
2017年5月3日

PyTorch 的预训练,是时候学习一下了

其实大多数时候我们需要根据我们的任务调节我们的模型,所以很难保证模型和公开的模型完全一样,但是预训练模型的参数确实有助于提高训练的准确率,为了结合二者的优点,就需要我们加载部分预训练模型。
2017年5月2日

在玩图像分类和图像分割?来挑战基于 TensorFlow 的图像注解生成!

但对于静态图片而言,嵌入我们的注解生成器,将会聚焦于图像中对分类有用的特征,而不是对注解生成有用的特征。为提升每个特征里涵盖的与任务相关的信息,我们可以训练图像嵌入模型(用来对特征进行编码的
2017年5月2日

生成对抗网络(GAN)研究年度进展评述

captioning),输入的是图像,输出的是句子。大家以前就认为,这是一个一对一的映射,其实不是。它实际上是一对多的映射。不同的人来描述一幅图,就会产生不同的语句。所以如果用
2017年5月1日

Geoffrey Hinton | 深度学习之父的神经网络第五课!(中文字幕)

相关视频内容。目前,雷锋字幕组已经与全球范围内多所高校包括多伦多大学、伦敦大学学院等达成课程内容汉化授权协议。如果您对我们的工作内容感兴趣,欢迎添加微信
2017年5月1日

人脸检测与识别的趋势和分析

最后我附上我近期做的效果图,是基于视频中人脸检测与识别的,因为没有标准,公共的数据集,所以我就用室内场景剧作为训练数据,最后的效果很不错,希望以后有同学做人脸的,我们可以一起讨论,共同进步,谢谢!
2017年4月29日

CNN 在基于弱监督学习的图像分割中的应用

如果学习算法能通过对一些初略标记过的数据集的学习就能完成好的分割结果,那么对训练数据的标记过程就很简单,这可以大大降低花在训练数据标记上的时间。这些初略标记可以是:
2017年4月28日

【教程】看看大神的思路!机器学习界网红7分钟教你如何搭建Chatbot?(中文版)

看来学会搭建一个Chatbot还是很有必要的。Siraj会带你用TensorFlow建一个聊天机器人,使用递归神经网络算法(RNN),步骤是下载数据集,创建模型,训练模型,聊天测试。
2017年4月28日

从零教你写一个完整的GAN(附代码)

的时候,我曾把数据直接放进去,这样的后果是最后生成的数据,能学习到高斯分布的轮廓,但标准差和均值则和真实样本相差很大。因此,这里我建议直接使用平均值和标准差作为
2017年4月27日

玩过TensorFlow自带的的可视化工具么?(附源码)

tf.reduce_mean(tf.reduce_sum(tf.square(ys-prediction),reduction_indices=[1]))
2017年4月26日

教程 | Geoffrey Hinton 机器学习第四课(中文字幕)

相关视频内容。目前,雷锋字幕组已经与全球范围内多所高校包括多伦多大学、伦敦大学学院等达成课程内容汉化授权协议。如果您对我们的工作内容感兴趣,欢迎添加微信
2017年4月26日

如何用 TensorFlow 实现基于 LSTM 的文本分类(附源码)

简单解释一下这个图,每个word经过embedding之后,进入LSTM层,这里LSTM是标准的LSTM,然后经过一个时间序列得到的t个隐藏LSTM神经单元的向量,这些向量经过mean
2017年4月25日

什么才算是真正的数据科学家?你算么?

但是,从现实角度来讲,你并不需要成为这样一个人才能为企业带来价值。大量和数据相关的职责都被认为是和数据科学家相关的,因此,更重要的是,找到合适自己的位置,使用新技术解决问题,创造收益。
2017年4月25日

看了这篇文章,了解深度卷积神经网络在目标检测中的进展

的框架中,由于输入图像要经过多次卷积,那些尺寸小的物体在最后一层的卷积输出上的特征不能很好的描述该物体。如果用前面某一层的特征,则能够更好的描述小物体,用靠后的层的特征,则能更好地描述较大的物体。
2017年4月24日

用金庸、古龙群侠名称训练 LSTM,会生成多么奇葩的名字?

state保留多少,0表示全部丢弃,1表示全部保留。为什么要丢弃呢,不是保留得越多越好么?假设LSTM在生成文章,里面有小明和小红,小明在看电视,小红在厨房做饭。如果当前的主语是小明,
2017年4月24日

Geoffrey Hinton | 深度学习之父的神经网络第三课!

上面几节课详细讲解了感知器,这次介绍线性神经元,跟感知器思想类似,但又不同:线性神经元训练时会趋近于目标值。接下来Hinton会用猜测餐馆菜价的例子,解释权重收敛的过程。
2017年4月24日

教程 | Hinton 机器学习视频中文版:感知器的局限性(2.5)

相关视频内容。目前,雷锋字幕组已经与全球范围内多所高校包括多伦多大学、伦敦大学学院等达成课程内容汉化授权协议。如果您对我们的工作内容感兴趣,欢迎添加微信
2017年4月22日

人脸识别 + 手机推送,从此不再害怕老板背后偷袭!

ageitgey/face_recognitionjpush/jpush-api-python-clientHironsan/BossSensor
2017年4月21日

Python vs R,谁才是机器学习编程语言的首选?

机器学习和数据分析之间的差异有些难以言明,但二者最主要的不同就在于,比起模型的可解释性,机器学习更加强调预测的准确性;而数据分析则更加看重模型的可解释性以及统计推断。Python
2017年4月21日

教程 | Hinton 机器学习视频中文版:感知器的原理透析(2.4)

相关视频内容。目前,雷锋字幕组已经与全球范围内多所高校包括多伦多大学、伦敦大学学院等达成课程内容汉化授权协议。如果您对我们的工作内容感兴趣,欢迎添加微信
2017年4月21日

教程 | Hinton 机器学习视频中文版:感知器的几何空间解析(2.3)

上节课主要从数学公式上了解感知器的基本原理,比较抽象,这节课换个思路,在几何空间里深入了解感知器,让大家有更加直观的理解。同时,你将了解到超平面、锥平面、凸优化等术语。
2017年4月20日

能理解聊天记录的微信机器人 (四)

tune,直接用的是在ImageNet上面训练的模型,所以在一些真实的照片上面表现的很好,尤其是对猫和狗认得神特码准。但在一些二次元鬼畜风的表情上就相当差了。尤其是碰到套图的时候简直惨不忍睹。。
2017年4月19日

Facebook 开源深度学习框架 Caffe2,让 AI 从云端走向终端

基础上的重构和升级,一方面集成了诸多新出现的算法和模型,另一方面在保证运算性能和可扩展性的基础上重点加强了框架在轻量级硬件平台的部署能力。按照官方介绍,Caffe2
2017年4月19日

教程 | Hinton 机器学习视频中文版:神经网络架构介绍(2.2)

相关视频内容。目前,雷锋字幕组已经与全球范围内多所高校包括多伦多大学、伦敦大学学院等达成课程内容汉化授权协议。如果您对我们的工作内容感兴趣,欢迎添加微信
2017年4月19日

详解 Kaggle 房价预测竞赛优胜方案:用 Python 进行全面数据探索

df_train.drop(df_train.loc[df_train['Electrical'].isnull()].index)df_train.isnull().sum().max()
2017年4月19日

教程 | Hinton 机器学习视频中文版:神经网络架构介绍(2.1)

常见的神经网络有前馈神经网络FFN和循环神经网络RNN,不同的网络结构有着不同的魔力,比如RNN能记忆信息(比FFN强大),已经在语音识别上广泛应用。那么,RNN的魔力到底源自何处?
2017年4月18日

为什么吴恩达认为未来属于迁移学习?

如果我们想要执行全新的任务,比如监测自行车骑手,重复使用原先的模型是行不通的。这里有一个很关键的原因:不同任务的数据标签不同。但有了迁移学习,我们能够在一定程度上解决这个问题,并充分利用相近任务
2017年4月18日

能理解聊天记录的微信机器人 (三)

连了起来,现在有了实时监控和可视化了。能看到每小时平均有多少次自动回复,多少次看群里话唠,多少次看标签云。令我意外的是已经过去一周了,可是大家的热情仍然没有消退。尤其是最简单的自动回复功能,你提到
2017年4月18日

开课啦!大牛直播TensorFlow 在工程项目中的应用 | AI 研习社

毕竟,掌握一件工具,要从充分了解它的应用场景开始。工具本身难论好坏,关键在于它是否适合你需要处理的任务。
2017年4月17日

教程 | Hinton 机器学习视频中文版:机器学习算法的三大类(1.5)

相关视频内容。目前,雷锋字幕组已经与全球范围内多所高校包括多伦多大学、伦敦大学学院等达成课程内容汉化授权协议。如果您对我们的工作内容感兴趣,欢迎添加微信
2017年4月17日

蒙特利尔大学研究者改进Wasserstein GAN,极大提高GAN训练稳定性

下图展示了模型的一个例子。目前为止,这是第一个完全使用对抗方法进行训练,而没有使用监督的最大似然损失的生成语言模型。其中有一些拼写上的错误,这可能是由于模型是每个字符独立输出的。
2017年4月16日

谷歌大脑让机器尝试画画,虽然结果很勉强但过程你却不能不知道

在向小猫模型中输入了四把姿态各异的椅子图案之后,模型学习了椅子的特征,进而生成了各种具有椅子特征的小猫,并产生了多种设计方案。研究者相信,将不同种类的事物交给神经网络,可能产生意想不到的交互和想象。
2017年4月16日

想知道 GitHub 上各开源项目的生存状况如何?这个软件告诉你!

任意大小、任意流行度的算法库,可通过一个通用检索框架来进行比较。只需一次点击,就能从“相对”视图返回到“绝对值”视图。
2017年4月15日

能理解聊天记录的微信机器人 (二)

/activity,就统计这个群最近一天的发言情况(每小时有多少条消息,每个人讲多少话等等),把图片发上去
2017年4月15日

教程 | Hinton 机器学习视频中文版:ANN的MNIST学习范例(1.4)

本期课程以经典的手写数字识别问题为例,详细讲解神经网络是如何从杂乱无章的图像中学习到潜在特征,并完美地区分不同数字的。主要步骤:设计简单的双层网络结构,数据准备,权值初始化,模型训练及权值动态更新。
2017年4月14日

最知名的5个机器学习框架,知道一个说明你入门了

你可能没听过它们,但今天或许会考虑上手。至于那些不同生态、不同编程语言的工具——对于高手而言,即便没有使用需求,借鉴它们的代码执行也能为自己的产品开发带来许多灵感。
2017年4月14日

如何看待谷歌公开 TensorFlow 专用处理器 TPU?

芯片的成本和风险。首先为了性能必须使用最好的半导体制造工艺,而现在用最新的工艺制造芯片一次性成本就要几百万美元,非常贵。就算有钱,还需要拉一支队伍从头开始设计,设计时间往往要到一年以上,time
2017年4月13日

教程 | Hinton 机器学习视频中文版:简单的神经元模型(1.3)

我们呼唤来自各个领域的最强翻译与听译,加入我们这个由海内外优秀译者和科技人才组成的团队,将科技领域的最新资讯和成果传递给万千人,并亲眼见证未来科技发展的历史性时刻。
2017年4月13日

免费 | 不是你学不好机器学习,而是你没看过这 10 本书!

代码为基础,面向数据挖掘的相关使用场景。作者在介绍中表示:“我希望你能参考书中给出的代码,积极参与数据挖据技术的实践编程,当你完成全书的所有内容时,实际上已经为数据挖掘技术奠定了坚实的基础。”
2017年4月13日

使用 HyperTools 的正确姿势! | Kaggle 实战教程

用鼠标旋转该数据图,旋即暴露出的结构很有意思。我们可以按照年份来对线条上色,使其结构更显眼,并帮助我们理解它如何随时间而变化。偏红的线条,意味着时间更久远,偏蓝的线条意味着时间更近。
2017年4月13日

一窥谷歌神经机器翻译模型的真面貌,其底层框架终于开源!

summarization、图像抓取、语音识别、对话建模。谷歌自承,在设计该框架时可以说是十分地仔细,才能维持这个层次的广适性,并提供人性化的教程、预处理数据以及其他的机器翻译功能。
2017年4月12日

【Hinton】1.2 神经网络机制中的脑科学原理

我们呼唤来自各个领域的最强翻译与听译,加入我们这个由海内外优秀译者和科技人才组成的团队,将科技领域的最新资讯和成果传递给万千人,并亲眼见证未来科技发展的历史性时刻。
2017年4月12日

万事开头难!入门TensorFlow,这9个问题TF Boys必须要搞清楚

其次,基于TensorFlow的教学资源非常多,中英文的都有,这对于新手也是非常有帮助的。Google做社区非常有一套,在中国有专门的一群人,会在第一时间把Google的开发者相关的进展翻译成中文。
2017年4月12日

首发 | Hinton 机器学习教程 Youtube 播放量高达100万,却没人看过中文版?

我们呼唤来自各个领域的最强翻译与听译,加入我们这个由海内外优秀译者和科技人才组成的团队,将科技领域的最新资讯和成果传递给万千人,并亲眼见证未来科技发展的历史性时刻。
2017年4月11日

用两万篇论文告诉你:机器学习在过去五年中发生了什么

机器学习论文大数据,从论文数量、开源框架、数学模型和优化算法等多个方面对过去五年中的机器学习变化趋势进行了详细分析,并将分析结果发布在个人博客上。以下内容整理自该博客,AI
2017年4月11日

能理解聊天记录的微信机器人 (一)

但我觉得这些并没有体现聊天机器人的核心优势。仔细看这四个方面的应用,它们其实都可以不通过聊天来完成,甚至不通过聊天可能会更方便。比如推送服务有系统信息推送(pushbullet,
2017年4月10日

预告:如何在树莓派上用 CNN 训练语音模型 | AI 研习社

今年二月,刘老师做客雷锋网硬创公开课频道,做了题为“基于树莓派如何开发机器人”的讲座,受到读者的强烈欢迎。详情请见“基于树莓派如何开发机器人(附PPT+视频)
2017年4月8日

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

早在四年前,谷歌内部就开始使用消耗大量计算资源的深度学习模型,这对CPU、GPU组合而言是一个巨大的挑战,谷歌深知如果基于现有硬件,他们将不得不将数据中心数量翻一番来支持这些复杂的计算任务。
2017年4月7日

FPGA 哪家强?看 2016 年度市场大趋势

对于具备哪些要素才算得上是“最佳”产品,每个技术人员都有自己的评判标准。对于我和我的钱包来说,去年推出的最发杂的产品线必须是
2017年4月6日

深度神经网络发展历程全回顾:如何加速 DNN 运算?

Net)。使用了残差连接使得网络变得更深(34层,或更多甚至千层)。它是ImageNet挑战中第一个top-5错误率低于人类的。当网络层次变得更深时,训练时的一个难点就是梯度消失(Vanishing
2017年4月5日

深度神经网络发展历程全回顾:如何加速 DNN 运算?

Net)。使用了残差连接使得网络变得更深(34层,或更多甚至千层)。它是ImageNet挑战中第一个top-5错误率低于人类的。当网络层次变得更深时,训练时的一个难点就是梯度消失(Vanishing
2017年4月5日

实例讲解:时间序列预测究竟需要多少历史数据?

以下代码中,我们通过减去前一年数据的办法来获得数据的季节性差异。需要说明的是,这种方法是很粗糙的,因为它并没有考虑闰年的因素。而且,这也意味着第一年的数据将无法用于建模,因为第一年并没有更早的数据。
2017年4月3日

百度IDL最新成果:从自然语言入手,教AI智能体像人类一样学习

ability”,这意味着即使是以前没有看到的全新命令,如果有足够的以前看过的相似形式的句子,仍然能够正确的执行任务。换句话说,智能体能够以已知的方式(语法)理解用已知单词组合的新句子。
2017年4月2日

专访阿里iDST初敏博士和陈一宁博士:打破语音技术的落地怪圈

初敏:取代手机是不太可能。无论是什么入口,最终的大目标是一致的:为了获取网上或云上的信息。有时候手机触摸交互就很方便,那如果我在做饭,也许一个语音交互的冰箱就更合适。在不同的场景中,会用到不同的端。
2017年4月1日

谷歌地球企业版开源!

年发布。当时的目标是,让企业客户能在本地数据中心部署谷歌地图以及谷歌地球。如今,随着越来越多的服务被搬到云端,这项业务已被关闭。
2017年3月29日

自 Ian Goodfellow 之后,GANs 还有哪些开拓性进展?

blocks)。一旦低清图像经过这些模块处理时,就会有两个反卷积层来提高清晰度。然后再看鉴别器,我们有8个卷积层组成的Sigmoid激活函数,它可以输出图像是真实(高清)或者合成(超解析)的概率。
2017年3月28日

微软首席 AI 科学家邓力:对话系统的分类与发展历程 | AI NEXT

UI)或者聊天机器人,它们其实从属于同一类技术,是实现人机交互(HCI)的一种方式。今天我主要想讲讲,在过去的二三十年间,这类技术是如何发展的。就好像对于神经网络专家,今天所流行的深度学习以及各种
2017年3月27日

Facebook 田渊栋详解:深度学习如何进行游戏推理?

其次,我们希望值函数的估计越来越准。值函数一开始是随机的,这样就连带拖慢了整个算法的收敛速度。在训练时,我们可以用探索得来的综合奖励值去更新估计值。这样反复迭代,时间长了以后会迭代到真实的值。
2017年3月27日

Google Summer of Code 2017 开放报名;交互式线上科学期刊 Distill 上线等 | AI 研习社周刊

这里整理了几本值得深入阅读的免费机器学习图书资源。值得一提的是,虽然所有图书均为英文原著,但大部分都已经有了中文译本。
2017年3月26日

干货 | 深度学习调参有哪些技巧?

通过将神经网络隐藏层的激活神经元以矩阵的形式可视化出来,能够让我们看到一些有趣的insights。在[8]的头部,嵌入了一个web-based的CNN网络的demo,可以看到每个layer
2017年3月25日

前 Google 科学家林德康详解:卷积神经网络如何应用于文本分类 | AI 研习社

CNN),大部分人首先会想到图像识别、图像分类、图像处理等视觉应用场景。的确,CNN
2017年3月24日

横评:五款免费开源的语音识别工具

需要提前说明的是:以下分析大多来源于我们的主观经验,同时也参考了互联网上的其他信息。而且这篇文章也并非一个覆盖所有语音识别开源工具的汇总类文章,我们只是对比了其中五款相对更主流的产品。另外,HTK
2017年3月24日

Facebook 最新论文:Mask R-CNN实例分割通用框架,检测,分割和特征点定位一次搞定(多图)

,下篇)就提到,做好图像识别,不仅能让Facebook的用户更精准搜索到想要的图片,为盲人读出图片中包含的信息,还能帮助用户在平台上销售物品、做社交推荐等等。
2017年3月23日

PyPy 双版本同步更新,不仅仅是快

原文地址:http://www.infoworld.com/article/3183527/application-development/pypy-powers-up-python-35.html
2017年3月23日

从原理到代码:大牛教你如何用 TensorFlow 亲手搭建一套图像识别模块 | AI 研习社

应用场景中,或许是源于视觉对人类的直观性和重要性,图像识别成为其中发展速度最快的一个。目前,该技术已经逐渐趋于成熟,并在人脸和情绪识别、安防、医疗筛查和汽车壁障等诸多领域都取得了重大成功。
2017年3月22日

原版教材太贵?这几本机器学习好书其实不需要花钱

原版下载地址:http://ptgmedia.pearsoncmg.com/images/9780133902839/samplepages/9780133902839.pdf
2017年3月20日

谷歌开源JPEG编码器Guetzli,压缩35%也能生成高质量图片

的目标用户是网站管理员和图形设计者。在多图网站中,Guetzli能够给用户提供更顺畅的体验,并且减少移动用户的加载时间和带宽消耗。此外,谷歌还希望这种新的尝试可以激励大家在图像和视频压缩领域的研究。
2017年3月18日

从SwiftScribe说起,回顾百度在语音技术的七年积累

TTS),采用语音编码技术存储合适的语音单元,在合成时通过解码与波形编辑拼接处理后生成相应的语句,一般合成的内容也比较有限,比如自动报时或报站等相对固定的内容,便适合采用这样的方法。
2017年3月17日

福利:如何用 Tensorflow 搭建一套图像识别模块? | AI 研习社

扫描下方海报上的二维码,关注“AI研习社”微信公众号,在菜单里点击“公开课”添加管理员,管理员会拉你进群交流。另外,转发下方海报到朋友圈,还有机会赢取《TensorFlow:实战
2017年3月16日

DeepMind 弹性权重巩固算法让 AI 拥有“记忆” ,将成机器高效学习的敲门砖

神经网络输入时,它会在数字神经元与输出方案之间建立联系,而当它学习新事物时,神经网络不得不重新建立新的联系,同时有效覆盖旧的联系。这样的情况被称之为“灾难性忘却”(catastrophic
2017年3月15日

亚马逊数据专家十年经验总结:成为数据科学家的关键四步

但我后来了解到,图中央的那一撮“独角兽”(中间“数据科学家”色块里的这帮人在圈内被称为独角兽)在现实中极其稀少。即便真存在这种人,也大概会是对各个领域都有涉猎、但没有一门精通的“通才”,而非专家。
2017年3月14日

为什么 GPU 会成为通用计算的宠儿?

你可以联想一下你们公司所面临的数据问题——那些数据量和复杂程度极高,你以前连想都不敢去想怎么处理,但深层次分析很有可能会有助于解决的问题。我怀疑这样的问题是可并行计算的——而
2017年3月13日

AI 研习社周刊 | 一周热点资讯回顾

论文:https://static.googleusercontent.com/media/research.google.com/zh-CN//pubs/archive/45857.pdf
2017年3月12日

加入 Kaggle 大数据竞赛,总共分几步?

Brownlee,机器学习专家,开发者,作家,企业家,曾在美国国防部门、初创企业和极端天气预报机构从事机器学习的相关开发工作多年。目前为了帮助机器学习领域更多的开发者,开设了一个名为
2017年3月10日

Facebook 开源新一代 AI 训练服务器,速度提升一倍

(开源计算项目),这个项目的主要目的是共享数据中心的硬件和软件设计,并相互协作,因此开源服务器的设计方案是
2017年3月9日

最近很火的《计算机科学的数学》是本什么样的书?

版现在还能在普林斯顿大学网站下载,地址:https://www.cs.princeton.edu/courses/archive/fall06/cos341/handouts/mathcs.pdf
2017年3月8日

数据科学入门难?老司机为你盘点 24 门精品课程

Venturi,他获有化学工程和经济学的双学位,热衷于数学、数据科学和统计学,同时也是一位编程爱好者。更具传奇色彩的是,这位本来在名校学习计算机和数据科学,但觉得自学效果更好——于是果断退学,从
2017年3月7日

Facebook 开源 FAISS;MIT 开发机器学习数据合成系统 SDV | 开发者头条

他们训练了一个机器学习算法,对人造地震发生前材料受压释放的声波成功进行了识别。考虑到地震预测课题的难度,研究团队对该技术在真实地震条件下的预测效果表示谨慎。但这项研究指出了一个新方向。
2017年3月6日

百度实时语音转换技术 DeepVocie;谷歌 Python Fire 等| AI 研习社周刊

从业者可能对其中大部分的气象、系统测试、航空动力装置、太空探索等领域的科研软件不感兴趣。雷锋网消息,NASA
2017年3月5日

百度实时语音转换技术 DeepVocie;谷歌 Python Fire 等| AI 研习社周刊

从业者可能对其中大部分的气象、系统测试、航空动力装置、太空探索等领域的科研软件不感兴趣。雷锋网消息,NASA
2017年3月5日

谷歌开源 Python Fire;一张图读懂 Python、R 的大数据应用等 | 开发者头条

通过谷歌搜索专利,深度分析谷歌搜索的技术实现,包括关联、搜索量、背景信息(比如用户搜索历史、地理位置)、问题替代等因素的考虑;并介绍谷歌采取的相应技术手段,比如关联信息数据库和
2017年3月3日

126篇殿堂级深度学习论文分类整理 从入门到应用(上)

地址:https://storage.googleapis.com/deepmind-data/assets/papers/DeepMindNature14236Paper.pdf
2017年3月3日

126篇殿堂级深度学习论文分类整理 从入门到应用(下)

地址:http://papers.nips.cc/paper/5346-sequence-to-sequence-learning-with-neural-networks.pdf
2017年3月3日

日韩三巨头联手推出 AI 语音助手平台;蓝牙、WiFi 版树莓派发布 | 开发者头条

详情:https://azure.microsoft.com/en-us/blog/hybrid-application-innovation-with-azure-and-azure-stack/
2017年3月2日

日韩三巨头联手推出 AI 语音助手平台;蓝牙、WiFi 版树莓派发布 | 开发者头条

详情:https://azure.microsoft.com/en-us/blog/hybrid-application-innovation-with-azure-and-azure-stack/
2017年3月2日

百度 Deep Voice 实现文本到语音的实时转换;迄今最强核弹 GTX 1080 TI | 开发者头条

地址:http://machinelearningmastery.com/challenging-machine-learning-time-series-forecasting-problems/
2017年3月1日

90%的人都从这里入门:十大机器学习公开课

周,远超大多数机器学习慕课。其覆盖的话题非常广,按先后次序包括:代数和概率论,机器学习的基础工具,概率图模型,AI,神经网络,主动学习,增强学习。课程内容和练习十分简洁明白,概念解释清楚到位。
2017年3月1日

小二,来一份机器学习书单!

书单,涵盖了最值得学习者、从业者、开发者认真研读的精品书目。这份指南适合多样背景的读者:从想要了解机器学习的普通人,到入门新手,再到高阶开发者和学术研究人员。因此,AI
2017年2月28日

谷歌发布 tf.Transform;微软剑桥推出 DeepCoder | AI 研习社周刊

资源1是国外大神总结的机器学习算法大合集,图中几乎包含了机器学习领域所有的常见算法。其中不但简单介绍了每一种算法的大概含义,还整理了它们的常见应用和优缺点,各位开发者绝对不可错过。
2017年2月26日

谷歌发布 tf.Transform;微软剑桥推出 DeepCoder | AI 研习社周刊

资源1是国外大神总结的机器学习算法大合集,图中几乎包含了机器学习领域所有的常见算法。其中不但简单介绍了每一种算法的大概含义,还整理了它们的常见应用和优缺点,各位开发者绝对不可错过。
2017年2月26日

Tensorflow 1.0;TensorFlow 兼容 Spark;Python 迁移到 GitHub | AI 研习社周刊

Corpus。该语料库允许研究人员对照一套包含法语,德语和英语的多回合双语对话数据集,衡量其自有对话翻译系统的质量和有效性,旨在帮助人们标准化测试其各自对话语音翻译系统的运行效果。
2017年2月20日

Tensorflow 1.0;TensorFlow 兼容 Spark;Python 迁移到 GitHub | AI 研习社周刊

Corpus。该语料库允许研究人员对照一套包含法语,德语和英语的多回合双语对话数据集,衡量其自有对话翻译系统的质量和有效性,旨在帮助人们标准化测试其各自对话语音翻译系统的运行效果。
2017年2月20日

【算法】机器学习算法实践 K均值聚类的实用技巧

Clustering(k均值聚类)的算法,其中包括如何衡量算法效果,以及如何确定你需要生成的数据段集数量。更多AI开发技术文章,关注AI研习社(微信号:okweiwu)。
2017年2月17日

TensorFlow 全网最全学习资料汇总之TensorFlow的技术应用【4】

地址:http://blog.csdn.net/whiteboy1999/article/details/53727376?locationNum=1&fps=1(点击文末阅读原文查看)
2017年2月16日

Tensorflow 入门与安装 | Tensorflow 最全资料汇总【2】

经过了以上来自民间的实践教程之后,相信各位读者对TensorFlow的大致情况和具体安装方法已经有了自己的理解。下面对于那些想要更全面和深入地了解TensorFlow的读者,我们推荐几个官方的教程。
2017年2月15日

Tensorflow的迭代更新 | Tensorflow 最全资料汇总【1】

那么为什么会产生TensorFlow系统,以及谷歌为何将其开源?这个问题可以看雷锋网文章《Google开源TensorFlow系统,这背后都有什么门道?》。(点击文末阅读原文查看)
2017年2月15日

Tensorflow框架平台的综合对比 | Tensorflow 最全资料汇总【3】

【AI研习社】关注AI前沿、开发技巧及技术教程等方面的内容。欢迎技术开发类文章、视频教程等内容投稿,邮件发送至:zhangxian@leiphone.com
2017年2月15日

【头条】百度推出基于AI的情人节魅力值测评;牛津大学2017自然语言处理课程公开 | AI开发者头条

Corpus。该语料库允许研究人员对照一套包含法语,德语和英语的多回合双语对话数据集,衡量其自有对话翻译系统的质量和有效性,旨在帮助人们标准化测试其各自对话语音翻译系统的运行效果。
2017年2月14日

科普小程序开发,让你1小时内从入门到上手|硬创公开课

的很多方法,目的是让小程序变成纯数据驱动的编程思想,也就是说所有的事件和所有的数据,一定是以事件或者是消息这样的方式来传递的,开发者没有办法主动的去拿到当前显示的
2017年1月13日

AI 如何助你成为“画家”|硬创公开课

除了打造“艺术滤镜”,人工智能还可以帮助用户根据需要生成图片、增加纹理、对原本像素很差的图片进行超分辨率处理,助你成为“画家”。其中用到的技术也与最近很火的“生成对抗网络”(GANs)有关。
2017年1月9日

创业6年,小米用白色MIX叩响了美国大门

那么问题来了,如果将千万级的研发投入看成一次品牌营销,这笔账到底该怎么算?会不会太奢侈了?小米内部人士告诉「唯物」:“其实划得来,我们要冠名综艺节目,那都是以亿为单位。”换句话说,小米
2017年1月6日

张小龙:小程序将无处不在(内附张小龙最新演讲全文)

在小程序之前我很愿意用这个时间解释一下去年的这个时候,当时也是在公开课,当时我提出了一个理念,这个理念后来我也发现很多的人说,看了以后觉得不太能够理解,所以我在这花几分钟重新来解释一下这个理念。
2016年12月28日

谷歌大脑是如何炼成的:万字无删减版全解密(上)

但一个真正智能的地图也能做一些亲密朋友所考虑不到的事情,比如你侄子的学校里,孩子们最近最时髦玩些什么。一个智能的机器能够通过错综复杂的数据抽丝剥茧,并寻找出那些甚至我们自己都浑然不知的需求。
2016年12月19日

王川:小米电视的边界

CEO,王川的角色更像一个仲裁者,一旦为产品找到了对标物,剩下的事就交给专业的人去做。所以,他对自己的判断非常自信:“不管雷总也好,我也好,都是一个完美主义者,要求比较高,所以我要是满意,这个市场上
2016年12月8日

Amazon开放Polly和Lex,为何语音交互技术的迭代如此之快?

事实上,从今年下半年语音交互市场的突然爆发,几乎每隔一个多月,语音交互的效果都会出现较大的提升。那么为何语音交互技术的迭代会如此迅速?可以从下面几点来窥得一斑:
2016年12月5日

来自南方的魅族,度过了艰难的2016

与供应链相比,渠道问题就显得轻松一些,李楠告诉「唯物」:“实际上魅族线下渠道是按照三千万规模布局的,但因为整个供货等等一系列问题,的确今年总量不会这么多,整个渠道和售后的建设可以支撑魅族走得更远。”
2016年12月2日

李志飞:出门问问是不是一家AI公司重要吗?

用户开始骂,骂我们是骗子,骂我们囤货,各种各样的言论都有。”为了安抚用户情绪,李志飞索性把内部所有的运行系统透明化,“就是我们现在做到哪一步了,今天我们工厂生产了多少、物流到了哪里等等。”
2016年11月16日

小米 MIX 的两种解释

从雷军的态度来看,对于小米MIX,他是抵触“成本优先,量产优先”这套逻辑的。不过,事情绝不是单方面的价值取向这么简单,要不然也不会出现:即使不会卖一台亏一台,即使黄牛把小米MIX
2016年11月3日

预告:在声学技术这件事上,小米MIX 怎么就黑科技了?丨硬创公开课

月中旬离职中科院,带领声学阵列和深度学习两个团队在峰瑞资本的支持下成立声智科技,主要致力于解决真实场景下的语音交互问题,实现“听你所言、知你所想”的愿景。目前声智科技的语音交互技术已经应用于包括
2016年11月2日

“演讲”刷屏,张小龙如此回应那些反驳他的声音

Path,开发也许只是一两天就搞定,但是跟发布版本的适配,更新计划,漏洞审查,甚至法务,这些通通都得过一遍,要是哪个环节出了问题,还得打回去重来。能说它不敏捷吗?不是,只不过出差错的代价太大了。
2016年10月30日

张小龙最新内部演讲:警惕 KPI 和流程

一说我才想到,大家发现我们在微信里面流量方面其实是非常的保守、非常谨慎的。我们所有业务不管是商业还是非商业的,我们去衡量它对用户具体带来价值是不是真的很大,然后再决定要不要使用这个流量。
2016年10月29日

品物|不是骨传导,为什么小米MIX开始尝试新奇的声学技术?

另外再补充一句,小米MIX依旧保留着3.5MM耳机插孔,这与苹果的策略倒是不太一致。终归来说,小米MIX的设计还是符合国内当前炫屏的需求,期待小米更佳的表现。
2016年10月27日

我找到了35台小米 Note 2,谁再说它抄袭三星我和他急!

废话不多说,第一张是我雷某位程姓编辑的成绩,第二张是小编的成绩,果然不比年轻人的眼力啊。
2016年10月26日

识人丨黄汪:3次归零,才有了10亿美金的华米

其实在做第一个公司的时候,我们就跟IDG谈过,IDG没搞懂这个东西,当然他们的判断也是对的,这个东西做不大,但是这个公司可以在一个专业领域活得很好也是对的,我就说你爱投不投,你不投我们也做得很成功。
2016年9月18日

品物丨关于iPhone 7,我只讲两点

黑色的全金属手机市面上也有,但是既是黑色又是全金属,还是阳极氧化+镜面抛光的手机,目前只有iPhone7,这是一种全新的金属工艺上色方案,这就是我想重点聊聊的初衷。
2016年9月8日

品物丨前Google高级管理林德康,做了一款你没见过的语音助手

scientist),主攻自然语言处理。在加入Google之前,林德康是加拿大Alberta大学计算机教授,发表过逾90篇论文、被引用超过12000次,他也是国际计算语言学会ACL
2016年7月18日

言商 | 华为潜入无人机领域,幕后帮手浮出水面

一家2016年3月份刚成立的公司,会在市场上提供基于海思视频监控芯片的无人机方案。根据芯片的影像性能,这家公司准备推出四种基础方案,面向消费级市场的高、中、低共3种,以及一种面向行业用户的方案。
2016年7月15日

沉寂4年的Siri终于开放:这是目前我们知道的全部细节

作为开发者而言,如果你的App功能正好跟以上7大领域22意图重合,那么是一个很好的机会去声明支持其中某一些意图,这样就可以让用户用语音的方式来启动你的应用,大大增加使用的便利性和用户粘性。
2016年6月15日