查看原文
其他

那些毕业生挤破脑袋也想去的中国AI公司

2018-03-05 二岳初 读芯术


全文共5084字,预计阅读时长5分钟



又是一波校园春招即将来袭,其中最吸睛的莫过于薪酬最高的AI岗位了,那么今天读芯君就和你聊一聊,那些毕业生挤破脑袋也想去的AI公司。



先来一波暖场的漫画~



当然以上纯属娱乐……


最有影响力的中国AI公司有哪些?此前,今日头条推出《人工智能影响力报告》,统计了当前中文领域最具影响力的AI公司、AI科学家在产学研的分布状况,以及知名度最高的AI应用。报告列出了中文领域里十大最受关注人工智能公司:百度谷歌、阿里巴巴、华为、苹果、特斯拉、小米、京东、微软、滴滴。


图片来自今日头条《人工智能影响力报告》


在这份榜单里,百度在中文领域热度超过谷歌。当然,影响力并不完全代表竞争力,没有进前10的公司里也不乏人工智能领域的佼佼者,比如专注AI硬件的英伟达,专注智能信息分发的今日头条,全力开源发展AI的Facebook。由报告可以看出:综合性AI公司的影响力远大于单一应用领域的AI公司。


下面,读芯术遴选出几家在AI领域有代表性的公司向同学们进行简要分析,其中既有综合性的AI公司(百度),也有独角兽AI公司——


百度:加速构建AI生态圈

 

国内十个应届生有九个都想去BAT。为什么?是因为工资高、待遇好或者公司光环?



我们以BAT中人工智能实力最强的百度为例。


 

近年百度在人工智能领域可谓是风光无限,大有“这是我的主场”的架势。


百度公司在语音识别、图像识别、人工智能操作系统、深度学习及无人驾驶等众多AI技术领域都达到了全球领先水平,AI技术则是核心加速器,百度正在为此奋力一搏。

 

人工智能是一个很宽泛的概念,包括了机器人、语言识别、图像识别、自然语言处理等分支领域。百度早早在人工智能领域布了局,基本上覆盖了人工智能所有主流的分支领域和流派。

 

晋升为国家人工智能开放创新四大平台之一,百度人工智能技术目前已逐渐迈入产品化阶段。前端的对话式人工智能系统Duer OS自动驾驶Apollo开放平台,以及后端的百度大脑和智能云,“能听会看”、“懂开车”,百度正加速构建生态圈,以此带来更多场景应用的落地。

 

师兄师姐侃校招经验


@kedebug

本人在校招拿了 BAT以及网易游戏等 offer,而且基本上都给了 Special,那就从我的角度来谈谈校招的体会。


1、冰冻三尺非一日之寒

综合身边一些拿到牛 offer 的同学,有个共同的特点就是:热爱这个行业。比如多读书、多看代码,一些计算机编程方面的经典书籍、GitHub 上面一些 star 越千的优秀开源项目,绝对值得多花时间研读。我自身的情况大概是本科期间积累了 10 万行的代码量,有了这个基础硕士期间阅读一些代码呀,参与一些开源呀,就变得水到渠成。


2、主动培养自己的动手能力

算法方面可以适当阅读算法导论、算法引论等书籍,多刷刷 leetcode, UVa 之类的培养出一定的解题思维。虽然说一些算法在工程中很难用到,但是解决问题的思路以及不断去优化业务代码的想法,这些意识是可以通过算法训练得到的。

一般国内的互联网公司还是比较看重项目经验这块的,能突出个性的地方也在于此了。这个方面可以从一些国外大学课程的大作业慢慢培养,如果跟着进度做完大作业的话,相信工程能力以及对系统设计的理解都会有很大的提高。


3、关于面试

面试在于突出自己的闪光点,体现自己的不可替代性。GitHub,StackOverflow 等是加分点,参与过开源项目大加分。嘴里说出的话可能有可以虚假夸大的成分,但是 GitHub上面的代码提交记录以及代码质量不会骗人。

我面试的过程中,就有几个面试官主动索要 GitHub 账号地址 kedebug · GitHub并且当场登陆查看相关项目情况,这都是能够提升自身形象大大利好的事情。


正所谓“江山代有才人出”,虽有BAT在AI界实力称霸,但近几年人工智能越来越受到资本的关注,应用场景不断拓展,近几年国内涌现了一大批优秀的初创公司,从机器视觉到自然语言处理,从语音识别到智能机器人,各个AI细分领域的“尖子生”可谓是“你方唱罢我登场”,一些AI创业公司也很受毕业生青睐。


旷视科技(Face++):拥有全球最大的人脸识别云平台



先来看一张成绩单:公司成立于2011年,C轮融资4.6亿美金,刷新全球人工智能领域单轮融资最高纪录,创始人只有29岁。这个成绩的创造者就是旷视科技(Face++)。

 

如果你关注人工智能,那你一定不会不知道旷视科技这家靠“刷脸”成名的公司,它拥有全球最大的人脸识别云平台,可以说在人工智能独角兽公司的名单中,是名列前茅的尖子生。支付宝、今日头条、滴滴、美图秀秀等人脸识别、在线身份验证,Face++就是他们的技术提供商。

 

要说旷视的发展,刚刚过去的一年它可是出尽了风头,其公司的物体检测技术分别在 COCO Detection等两项竞赛中摘下冠军桂冠。这个奖项的分量有多重?MS COCO Challenge 是计算机视觉领域最受关注和最权威的比赛之一,是图像(物体)识别方向最重要的标杆,也是目前国际领域唯一一个能够汇集 Google、Microsoft、Facebook三大巨头,国际顶尖院校以及优秀创新企业共同参与的大赛。

 

除旷视的物体检测技术获得双料冠军之外,旷视人体姿态估计技术也在 COCO 2017 最重要的竞赛项目之一——Human Keypoint(人体关键点检测) Challenge 中,击败所有强手夺得该技术世界第一的头衔。

 

除此之外,行人再识别技术、跨摄像头追踪技术、城市天眼系统、刷脸支付技术等在行业也遥遥领先。


师兄师姐侃校招经验


@林孟潇


一句话概括,这是我到目前遇到的最好的学习和研究的机会。

 

研究员/工程师很多都是隐藏大牛,我的mentor更是知名的神经网络专家,可以说在这里我彻底刷新了对神经网络的认识,在研究思路上更是得到难得的点化。另外公司内部非常开放,所以只要自己愿意,可以看到各种各样的研究方向。

 

在这里,实习生可以要求发paper,而且公司很鼓励实习生做第一作者,这点是很多学校老师不能提供的。

 

除了research,也会看到现实产品的需求,可以说是顶天立地,无论是想往学术界走还是往工业界走,能到face++实习一段时间都是很好的经历。


@ycszen  实习部门:Research Intern,就是前段时间拿了COCO双项冠军的那个组(傲娇脸)

 

这里可以体验到研究的快感。工作区是一个大的开放的空间,没有任何隔板(孙剑老师就坐在我的不远处哦)。而四周的墙上可以随处可见白板,白板上留着大家思维碰撞的火花。随时随地都可以和大牛们进行激烈地讨论。

 

我们组是每周都会讨论,最开始是关于idea的讨论和开脑洞以及一些论文分享讨论,后来当然就是去实现idea了。在实验室,只有我一个人做segmentation这个方向,而公司里会有更多同行者。我想这才是最重要的,有人可以讨论,有人给你指导,有人给你带路,而且每一个人都站在这个领域的前沿,会有一种我是在研究的踏实感。


今日头条:AI重新定义内容


 

当移动端获取新闻资讯在全球范围内逐渐成为主流,个性化的推荐俨然成为各个新闻客户端的标配。国内新闻资讯市场百家争鸣,内容战争全面升级,今日头条可以说是其中不能忽视的重磅级玩家。

 

也许很多人对它的印象仅仅停留在新闻客户端,其实一个以内容推荐、分发为核心的公司,智能算法自然是技术中最核心的部分。作为一款个性化信息推荐引擎产品,今日头条离不开数据挖掘、神经网络、自然语言理解、机器学习这些人工智能技术。


在追赶人工智能的路上,今日头条一直在尝试弯道超车。为避免与人工智能巨头的正面冲突,今日头条弯道超车,利用AI在内容分发领域发力,成为该领域的佼佼者。


今日头条在人工智能领域的优势还在于大数据分析,正是其强大数据分析向用户推送喜爱消息,才成为深受用户喜爱强大内容分发平台。


过去一年间,头条AI lab专注于人工智能领域的前沿技术研究,并将研究成果应用于今日头条产品中,提供了封面图自动选取、自动起标题和匹配摘要等机器辅助创作形式,并研发了自动写稿机器人,目前已生产5000余篇新闻稿件。

其实所谓的内容分发平台之争,背后实际也是AI之争。“用AI的技术重新定义信息与内容平台”。可以说今日头条是目前AI在实际应用层面,应用的最广泛的一款产品。


师兄师姐侃校招经验


@付鹏    ML/DL/NLP/推荐系统  实习生


公司强,真的强,机器学习,推荐系统相关方面,非常雄厚的技术积累。

我来之前是想在这里知识不学得差不多不离开,结果我现在快呆一年了,还在学习。

 

说说头条技术岗位的一些:


1.头条没有纯research,所有的research都是r&d,每个人都必须有良好的代码能力,能跑模型的同时要能写thrift,mc,hadoop,storm,pb等等等等。语言技术栈包括python,cpp和Go。

 

2.有严格的codereview流程,每个人的代码要通过review才能上线,通过review,代码能力的提升是飞快的。

 

3.不只是跑模型,要对模型有思考,有改进,更帮助业务。比如word2vec有没有能改进的地方?能不能改进一下negative sampling?xgb效率低有什么方法让predict更快一些?自己写一个cpp的模型parser,再利用连续内存存模型,会不会更快?如果struct内存对齐,会不会更快?

 

4.对性能的要求非常高,知乎前一阵子号称把spam识别从几百秒降低到几秒,当时我就震惊了,竟然还有几秒甚至几百秒的pipeline。头条没有这样,头条的pipeline基本都是毫秒级别,每个流程都要求毫秒级别的优化。头条的评论走过防spam等等一套流程后应该在200ms以内。

 

当然最关键一点,头条拥有的数据是最宝贵的东西,如果你的方向是机器学习和推荐系统并且有足够的野心,这数据就会让你不能自拔,在上面能做的事情简直太多了。

 

商汤科技:融资神话的缔造者


 

要说哪个创业公司最有“明星气”,那恐怕非商汤莫属了。除了拥有黄晓明、章子怡等娱乐圈一线明星的投资带来的流量关注度,还曾一夜之间成为了全球融资额最高的人工智能独角兽企业,巨额的融资使得商汤一直处于媒体的焦点。

 

成立于 2014 年的商汤科技,学术氛围浓厚是他们身上最显眼也最独特的烙印。原创能力是一个以技术为核心的公司必须具备的关键能力。商汤科技除了在发表论文、参与竞赛方面取得了不错的成绩,还拥有十分强大的变现能力。毕竟,实现技术落地才是一个企业延续命脉的关键。

 

人工智能的竞争,从某种角度来说就是人才的竞争。商汤科技是汇聚科学家数量最多的中国创业公司,注重人工智能领域的基础研究,对行业趋势极高的敏感性使得商汤科技一直保持在众多创业公司的前列。

 

当然,除了技术和人才方面的挑战之外,商汤也面临诸多的竞争对手。除了旷视、依图这些初创算法公司之外,一些大公司也在发力计算机视觉。


师兄师姐侃校招经验


这里有一份2017商汤科技春招实习笔试题总结,同学们可以看看,根据自己专业知识的掌握情况做进一步的学习规划。

 

@smallplum123

 

本人申请的岗位是见习算法研究员,笔试1个小时,20道选择填空题,3道编程题。时间略紧。涉及面也非常广,数学,智力,概率统计,线代矩阵,图形学,机器学习,神经网络,C++,均有涉及。


一、选择填空题(部分):

1. S市A,B共有两个区,人口比例为3:5,据历史统计A的犯罪率为0.01%,B区为0.015%,现有一起新案件发生在S市,那么案件发生在A区的可能性有多大?  (概率题,考查贝叶斯公式,牛客网有)

2. A = [1, 2 ; 2, 1],求A的k次方。(线代,对A进行对角化,求特征值以及特征方程)

3. git常用命令,克隆到本地是___,提交到仓库区____,取回远程仓库的变化,并与本地分支合并_____,  推送所有分支到远程仓库____,显示有变更的文件___(clone, commit, pull, push, status)

4. 表示矩阵需要多少个数字,表示矩阵的投影需要多少个数字?

5. 给出先序序列,中序序列,求后序序列。

6. 一个关于继承和虚函数问题。

7. 掷两个骰子,得到两个数字A,B,设 C = A+B,那么设 C 除以4 的余数为0,1,2,3的概率分别为p0, p1, p2,p3,求它们的大小关系。

8. 图片分辨率为512x512,pad = 2, stride = 3, kernel_size = 9, group = 4, 求卷积后输出分辨率大小。

9. 一个关于图形自由度的问题。(本人完全没概念,所以题目具体记不清了)

10. 以下哪个不能使用迭代器?a) map, b) set, c) queue, d) vector.  (c) 

11. 有两个样本点,第一个点为正样本,它的特征向量是(0,-1);第二个点为负样本,它的特征向量是(2,3),从这两个样本点组成的训练集构建一个线性SVM分类器的分类面方程是() (牛客网有)

12. 在一个无序数组中,求前k个数字,复杂度最小为? (O(n))

13.int func(x) 

    int countx = 0; 
    while(x) 
    { 
          countx ++; 
          x = x&(x-1); 
     } 
    return countx; 

求func(500)的值。(经典问题,相当于求500的二进制中1的个数)

14. 在其他条件不变的前提下,以下哪种做法容易引起机器学习中的过拟合问题()(d)
a) 增加训练集量
b) 减少神经网络隐藏层节点数
c) 删除稀疏的特征
d) SVM算法中使用高斯核/RBF核代替线性核

15.关于vector初始化的一个问题。

16.有4个车站连通情况如下,每辆车每天都会等概率随机从一个车站出发,然后在某个车站呆一夜,第二天再出发。求稳定之后,每个车站的车辆比例。  

 1——2
 |    /  |
 |   /   |
 |  /    | 
 | /     | 
 3——4  

( 根据马尔科夫链 平稳分布,π=πP( P为转移概率矩阵),和π1+π2+π3+π4=1,同时π1=π4, π2 = π3。可以求得答案2:3:3:2 )

二、编程题:

1. 连续子数组的最大和。(leetcode或剑指offer原题)

2. Minimum Window Substring .(leetcode 原题)

3. 具体题目忘了,大概是一个关于多线程和智能指针的问题。

 

(题目来源:

http://blog.csdn.net/smallplum123/article/details/69938232)



读芯君开扒


其实除了上文提到的公司,还有像科大讯飞、优必选、云知声等很多优秀有潜力的AI公司都是同学们比较青睐的。



综合以上几家公司所发出的招聘信息可以得出,精通Python、Java等任意一门编程语言并且具有扎实的数据结构和算法基础是最基本的。尤其是在AI领域机器学习的重要性,使得Python和C++工程师在算法和数据挖掘方面的优势更加凸显。


其次,人工智能领域所覆盖的范围很广,从机器学习、数据挖掘到图像识别、自然语言处理等领域,如果你又从事这些领域的工作经验或者实践经历都是极大的加分项。


如果在学校中没有接触过上述领域也没有关系,搜索引擎、个性化推荐等相关项目经验同样也是不小的加分项,因为这有助你快速掌握AI。


总而言之,做好准备,未来才会有脱颖而出的机会。


留言 点赞 发个朋友圈

我们一起探讨AI落地的最后一公里


作者:二岳初

参考文献链接:

http://www.sohu.com/a/121363041_348999

https://www.zhihu.com/question/25680951

https://www.zhihu.com/question/28881353

http://blog.csdn.net/smallplum123/article/details/69938232


如需转载,请后台留言,遵守转载规范


推荐文章阅读


闪开!AI高校排行榜来了!哪家戳中了你?

为啥人工智能的声音多是“妹纸”?

致国足:AI来了,你会不会突然出线?

Python这么火,原因在这里!

你以为报了AI培训班就真的能入行?

冬奥会“北京8分钟”:中国AI开挂了

“最燃的AI岗位是哪个?”“AI产品经理啊!”

对AI最花痴的城市是这些!你的家乡上榜了没?

大家一起来找茬,全都找到算我输

韩国留学生带你零距离看冬奥

人类智能搞不定春晚了,人工智能上!

你说虐不虐?!我用AI表白后,她竟然说“好哒”!

中国高校在AI领域没存在感?原因是…

为什么很少有大学开设Python课程?

谁能想到,奥运志愿者和裁判员都不是人…

毕业想从事AI,要不要转专业到计算机?

想成为AI公司的实习生?会这些才够格

AI撩你出轨了?呵呵

一周入门,一年自通,机器学习没那么难

文科生不服!谁说AI只是理工科的天下?

天呐,这些高校AI开课了!但我发现……

哦活活,在这个领域,AI没有任何一点比得上人类!

用这招,看男朋友到底是不是直男!

懵逼了!我AI还没入门,熊孩子已经玩起了Python

老娘我在百度实习这么嗨,都是因为对自己狠

“读芯术杯”冲顶大会——人工智能专场

斯坦福“AI Index”年度报告说了哪些你不知道的

阅读理解做不过AI?我不服

当心,AI偷走你的声音

上帝不愿咬的那个苹果,为什么是他?

这样面试,你的成功率将达到90%


长按识别二维码可添加关注

读芯君爱你



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存