《智能时代》。4星。大数据与人工智能的科普。
全书基本是大数据与人工智能的科普,讲大数据与人工智能的基本原理与有趣的应用。我的评价是4星,作者曾经战斗在这个行业的第一线,对行业的了解在广度和深度两个维度都不错。
以下是书中一些重要的信息与观点的摘抄:
1:计算机科学家们认为,如果计算机实现了下面几件事情中的一件,就可以认为它有图灵所说的那种智能:1:语音识别;2:机器翻译;3:文本的自动摘要或者写作;4战胜人类的国际象棋冠军;5:自动回答问题。 P44
2:但是到了2012年,情况发生了变化,一个名叫内德·斯维尔(Nade Silver)的年轻人,利用大数据,成功地预测了全部50+1个州的选举结果。这让包括盖洛普公司在内的所有人都大吃一惊。P70
3:当然,虽然机器的智能在不断地提高,但总是有几件事情一直做得不好,因此人类还可以很自豪地说自己的智能水平比机器高。P81
4:简单芝讲,我们建立起了一个由世界各地科学家和工程师组成的联合团队,按照大数据处理的思路,经过两年的努力,使得计算机能够回答30%的复杂问题,包括“天为什么是蓝色的”之类的问题,按照当年图灵博士的定义,我们实际上已经让计算机具有了某种等同于人类的智能。P84
5:在两个世纪之前,"机械思维"可是一个时髦的词,就如同今天我们说互联网思维、大数据思维很时髦一样。可以毫不夸张地讲,在过去的三个多世纪里、机械思维可以算得上是人类总结出的最重要的思维方式,也是现代文明的基础。P90
6:后来人们将牛顿的方法论概括为机械思维,其核心思想可以概括成这样几句话:第一,世界变化的规律是确定的;第二,规律不仅是可以被认识的,而且可以用简单的公式或者语言描述清楚;第三,这些规律可以应用到各种未知领域指导实践。P98
7:与机械思维是建立在一种确定性的基础上所截然不同的是,信息论完全是建立在不确定性基础上,而要想消除这种不确定性,就要引入信息。至于要引入多少信息、则要看系统中的不确定性有多大。P118
8:美国一共只有5000多种处方药,人类会得的疾病大约有一万种。如果每一种药和每一种疾病进行配对,就会发现一些意外的惊喜。P129
9:根据大量数据的统计结果,我们发现这样一些广告和内容的搭配效果非常好,很多和我们的想象不大相同,比如:在电影租赁和收看视频的网站上,放上零食的广告;在女装网站上,放男装的广告;在咖啡评论和销售网站上,放信用卡和房贷的广告;在工具(Hardware)评论网站上,放上快餐的广告;等等。P134
10:在南卡罗来纳州的多切斯特县(Dorchester Cormty),警察通过智能电表收集上来的各户用电情况分析,抓住了一个在家里种大麻的人。P149
11:戴维发现美国的许多酒吧之所以经营不下去,除了一般所说的经营不善,更重要的是大约23%的酒都被酒保们偷喝了。P167
12:我们找到了一种方法,能够对每一种关键词的组合做专门的处理。Google在2003年一整年中,搜索质量的改进一半是靠这个方法,至于我们是怎么做到的,说起来可能会显得很没有技术含量:穷举。 P179
13:Google自动驾驶汽车项目其实是它已经成熟的街景项目的延伸。对Google自动驾驶汽车的各种报道通常都会忽视一个事实,那就是它只能去Google“扫过街”的地方。 P183
14:在历史上,一项技术带动整个社会变革的事情也曾经发生过。它们通常遵循一个模式,即:新技术+原有产亚=新产业 P186
15:2010年,Google宣布开发出名为Google大脑(Google Brain) 的深度学习工具。从机器学习理论上来讲,它没有任何突破,只是把过去的人工神经网络并行地实现了。但是从工程的角度上来此它有非常大的意义。P251
16:麻省理工学院计算机和人工智能实验室(MIT CSAIL)的研究表明,利用大数据(2 000万用户产生的36亿行的系统日志)分析来防范黑客攻击,要比传统的在防火墙设置各种规则的做法有效5倍。P259
17:由于有大量的传感器在采集数据,这种自动滴灌系统可以对用水量和产量的关系进行学习,改进灌溉量。自。二战"后立国以来,以色列的农业生产增六十多倍,而每亩地的用水量仍保持不变。P279
18:根据数据分析的结果,勇士队的管理层设计的新打法是尽可能地从24英尺(大约7.3米)外的三分线投篮,这样可以得3分。正是因为不再按照篮球传统的战术作战,勇士队才卖掉了那些价钱高却效率低的明星,而着重培养自己看中的新人。P283
19:特斯拉颠覆现有汽车产业所做的另一件事,就是取消存在了一个世纪的汽车代理商制度。P290
20:2012年Google科学比赛的第一名授予了一位来自威斯康星的高中生,她通过对760万个乳腺癌患者的样本数据的机器学习,设计了一种确定乳腺癌癌细胞位置的算法,位置预测准确率超过了目前专科医生的水平。这位年轻学生采用的图像处理和机器学习算法都不复杂,她的成功完全得益于大数据,没有哪个大夫一生能够见识760万个病例。P298
21:该中心通过研究发现,其中不少药其实对特定的人群有效,现在的关键是找到那些特定的人群,让那些研制过程中被淘汰的所谓“废药”经过改造后能够重新被利用。P305
22:X团队目前和美国4个大型城市合作,试用了该系统,结果表明使用者每天可以节省20分钟左右的通勤时间。不要小看这2o分钟时间,如果像北京这样的大都市每人每天能在通勤上节省20分钟时间,社会效益是非常可观的。P324
23:在公共场合安装这样的识别装置采集历史数据,一旦有外来的可疑分子(带有不认识的设备,或者已被怀疑的设备),就可以开始预警,并且配合视频监控跟踪那些人。P325
24:为什么每一次重大的技术革命都需要很长的时间来消除它所带来的负面影响呢?因为技术革命会使得很多产业消失,或者产业从业人口大量减少,释放出来的劳动力需要寻找出路。这个时间有多长呢?事实证明至少要一代人以上。P351
25:可以说,如果没有占领华尔街的人所反对的这2%的人,美国早就成了三流国家,甚至至混得比希腊还要惨。P361
26:在历次技术革命中,一个人、一家企业,甚至一个国家,可以选择的道路只有两条要么进入前2%的行列,要么被淘汰。P364