Quantcast

袁伟时:中国的奴性和戾气从哪里来?

“芯片大学”虚晃一枪,人才断层问题不能跑步解决

两大中国首富双双被重挫-释放信号强烈

女大学生卖yin日记事件浙江农林大学回应:正在精神病院治疗

【成都mc是什么】成都mc浴室小黑屋见闻(史诗级巨瓜)

Facebook Twitter RSS

分享到微信朋友圈

点击图标下载本文截图到手机
即可分享到朋友圈。如何使用?

自由微信安卓APP发布,立即下载!

大数据

程序员为什么要学深度学习?

如果我们对于学习深度学习没有任何疑虑的话,接下来就一定会关心我需要掌握什么样的知识才能让我进入到这个领域。这里面最重要的关键技术就是“神经网络”。说起“神经网络”,容易混淆是这样两个完全不同的概念。
2016年11月11日

Intel研究院院长吴甘沙:大数据分析师的卓越之道(珍藏版)

以赛亚柏林有个比喻,有一种人是刺猬,一招鲜吃遍天,还有一种是狐狸,一把钥匙开一把锁,以更开放的态度处理分析、选择最合适的模型。一个技术用到极致是非常厉害的,像贝叶斯,有个很著名的分析师叫Nathan
2016年5月18日

揭秘47万微信群和2亿微信用户背后的数字规律

亿的活跃用户(MAUs))。透过图片、视频、位置信息、音频及文字信息,这些工具已经丰富了人们的沟通方式。更重要的是,它们也促进了社交群组的形成,较传统短讯信息而言,为人们带来了更强烈的社交感受。
2016年5月8日

高能干货:OpenCV看这篇就够了,9段代码详解图像变换基本操作

因此,我们在这里介绍一下噪声的消减方法,可以用在图像的预处理上。与此同时,对训练数据添加适量噪声,可以使训练后的模型更加鲁棒,对模型的性能提升有一定帮助。因此,为图像添加噪声可以起到数据增强的作用。
2019年6月30日

终于有人把中台说清楚了

在过去几年中,借着移动互联网的红利,许多公司都高速发展,进行大规模业务拓展,业务拓展的速度足够快,对公司自然是好事,但是随着而来的问题就是,公司内部出现了大量的重复建设和资源浪费的现象,重复造轮子。
2019年6月27日

18段代码带你玩转18个机器学习必备交互工具

遗憾的是,我们只能探索其中一部分,这里列出了我过去用过的好东西或者从别人那里听来的好东西(还有成千上万可能同样好的东西—寻找那些为小型企业提供良好支持的人,在成交之前他们往往会提供演示和测试账户)。
2019年6月27日

2019最佳工作、平均年薪达百万!想入行,先看这10本书

推荐语:实践性很强的深度学习工具书,既适合希望快速学习和使用Keras深度学习框架的工程师、学者和从业者,又特别适合立志从事深度学习和AI相关的行业并且希望用Keras开发实际项目的工程技术人员。
2019年6月25日

Python有哪些技术上的优点?比其他语言好在哪儿?

但请别误会:“免费”并不代表“没有支持”。恰恰相反,Python的在线社区对用户需求的响应和商业软件一样快。而且,由于Python完全开放源代码,提高了开发者的实力,并产生了一个很大的专家团队。
2019年6月24日

“芯片砸钱不行,得砸数学家”!8本烧脑数学书,大牛都在看

本书旨在指导学生初步掌握数学建模的思想和方法,共分两大部分:离散建模和连续建模,通过本书的学习,学生将有机会在创造性模型和经验模型的构建、模型分析以及模型研究方面进行实践,增强解决问题的能力。
2019年6月23日

从用户不足2000万到27亿,这项技术真要上天了?

三位作者均是区块链领域的资深技术专家,均是Stellar社区的早期参与者、深度参与者和技术布道者,为Stellar在中国乃至全球的发展做出了重要贡献。本书得到了Stellar创始人Jed
2019年6月20日

手把手教你学Python:一文看懂字符串基本操作

操作first[0]得到包含first第一个字母的字符串,second[0]获取第二个名字的首字母。最后,使用字符串"&"连接两个单字母的字符串得到长度为3的字符串initials(见图2-4)。
2019年6月19日

5G元年,你最该搞懂的技术竟然是……

导读:4G改变生活,5G改变社会。5G是下一代移动通信技术,5G的应用将渗透到社会生活和生产的各个领域,比如沉浸式媒体、自动驾驶汽车、智慧工厂/城市/建筑、互联健康、下一代教育等。
2019年6月17日

入门干货:Python操作Word文件经验分享

load_workbookwb=load_workbook('teset/test_name_list.xlsx')ws=wb['name']names=[]for
2019年6月16日

父亲节,来认识一下这几位“爸爸”

推荐语:人工智能之父、图灵奖得主马文·明斯基对科学和人性的浪漫主义解读。一本引领时代的著作,影响了凯文·凯利,艾萨克·阿西莫夫,侯世达和雷·库兹韦尔。豆瓣评分8.9分的大师经典。
2019年6月15日

想用Python爬小姐姐图片?那你得先搞定分布式进程

第一步:建立task_queue和result_queue,用来存放任务和结果task_queue=Queue.Queue()result_queue=Queue.Queue()class
2019年6月13日

深度学习高能干货:手把手教你搭建MXNet框架

之前提到过,Symbol模块采用的是符号式编程(或者称为静态图),即首先需要定义一个计算图,定义好计算图之后再执行计算,这种方式虽然高效,但是对代码调试其实是不大友好的,因为你很难获取中间变量的值。
2019年6月12日

手把手教你用OpenCV实现机器学习最简单的k-NN算法(附代码)

简单而言,k-NN算法认为一个数据点很可能与它近邻的点属于同一个类。思考一下:如果我们的邻居是红队球迷,我们很可能也是红队球迷,否则我们可能很早之前就搬家到其他地方了。对于蓝队球迷而言也是这样。
2019年6月10日

41款实用工具,数据获取、清洗、建模、可视化都有了

推荐语:本书系统介绍如何用主流智能技术实现大数据分析。详细介绍了数据科学领域的相关智能技术,包括数据分析、基本学习算法、模糊逻辑、人工神经网络、基因算法和进化计算、使用R语言进行大数据分析等。
2019年6月9日

你是怎样“被平均”的?细数统计数据中的那些坑

我们能不能准确地知道美国到底有多少人在报税单上做过手脚,多少人有过婚前性行为,多少人开车打手机,或多少人使用违禁药品?如果你想象一下做这些统计的细枝末节,那么我们怀疑你的答案肯定会是“不太可能”。
2019年6月8日

高能!8段代码演示Numpy数据运算的神操作

Numpy支持高阶、大量计算的矩阵、向量计算,与此同时提供了较为丰富的函数。Numpy采用友好的BSD许可协议开放源代码。它是一个跨平台的科学计算库,提供了与Matlab相似的功能和操作方法。
2019年6月5日

Python爬取42年高考数据,告诉你高考为什么这么难?

可以看到,不同省份的985和211录取率有着比较明显的差距,12个省份的985录取率低于1.5%,安徽,河南,江苏和贵州更是低于1.2%,作为山东考生的作者也不由得表示“自愧不如”。
2019年6月4日

真正零基础Python入门:手把手教你从变量和赋值语句学起

常量是指指定了初始值后,其值不应该再改变。一些语言允许程序员显式地标记常量,并且在你试图修改常量的值时会产生语法错误。Python由程序员自己保证常量的值不被改变。所以,常量名全部大写是一个惯例。
2019年6月3日

Python实操:手把手教你用Matplotlib把数据画出来

最后,可以使用plt的subplot函数绘制全部数字的样例。subplot函数与MATLAB中的函数一样,需要指定行数、列数以及当前的子绘图索引(从1开始计算)。我们将使用for
2019年6月2日

有关华为、5G、芯片和操作系统,这些书你读过几本?

本书适合作为高等院校物联网工程、通信工程、网络工程、电子信息工程、微电子和集成电路等相关专业的教材,也适合传感器和芯片研发人员阅读,另外也适合作为智慧城市建设等政府管理部门相关人员的参考读物。
2019年5月30日

什么是数据?数据科学家需要掌握哪些技能?终于有人讲明白了

依赖于公司(organization)的性质、规模以及业务范围,数据科学家的工作将发生变化。他工作于以数据处理为主要业务的公司。在这种情况下,对数据科学家而言机器学习和统计数据处理是十分重要的技能。
2019年5月29日

你为什么选择Python?4000名用户提到了这些原因

除了以上的设计宗旨,Python还包含模块化、OOP在内的一些工具来自然地提升程序的可重用性。而且由于Python致力于提升编码质量,Python程序员也都自然而然地秉承了这一理念。
2019年5月28日

回顾计算机产业发展的4个阶段:美国企业统治全球市场了吗?

IBM不仅统治了美国计算机市场,还统治了欧洲和日本计算机市场。一个在美国兴起的小规模国内产业,凭借政府补助、有保障的政府市场、产业保护的组合拳优势,进而在欧洲、日本占据市场并保持了优势地位。
2019年5月27日

结婚生娃和去核电站参观,哪个更安全?

从新闻的角度来说,车祸频发,一场车祸很难引发持续关注,而每次空难几乎都是全球性的大新闻。尤其在当前的移动互联网时代,不需要你主动去“打听”,这些大新闻会第一时间填满你的社交网络,给你留下深刻印象。
2019年5月26日

5G时代必读的6本技术书

7、8、9全面更新,Java程序员必备参考书。包含大量完整的示例代码和透彻的技术分析!通过90条经验法则,探索新的设计模式和语言习惯用法,帮助读者更加有效地使用Java编程语言及其基本类库。
2019年5月24日

为什么Flink会成为下一代大数据处理框架的标准?

在这些情况下,通过基于分布式快照技术的Checkpoints,将执行过程中的任务信息进行持久化存储,一旦任务出现异常宕机,Flink能够进行任务的自动恢复,从而确保数据在处理过程中的一致性。
2019年5月22日

用Python实现磁盘IO操作全攻略,让数据流动起来!

假如我们想在不同的编程语言之间传递对象,把对象序列化为标准格式是关键,例如XML,但是现在更加流行的是序列化为JSON格式,既可以被所有的编程语言读取解析,也可以方便地存储到磁盘或者通过网络传输。
2019年5月20日

聪明人也会掉进去的5个思维陷阱,你能躲过几个?

假如有人问你,恐怖主义和饥饿,哪个对人类安全的威胁最大?你听得最多的说法是什么?哪个问题有好几个大型政府机构都致力于降低它的影响?你是不是会说“恐怖主义”?那么,你犯错的概率可能要上涨几千个百分点。
2019年5月19日

4段简短代码教你用Python读写Excel

但当数据量大到用Excel打开都要好久,电脑打开文件都会死机的时候,这种也就不适合用office工具了,也或者我们想进一步提升能力的时候,需要学习一些hardcore技能,即用编程语言做数据分析。
2019年5月16日

8个应用案例告诉你,机器学习都能做什么?

注:按时间顺序排列的表(像我们今天这样记录小时、分钟和秒的个人计时器)在伽利略年代并不存在。相反,时间是通过计算每一个球滚下斜坡时从壶嘴滴落到小杯里的水量来计算的。这种聪明的计时装置被称为“水钟”。
2019年5月15日

从计算机视觉到人脸识别:一文看懂颜色模型、信号与噪声

我们平时用得最多的RGB颜色展示模式也就是24比特展示的。这种方法分别将红、绿、蓝3种颜色使用8比特无符号整数来表示。8比特无符号整数表示的范围就是0~(28-1),也就是[0,255]的整数区间。
2019年5月14日

什么是Apache Spark?这篇文章带你从零基础学起

通过注册这些转换,RDD提供数据沿袭——以图形形式给出的每个中间步骤的祖先树。这实际上保护RDD免于数据丢失——如果一个RDD的分区丢失,它仍然具有足够的信息来重新创建该分区,而不是简单地依赖复制。
2019年5月12日

如果数据有质量,地球将成黑洞?

在少数情况下,面对新的问题,我们需要从头开始收集数据,或者至少需要重组和准备数据。事实上,如果问题是全新的,那么可以选择适当的数据,这个过程应该与下一步特征选择合并,这样可以仅收集需要的数据。
2019年5月9日

干货:一文看懂网络爬虫实现原理与技术(值得收藏)

在搜索引擎查询某个关键词的时候,会出现一个排名结果,在排名结果中,通常会有大量的网页,但是,大部分用户都只会关注排名靠前的网页,所以,在爬虫服务器资源有限的情况下,爬虫会优先更新排名结果靠前的网页。
2019年5月8日

一文了解人脸识别:从实现方法到应用场景都讲明白了

我们这里指的人脸分类主要包括判断人脸图片中的人脸是男人还是女人,所属的年龄区间是怎样的,是什么样的人种,该人的表情是什么等。当然,人脸分类能够实现的功能远不止于此,在很多场景中具有重要的应用价值。
2019年5月6日

8本前沿技术书,助力这届「青年人」将科幻变成现实

一直看到这里的你,一定是爱读书的人。欢迎加入大数据读书会微信群,结识更多同行业小伙伴,我们将在群里额外送书!未来还有更多福利等你认领!(请在后台回复读书会,获取进群方法)
2019年5月3日

戳破“砖家”假面:唯快不破的时代,为什么这件事一定要慢慢做?

每一个你想要找打答案的问题,我们可敬的专家们往往都是意见不一,但是专家们多多少少为我们提供了合情合理的观点,为我们的思考提供了素材,而你则需要具备“批判性思维”才能在众多答案中抽丝剥茧,辨别真伪。
2019年5月2日

手把手教你挖掘数据:怎样创造一个“尿布与啤酒”的都市传奇?

在实现Apriori算法之前,我们要特别关注生成候选项集的几条重要方针。虽然计算2-项集是很费时的,但这是整个过程中最为密集的工作了。由于前面提到的闭包属性,后续的数据可能构建的项集比之前更少。
2019年4月28日

Spark入门必读:核心概念介绍及常用RDD操作

[numTasks]):对KV类型的RDD进行关联,只能是两个RDD之间关联,超过两个RDD关联需要使用多次join函数,join函数只会关联出具有相同Key的元素,相当于SQL语句中的inner
2019年4月25日

网络爬虫有什么用?怎么爬?手把手教你爬网页(Python代码)

但是有时会出现这种情况:即使POST请求的数据是对的,但是服务器拒绝你的访问。这是为什么呢?问题出在请求中的头信息,服务器会检验请求头,来判断是否是来自浏览器的访问,这也是反爬虫的常用手段。
2019年4月24日

如果你还在996,把这些书送给老板看看

21条时间管理法则,让千万人受益。在过去的20多年里,本书的方法帮助人们成功地实现效率的提升和自我管理,大多数人运用书中的一系列方法和技巧,实现了职位提升,收入翻倍,个人长期目标和人生目标完美实现。
2019年4月22日

以5个数据库为例,用Python实现数据的提取、转换和加载(ETL)

Neo4j是一个高性能的,NOSQL图形数据库,它将结构化数据存储在网络上(从数学角度叫做图)而不是表中,是一个嵌入式的、基于磁盘的、具备完全的事务特性的Java持久化引擎。
2019年4月18日

如果你不想长期996,看看这个

Press机器学习领域畅销教材!知名媒体推荐的十大机器学习入门教材之一。新西兰惠灵顿维多利亚大学数学与统计学院史蒂芬·马斯兰教授所著。南京大学计算机科学与技术系高阳教授、商琳副教授联袂翻译。
2019年4月17日

5G辐射大吗?关于基站和手机辐射,这篇文章彻底讲明白了

况且,我们国家对公众移动通信基站设备实施严格的入网许可制度,关键设备入网前必须进行检测、核准。通信基站投入使用前,需进行电磁环境测试和设备抽检。设置基站时,必须向主管部门提交申请和报送技术资料。
2019年4月15日

数据采集技术揭秘:手把手教你全埋点技术解决方案

个直接子类,它们分别代表一种特定类型的元素。五个子类各有各的用处并且有各种独有的方法,在使用的时候可以强制将Element对象转换成其中的任何一种,但是必须满足转换的条件,不然会抛出异常。
2019年4月15日

那些“反人类”的用户体验,都错在哪了?

综上,我们从直觉、定义以及一些简单的心理学概念的角度,结合日常生活中的用户体验例子,尝试理解“用户体验设计”这个领域。如果你有兴趣,本文结尾有一些中英文延展阅读,对以上的话题做了专业、详尽的讨论。
2019年4月14日

一文看懂数据挖掘:哪一种方法最好?都需要哪些技术?

这种方法的优势之一是,迭代是内建的。在特定步骤之间,分析人员将检查当前步骤仍然与之前的某些步骤保持一致。另一个优势是明确地提醒分析人员,即使在评估步骤中也要将业务问题放在项目的核心位置。
2019年4月11日

什么是机器学习?有哪些算法和分类?又有哪些应用?看完你就懂了

迁移学习是指当在某些领域无法取得足够多的数据进行模型训练时,利用另一领域的数据获得的关系进行学习。迁移学习可以把已训练好的模型参数迁移到新的模型,指导新模型训练,更有效地学习底层规则、减少数据量。
2019年4月9日

什么是网络爬虫?有什么用?怎么爬?终于有人讲明白了

随着大数据时代的来临,网络爬虫在互联网中的地位将越来越重要。互联网中的数据是海量的,如何自动高效地获取互联网中我们感兴趣的信息并为我们所用是一个重要的问题,而爬虫技术就是为了解决这些问题而生的。
2019年4月7日

干货:12个案例教你用Python玩转数据可视化(建议收藏)

Notebook里面使用这个库。我们将在一个普通matplotlib图上添加一个悬浮工具提示。这里我们会使用mpld3包作为使用d3.js的桥梁。这个示例不需要任何JavaScript编程。
2019年4月3日

OMG!这1010本书的书名都是什么鬼?

针对无人机爱好者以及零基础的读者,系统并且详细地介绍无人机的工作原理、构建步骤以及制作过程中所遇难题的解决方法等。本书通过小型无人机航空摄影、摄影测绘和三维建模,全面解析基于视觉的无人机系统。
2019年4月1日

这本书人手一本,杠精能少97%?

现在,O是不正确的,所以T是不正确的,或者A1是不正确的。按我们9012年“正常人”的世界观,我们不会多想,就认定T是不正确的;但按地平说学会成员的世界观,他们会认定A1是不正确的。
2019年3月31日

中国离婚大数据:离婚/结婚比东北三省和四大直辖市霸榜

这届年轻人“热衷”于离婚的原因,恐怕数据无法告诉你。实际上,这个“为什么”是很难说清的,感情的事,当事人自己未必能想明白。那些“离婚率n连涨,竟然是这个原因”之类的标题,都是耍流氓。
2019年3月29日

Python必备基础:这些NumPy的神操作你都掌握了吗?

在机器学习或深度学习中,会经常遇到需要把多个向量或矩阵按某轴方向进行合并的情况,也会遇到展平的情况,如在卷积或循环神经网络中,在全连接层之前,需要把矩阵展平。这节介绍几种数据合并和展平的方法。
2019年3月27日

数据处理入门干货:MongoDB和pandas极简教程

「大数据」为您提供大数据、人工智能、区块链、互联网等领域创新思维、前沿知识、最新技术、应用前景和案例分析,期待与您共同发掘其中潜藏的机会与价值。
2019年3月26日

以女大学生相亲为例,给你讲明白数据挖掘算法

支持向量机和神经网络很相似。但是神经网络的划分依据是随机产生的,不是预测风险最小的分割方式。支持向量机本质上是形成一个超平面对数据点进行分割,但并不是所有的点对形成超平面的作用都很重要。
2019年3月24日

Google大佬手把手教你从数据中挖掘价值:好产品是怎样炼成的

测试的统计功效取决于最小检测效应。较大的差异更容易被捕捉到。比如,假定部分营员可搭乘的士去往山顶,则不同分组抵达山顶的时间将产生巨大差异。相较而言,MDE较小时,则需要功效更强的实验以有效捕捉差异。
2019年3月21日

入门中文NLP必备干货:5分钟看懂“结巴”分词(Jieba)

社区活跃。截止本文发布前,Jieba在Github上已经有17,670的star数目。社区活跃度高,代表着该项目会持续更新,实际生产实践中遇到的问题能够在社区反馈并得到解决,适合长期使用。
2019年3月20日

压力、焦虑远远超出全国平均值,近4成程序员心理不健康?

导读:近日,《心理健康蓝皮书:中国国民心理健康发展报告(2017~2018)》发布。其研究数据表明,IT从业者在身心健康方面呈现高压力、高焦虑、高幸福、低抑郁、低倦怠的“三高两低”状况。
2019年3月16日

从Python安装到语法基础,这才是小白都能懂的爬虫教程

当界面出现提示符>>>时,就表明进入了Python交互式环境,输入代码后按Enter键即可运行Python代码,通过输入exit()并按Enter键,就可以退出Python交互式环境。
2019年3月14日

「π」里藏着所有人的银行卡密码和生日?

https://www.dailymail.co.uk/sciencetech/article-5500077/Pi-Day-celebrated-todays-Google-Doodle.html
2019年3月13日

什么样的数据才有价值?应该怎样收集和处理?终于有人讲明白了

本文介绍实验方法的基本原则,以及如何将这些原则以一种快速可拓展的方式——A/B测试——在互联网产品与体验的设计流程中进行实践。希望你能对相关名词和概念熟稔于心,可以继续深入了解A/B测试的相关实践。
2019年3月12日

被两会代表频繁“点名”,2019的第一波风口要来了?

以区块链技术为核心构建的价值互联网将深刻改变未来的金融与经济格局。文明向前发展,有些成果的出现乃是必然。互联网正在彻底改变我们的生活,移动互联网、大数据、云计算以及物联网接踵而至。现在,区块链来了。
2019年3月9日

女神节,来聊聊这几位神一般的“程序媛”

全面、深入地探讨了编译器设计方面的重要主题,包括词法分析、语法分析、语法制导定义和语法制导翻译、运行时刻环境、目标代码生成、代码优化技术、并行性检测以及过程间分析技术,并在相关章节中给出大量的实例。
2019年3月7日

马化腾提议加强基础科学研究,中国“芯痛”能解决吗?

导读:今年“两会”,全国人大代表、腾讯董事会主席兼首席执行官马化腾提交了7份书面建议,涉及产业互联网、基础科学研究、科技伦理、粤港澳大湾区、未成年人网络保护、就业、生态环保等热点问题。
2019年3月6日

数据又多又散,“孤岛困境”怎样破局?

如今这么多公司把自身的应用/服务托管到云端,这些应用/服务用起来就跟部署在本地一样,但是企业不必考虑维护和管理应用/服务所需的基础架构。这些仅仅依赖云端环境的产品,最吸引企业的一点是它们的收费方式。
2019年3月4日

从数据角度看,每家公司只有2种角色:看看你更适合哪一种?

市场营销是获取与用户的统计学特征、目标受众相关的专家见解的一种方式。你的营销团队将帮助你了解不同类型用户间可能存在的差异,以及基于年龄、性别、地理位置、文化、语言及其他重要功能的用户的重要行为模式。
2019年3月3日

实用干货:7个实例教你从PDF、Word和网页中提取数据

+运算符被称为连接符,它将字符串连接为单个str对象,产生一个新的字符串。如前所述,我们也可以使用*运算符对字符串做乘法。此外,需要注意的是这些操作不会添加任何额外的内容,例如在字符串之间插入空格。
2019年2月28日

怎样教一台计算机区分猫和狗?一文零基础入坑机器学习

为了测试,需要从新图片中提取我们设计的特征(鼻子大小和耳朵形状),并简单检查一下它们落入特征空间中直线的哪一侧。在这个例子中,如图1-5所示,测试集中所有猫的图片以及两张狗的图片都被正确识别出来了。
2019年2月26日

什么是数据湖?有什么用?终于有人讲明白了……

数据湖从企业的多个数据源获取原始数据,并且针对不同的目的,同一份原始数据还可能有多种满足特定内部模型格式的数据副本。因此,数据湖中被处理的数据可能是任意类型的信息,从结构化数据到完全非结构化数据。
2019年2月24日

10本书,从Python爬虫小白进阶数据分析大神(建议收藏)

Idris),实验物理学硕士。毕业后曾经效力于多家公司,从事Java、数据仓库开发以及QA分析等方面的工作。目前,他的兴趣主要集中在商业智能、大数据和云计算等领域。Ivan
2019年2月21日

猿宵节正确打开方式:你要的大数据、机器学习、神经网络…已配齐

猿宵节送书福利!说说今晚你会对月亮许下什么心愿?上面这7本书,你最想要哪一本?为什么?在文末留言区参与讨论,被赞得最高的3条留言以及被我们精选出的3条走心留言的发布者将获赠你想要的那本书,快来抢吧!
2019年2月19日

故宫首开夜场门票秒空官网崩溃:7本书让网站挺住

但是!夜游故宫的门票比春运火车票还难抢!2月17日下午,不到一小时的时间里,19日元宵节当晚的票已全部预约满了。今天凌晨,20日(正月十六)的票开抢,结果还没等到0点,故宫门票预售网站已瘫痪!
2019年2月18日

《流浪地球》导演郭帆竟然“特别绝望”?

地面上,滔天巨浪留下的海水还没来得及退去就封冻了,城市幸存的高楼形单影只地立在冰面上,挂着长长的冰凌柱。冰面上落了一层撞击尘,于是这个世界只剩下一种颜色:灰色。
2019年2月14日

7本书告诉你,为什么拯救“流浪地球”的是人类,不是AI?

导读:大年初一,郭帆导演、刘慈欣作品改编的科幻大片《流浪地球》正式上映,十几天以来一直好评不断。对于电影情节,越来越多的人从不同角度提出自己的看法,即便是一些非常微小的细节,也能引发针锋相对的讨论。
2019年2月13日

做决定前别拍脑袋:两个成功案例看懂A/B测试

一周后,他们开始陆续收到世界各地人们的电子邮件,询问何时能在世界其他热门旅游目的地享受这样的服务,包括布宜诺斯艾利斯、伦敦、日本。于是他们将这一做法复制到其他大型集会,并允许人们通过信用卡在线支付。
2019年2月10日

猪年AI会凉?没关系,AI已经凉过很多次了

它严厉地批判了人工智能领域里的许多基础性研究,尤其是机器人和自然语言处理等几个最热门子领域,并给出了明确的结论:“人工智能领域的任何一部分都没有能产出符合当初向人们承诺的、具有主要影响力的成果”。
2019年2月9日

酒驾、超速、加塞、路怒、拒载?来吧,我们专治各种不服

而无人驾驶汽车的出现让汽车驾驶申请门槛大为降低,在完全自动驾驶阶段甚至无须申请,这对驾驶技术不过关的人来说是个福音。无论是对交通管理部门的影响还是对汽车驾驶者的影响,无人驾驶汽车的意义都是巨大的。
2019年2月8日

一文读懂电动汽车的前世今生,未来已来,大势所趋

然而,由于那时并没有足够先进的电池技术,各大车厂的EV其实主要是针对各地区的节能减排政策的应对措施,虽有口碑,但并无市场和进一步的研发动力。很快,各大车企施加的压力就让政客们低下了头,EV再次沉寂。
2019年2月7日

辞旧迎新,胖了几斤?数据告诉你,这种东西你就不该吃

20世纪70年代前,糖尿病大军不断壮大,公共健康机构和临床医生们表示,这一切都是因为——糖。我们面对的是并不常见的代谢类疾病,由于大众对糖的消费,我们摄入的碳水化合物已达到一个世纪前无法想象的程度。
2019年2月6日

2030年春节,你会跟机器人一起过吗?

未来,智能家居也将支持家庭机器人,它们也需要有自己的云,一些家电,如照明设备、恒温器、门锁、冰箱、烤箱、洗衣机和烘干机等也有自己的云。将有许多类型的家庭机器人,它们提供某个特定的任务。
2019年2月5日

程序员春节自救指南

母亲和孩子的关系,让母亲不加思索地全然接受,这份全然接受给孩子无我的爱,也让孩子拥有了爱的能力。不知道从哪一年开始,换作我牵妈妈的手去看世界,只是知道牵住的是一份美好,一份安然,一份幸福。
2019年1月31日

快抢!猪年之前最后一波送书福利,错过只能等“明年”

算法领域最大的进步都来自美好的思想,本书用通俗易懂的语言介绍最著名的算法思想。首届CCF杰出教育奖获得者、南京大学陈道蓄教授翻译并推荐。启蒙读者对计算机科学兴趣、提升计算思维素养的优秀入门读本。
2019年1月29日

烧脑科普:从亚里士多德到牛顿,7位大佬都被这个问题搞懵了

这本书对于我们认知外部世界的重要观点之一是,我们的世界观其实是一个拼图,这些拼图组成一个体系,有的拼图处于核心地带,有的拼图处于边缘(如图所示,图片为《世界观》图1-2亚里士多德世界观的拼图)。
2019年1月24日

干货:4个小技巧助你搞定缺失、混乱的数据(附实例代码)

数据的收集工作很棘手。收集工具坏了,调查问卷上某些问题人们不想回答,或者文件被损坏了;这些还只是数据集可能不全的一小部分原因。如果想使用这个数据集,我们有两个选择:忽略缺失的数据,或者用一些值替代。
2019年1月22日

NumPy入门攻略:手把手带你玩转这款强大的数据分析和计算工具

在处理自然语言过程中,需要将文字(中文或其他语言)转换为向量。即把对文本内容的处理简化为向量空间中的向量运算。基于向量运算,我们就可以实现文本语义相似度、特征提取、情感分析、文本分类等功能。
2019年1月21日

谷歌最新开源前端框架了解一下?前端小白都能看懂的8本书

关于作者:亢少军,捷智云视频会议系统联合创始人,从事流媒体技术研发工作多年,对于Android、iOS等开发技术有比较深入的研究和应用,作为主要程序员开发了多个应用项目,涉及医疗、交通、银行等领域。
2019年1月16日

入门科普:一文看懂机器学习3种类型的概念、根本差别及应用

为了确定机器学习算法不仅能在训练集上表现良好,对新数据也有很好的适应性,我们希望将数据集随机分成单独的训练集和测试集。用训练集来训练和优化机器学习模型,同时把测试集保留到最后用以评估最终的模型。
2019年1月15日

只需4步,微软数据科学家教你用OpenRefine搞定数据清洗

清理并准备使用数据时,可能需要从文本字段中提取一些信息。有些时候,我们只需要用些分隔符将文本字段拆开。但当数据符合一些模式,并不是简单地拆分文本就能做到时,我们就需要求助于正则表达式了。
2019年1月14日

白领体检异常率连年走高,这5本书教你怎样科学"养生"

本书以严谨的研究资料为基础,讲述了千百年来人类生产糖、食用糖的历史,揭示了糖的上瘾性和致病性。含糖食物能带给人愉悦的享受,但同时风险巨大。我们该尝试无糖生活,夺回身体健康的控制权了。
2019年1月10日

跟着阿里大牛捞干货:2019这5本书带你玩转大数据

为了让你的2019年过得充实,不虚度,数据叔今天推荐5本书,作者都是来自于阿里的技术大牛,内容都是跟当前持续火爆的大数据行业相关。吃透他们的任何一本书,2019你就是人生赢家。
2019年1月9日

学AI哪家强?清华全球第1,Top5中有这3所中国高校

其他中国大陆高校中,北京大学排在第13,中国科学院、上海交通大学和浙江大学并列第28,北京航空航天大学、哈尔滨工业大学、南京大学、电子科技大学、中国科学技术大学并列第80,上海财经大学第129。
2019年1月2日

过去的2018年,400000粉丝用指尖投票,选出了这10本技术书

数据叔盘点了2018年我们发布过1000多篇图文,按粉丝收藏量进行排序,精选出了下面这10本技术书。敲黑板!这10本书不是数据叔选的,而是400000粉丝用指尖投票投出来的!
2019年1月1日

重磅盘点!2018年更受欢迎的技术干货,来来回回也就看了几十遍吧

「大数据」为您提供大数据、人工智能、区块链、互联网等领域创新思维、前沿知识、最新技术、应用前景和案例分析,期待与您共同发掘其中潜藏的机会与价值。
2018年12月31日

入门科普:Python、R、大数据、云计算最全学习资源都在这里

另外,你可以单独使用R中的sqldf添加包(以及Pythonic数据科学家不太广泛使用的python-sql或python-sql-parse添加包),甚至可以使用曾经的冠军语言SAS中的Proc
2018年12月27日

用Python玩转统计数据:取样、计算相关性、拆分训练模型和测试

要获取数据集中的一个子集,pandas的.sample(...)方法是一个很方便的途径。不过这里还是有一个陷阱:所有的观测值被选出的概率相同,可能我们得到的样本中,变量的分布并不能代表整个数据集。
2018年12月25日

最全攻略:数据分析师必备Python编程基础知识

这些结构中,分支结构往往需要条件判断语句进行控制,比如if、else等,而循环结构则需要循环语句for进行控制,当然分支结构与循环结构完全可以混合,这时就可以通过条件循环语句while进行控制。
2018年12月20日

王兴:上天、入地、全球化,是互联网下半场的三条路

这是一个完全颠覆性的事情,因为牛羊不会进化,几万年来,牛吃草来长肉的速度基本是固定的,进化很慢,而这家公司如果用高科技的技术去突破的话,就是革命性的事情,瞬间会颠覆饲养牛羊的方法,生产出更健康的肉。
2018年12月19日

输在学历的起跑线上?没关系,10本书助你技能爆表升职加薪

学历与能力关系,一直都出于争论之中。有数据表明,在中国学历和收入明显相关;也有数据告诉你,本科毕业就去工作的你的同学,3年后的收入肯定比你这位应届毕业生高,还可能成了你的部门领导。
2018年12月18日

2019升职加薪必备:你一定要修炼的产品思维

从方法、技术、业务、实践4个维度全面构建数据化运营的系统方法论。包含多个商业实践案例,对搭建数据监控指标体系、数据分析、数据挖掘、ABtest、埋点策略、用户画像建模等常见数据运营方式做了详细讲解。
2018年12月16日

NLP将迎来黄金十年,7个案例带你入门(附Python代码)

我们使用Python中的re模块的另一个方法findall()来返回匹配带正则表达式的那部分字符串。re.findall(“[a-z]”,“abc1234”)得到的结果是[“a”,“b”,“c”]。
2018年12月11日

2018世界幸福指数中国排第86,这种报告是怎样做出来的?

Karlan),2017年7月开始任西北大学经济与金融学教授。拥有芝加哥大学MPP和MBA学位以及麻省理工学院经济学博士学位,行为经济学家、社会企业家、扶贫创新行动(IPA)的主席和奠基人。研究领域
2018年12月10日

从入门到头秃,2018年机器学习图书TOP10

说说2018年你有哪些收获,2019年有哪些愿景?上面10本书,你最想要哪一本?为什么?在文末留言区参与讨论,被赞得最高的3条留言以及被我们精选出的3条走心留言的发布者将获赠你想要的那本书。
2018年12月6日

写给中学生的算法入门:学代码之前看这篇就够了

如何快速地实现排序呢?我们可以有几种不同的想法。例如我们可以依次查看每本书,一旦发现两本紧挨着的书的次序不对就交换一下位置。这种想法能行,因为最终任何两本书的先后都不会错,但这平均要花费太长的时间。
2018年12月4日

机器学习重大挑战:坏数据和坏算法正在毁掉你的项目

图1-23显示了三个模型:蓝色虚线代表一开始的原始模型,也就是缺失部分国家的数据;红色的虚线代表用所有国家数据训练的第二个模型;实线代表的模型与第一个模型使用的训练数据相同,但是应用了正则化的约束。
2018年12月3日

违背常识、颠覆认知,终于有人把薛定谔的猫讲明白了

具体来说,这个放射源在一小时内,释放出一粒放射性粒子的概率是50%。如果放射源释放了一粒放射性粒子,这个粒子将会触发一个探测器,而这个探测器在触发之后会打开一小瓶毒药,这种毒药可以毒死盒子里的猫。
2018年12月2日

干货:用Python进行数据清洗,这7种方法你一定要掌握

数据录入过程、数据整合过程都可能会产生重复数据,直接删除是重复数据处理的主要方法。pandas提供查看、处理重复数据的方法duplicated和drop_duplicates。以如下数据为例:
2018年11月27日

极度烧脑+惊人发现:4个颠覆你世界观的量子理论实验

我们马上就会看到,某些涉及量子实体的实验结果与“量子实体是波”的观点最为一致,而某些实验结果则与“量子实体是粒子”的观点最为一致。假设我们现在思考一个现实问题:电子、光子和类似实体到底是粒子还是波?
2018年11月25日

入门科普:一文看懂NLP和中文分词算法(附代码举例)

智能问答在一些电商网站有非常实际的价值,比如代替人工充当客服角色,有很多基本而且重复的问题,其实并不需要人工客服来解决,通过智能问答系统可以筛选掉大量重复的问题,使得人工座席能更好地服务客户。
2018年11月22日

长生不死、名人复活?疯狂的AI时代,人类竟要靠IA实现“永生”

如果你要遇到30岁时年轻的曾祖母,你只需在手机上设定一个“30”,或者你想遇到80岁时的曾祖母,那么设定一个“80”,跳到屏幕上的活灵活现的曾祖母就是80岁时的曾祖母,面貌完全与真实的人一模一样。
2018年11月18日

双十一图书大数据:金庸第1,Python第2,学霸们都买了这些书

本书由哈尔滨工业大学计算机学院教授、计算机语言基础教研室主任苏小红翻译,详尽而系统地介绍了Python语言程序设计的方方面面,通过大量的示例、伪代码、流程图和其他工具,使读者更容易学习程序设计逻辑。
2018年11月14日

干货:手把手教你用Python读写CSV、JSON、Excel及解析HTML

这段代码将realEstate_trans.json文件中读出的数据存入json_read列表。这里对文件使用了.read()方法,将文件内容全部读入内存。下面的代码将数据存储于一个JSON文件:
2018年11月13日

干货请收好:终于有人把用户画像的流程、方法讲明白了

在大数据领域,用户画像的作用远不止于此。用户的行为数据无法直接用于数据分析和模型训练,我们也无法从用户的行为日志中直接获取有用的信息。而将用户的行为数据标签化以后,我们对用户就有了一个直观的认识。
2018年11月8日

那个陪你聊微信、发自拍的妹子,可能不是人

导读:之前大数据(ID:hzdashuju)发过几篇跟微信自动回复有关的Python实战。你可别以为,只有少数几个技术宅会用这种冷幽默的方式逗你玩,实际上,有人正用自动聊天的方式,算计着你的钱包……
2018年11月6日

从AI到IA,你愿意买一个机器人伴侣同居吗?

到那一天,机器人不再光是个塑料、金属或者硅芯片组成的壳子,还会有利用生物打印、人工合成生物、自组装纳米科技而制造的生命体。未来这种制造科技将不但用于人类的医学,还将用于制造和修理机器人。
2018年11月5日

微信“死于”印度

但在2012年出征印度时,面对WhatsApp、Messenger、LINE、Viber、Skype和Hangouts等大量即时通讯工具的围剿,微信却“折戟沉沙”,苦苦挣扎了5年最终还是惨败收场。
2018年11月3日

没看过这10本程序员必读烧脑经典,别说你是敲代码的

本书融合不同领域专家学者的理论成果和实践经验,从推荐系统相关技术、推荐系统的应用与评估、推荐系统的交互、推荐系统和社区及高级算法5个方面介绍推荐系统的主要概念、理论、方法、趋势、挑战和应用。
2018年10月31日

双十一,我们除了能帮程序员省钱之外,还能帮你征个婚

导读:从光棍节到购物狂欢节,双十一真是一年比一年热闹。怎样用一条图文简单方便地把这两个节一起过了,数据叔也是操碎了心。脑洞一开,办法还是有的:老规矩,送书啊!送一本解决不了问题,那就送两本啊!
2018年10月30日

大龄程序员想转产品经理?3本书给你最靠谱的进阶攻略

作为互联网行业的核心岗位,产品经理以其市场需求庞大,入门门槛较低的特点,深受大家的欢迎。然而,许多人都缺乏对产品经理的了解,认为只要自己具有想象力和创造力,就一定能够成功地成为一个优秀的产品经理。
2018年10月29日

21世纪未解之谜:坐拥100万个比特币的土豪,到底是谁?

Thomas汇总了中本聪在比特币社区发帖的时间戳,图表显示,中本聪在格林威治标准时间(也是伦敦时间)早上5点至11点之间活跃度极低,甚至低到几乎没有发布过任何帖子,无论休息日还是工作日都是如此。
2018年10月25日

普通码农和技术大牛之间,只差这10本书(1024高能福利)

导读:一年就这么一回,程序员节来了!过节就要送礼物,不知道你都收到了哪些礼物,是颈椎病康复按摩仪、最新配方生发洗发水、当前时尚时尚最时尚的格子衫,还是有哪位神仙直接送你一个女朋友/男朋友?
2018年10月24日

从出生到退休,9本书承包程序员的一生

无论是健康人还是病人,都可以通过本书重新认识死亡:当身体变得越来越虚弱,生命不断走向衰亡时,人却可以变得越来越强大,内心能感到更加完整。无论是临终者还是陪伴者,都可以从这些故事中获得支持和安慰。
2018年10月23日

一个90后程序员,需要养活几个过重阳节的老人?

按2017年末人社部公布的数据,我国的抚养比已升至1:2.8。抚养比是指在人口中非劳动年龄人口对劳动年龄人口数之比。也就是说,当前中国大约每3个劳动者,要联合起来供养1个小孩或老人。
2018年10月17日

最全机器学习种类讲解:监督、无监督、在线和批量学习都讲明白了

通常比较好的做法是,先使用降维算法减少训练数据的维度,再将其提供给另一个机器学习算法(例如监督式学习算法)。这会使它运行得更快,数据占用的磁盘空间和内存都会更小,在某些情况下,执行性能也会更好。
2018年10月16日

微软著名程序员、歌手、NBA球队老板保罗·艾伦逝世,盖茨、库克等大佬发文悼念

1983年,艾伦患上了霍奇金氏病,病重后他辞去微软的职务,并于1年后离开董事会。1990年艾伦重返微软董事会,在2000年11月再度离开,但留任微软高级策略顾问。
2018年10月16日

你真的懂数据分析吗?一文读懂数据分析的流程、基本方法和实践

数据分析可以帮助我们从数据中发现有用信息,找出有建设性的结论,并基于分析结论辅助决策。如图1所示,数据分析流程主要包括业务调研、明确目标、数据准备、特征处理、模型训练与评估、输出结论等六个关键环节。
2018年10月11日

干掉围棋九段后,可定制计算能让AI打败程序员和芯片工程师吗?

processor来做,他的效率差了85倍,用英特尔的CPU做,效率差800倍,最后一个就很离谱了,如果你写JAVA在嵌入式处理器上做呢,我一看可定制的专用和通用差的这么大,我们一定要用上。
2018年10月9日

CTO不写代码,真的可以吗?

还有就是避免有一些假装创业的人出现,突然脑子灵光一动想我很牛,我要创业,结果主意提出来了,公司说行你搞的好,钱也给你配上,最后大家一论证这个主意不行,回来老老实实干活了,这也是另外一个帮助。
2018年10月8日

揭秘“21世纪最性感的职业”:数学、编程、沟通和商业技能一个都不能少!

RDD/DataFrame上跑H2O算法,既可以出于实验目的,也可以用于部署。之所以成为可能,是因为H2O和Spark共享JVM,因此在两个平台之间,数据可以无缝传输。H2O以H2O
2018年10月7日

一文读懂量子计算机的前世今生,它的未来人类连想都不敢想

随着数字的增大,一般的质数分解方法所需的时间按指数增长。目前最好的算法也只比指数性增长稍好。如果用一个大数来加密,那么只有当这个数分解时才会泄密,因此很安全。目前最流行的加密方法,都是以此为基础的。
2018年10月6日

如何科学地评价妹子身材?三围符合黄金比例是审美标准?你错了!

例如:新时代的金字塔崇拜者声称,埃及最伟大的金字塔有些属性来自于黄金比例,但是事实上,它们并没有。动物神秘主义者声称,在一个蜂巢中,虫卵中雄蜂的比例也接近是一个黄金比例,但是它也并不是真的。
2018年10月5日

当强人工智能时代来临,哪些人不会失业?

“C”(创造类)指的是写小说、拍电影、发明创造、新产品企划、撰写研究论文等工作;“M”(经营管理类)指的是管理工厂、商店、项目及经营公司等工作;“H”(服务类)指的是护理人员、保育员、辅导师等工作。
2018年10月4日

为什么你跟高手有差距?因为他们会在假期里读这5本书

一直看到这里的你,一定是爱读书的人。欢迎加入大数据读书会微信群,结识更多同行业小伙伴,我们将在群里额外送书!未来还有更多福利等你认领!(请在后台回复读书会,获取进群方法)
2018年10月3日

自动驾驶:梦想已经照进现实?

丰田的态度最耐人寻味。2014年丰田曾经声明,因为安全理由不会开发无人驾驶汽车。话音刚落不久,一年后的2015年,丰田迅速转向,宣布在无人驾驶研究上投入10亿美元预算。丰田怎么敢错过这场世纪盛宴?
2018年10月2日

你天天看手机,手机也在看你

Facebook创于2004年,目前号称月活跃用户超过17亿,这超过了20%的世界人口。社交网络用户的增长趋势如此之快,相关政策没有时间余地来仔细斟酌字句,旺盛的计算机系统也没有余裕进行悠闲地发展。
2018年10月1日

长假还没安排?这7本书和7部影视作品,让你宅家或者堵在路上都一样精彩

在本书的故事中,我们能看到雅虎、微软、阿里巴巴、软银、eBay、PayPal、杜邦这些耳熟能详的公司成为股权战争的主人公。从这些公司的身上,我们也能看懂暗流之下的新创投资管行业背后的荣辱兴衰。
2018年9月29日

一言不合暴打产品经理、枪杀同事?5本书,带你告别低情商

你可能希望用一种直接、坚定、积极的方式来表达自己真实的愿望和需求,必要时坚持自己的想法,维护自己的权力而不过度焦虑,保护自己的自尊而不践踏他人的尊严。这就是自信型沟通风格。
2018年9月26日

数据可视化干货:使用pandas和seaborn制作炫酷图表(附代码)

distplot方法可以绘制直方图和连续密度估计,通过distplot方法seaborn使直方图和密度图的绘制更为简单。作为例子,考虑由两个不同的标准正态分布组成的双峰分布(见图9-23):
2018年9月25日

一文读懂AI简史:当年各国烧钱许下的愿,有些至今仍未实现

在我们回顾人工智能的历史之前,先来看看流行的人工智能的定义。目前,最被认可的人工智能定义为:能像人一样理性地思考和理性地行动的机器。行动被广义地理解为采取行动、制定行动的决策,并非肢体动作。
2018年9月19日

睡觉时钱被转走、开房信息被叫卖、数字货币被篡改,你的安全感,还在吗?

本书提供了经过证明的预防技术,用现实世界的案例研究和实例揭示了黑客们是如何使用很容易得到的工具渗透和劫持系统的。本书详细介绍了新的入侵检测、防火墙、蜜罐、防病毒、防Rootkit以及防间谍软件技术。
2018年9月18日

乔布斯当年的那句名言,库克和今天的苹果做到了吗?

老百姓不会读《三藏法师传》,他们读的是《西游记》。今天的90后连《西游记》都不读,直接看的《大话西游》。最后老百姓对玄奘的印象跟真实的玄奘完全是两个人,可是有什么办法?因为《西游记》的理解成本很低。
2018年9月14日

纯干货:手把手教你用Python做数据可视化(附代码)

'k--'是用于绘制黑色分段线的style选项。fig.add_subplot返回的对象是AxesSubplot对象,使用这些对象你可以直接在其他空白的子图上调用对象的实例方法进行绘图(参考图4):
2018年9月12日

当年发明hello, world的大神,后来怎么样了?

World),这门课是向非计算机专业的学生介绍计算机基本常识的,多年来大受学生追捧。选修这门课的学生来自普林斯顿大学政治、历史、古典文学、经济、音乐和艺术等专业,几乎涵盖了人文和社会科学的各个专业。
2018年9月9日

硅谷大佬提前剧透未来!6本书,助你走在AI时代前沿

「大数据」为您提供大数据、人工智能、区块链、互联网等领域创新思维、前沿知识、最新技术、应用前景和案例分析,期待与您共同发掘其中潜藏的机会与价值。
2018年9月6日

概率入门:双色球中奖、购车摇号中签和德扑同花顺,哪个更容易?

那么如果要避免交通事故,那么就先人为制造一些无害的交通事故就好了,造够了次数,这个月就不会再发生交通事故了,大家也可以安心上路随便开了。这个逻辑就变得顺理成章,但是事实真的会是这样吗?
2018年9月5日

6年级学Python,高中学AI?这6本书,助你找回输掉的起跑线

推荐语:《利用Python进行数据分析》讲的是利用Python进行数据控制、处理、整理、分析等方面的具体细节和基本要点。同时,它也是利用Python进行科学计算的实用指南(专门针对数据密集型应用)。
2018年9月4日

以朋友圈为例,腾讯资深架构师揭秘鹅厂大数据平台是怎样运营的

朋友圈的产品形态很特别。细心的读者会发现,用户发一条朋友圈,实际上是先在用户自己个人相册里面存一条记录数据;但同时会往该时刻、允许查看其朋友圈且未屏蔽该用户的好友时间线上插一条索引数据。
2018年8月29日

终于有人把数据、信息、算法、统计、概率和数据挖掘都讲明白了!

应该说算法是数据加工的灵魂。如果说数据和信息是原始的食材,数据分析的结论是菜肴,那么算法就是烹调过程;如果说数据是玉璞,数据中蕴含的知识是价值连城的美碧,那么算法就是玉石打磨和加工的机床和工艺流程。
2018年8月28日

人生赢家的扑克牌

临界点。转折期中,小的累积性变化导致了规模效应,这一关键点也俗称转折点。冰箱中放杯水,水会在临界点0℃变成冰。在临界点温度的些许变化就会产生液体到固体的变化。社会体系中同样存在这样的临界点和转折期。
2018年8月26日

上清华到底有多难?清华大学保送生的数学试题了解一下

Giordano教授,他曾任美国西点军校数学系系主任,现为美国海军研究生院教授,多年来一直是美国大学生数学建模竞赛(MCM)的主要组织者,也是美国大学生数学建模竞赛组委会的主任。
2018年8月23日

读完这7本算法书,你也可以像这10位算法大师一样改变世界

Poincare。他曾经这样回忆自己的父亲:“在我还是个中学生时,他就让我做几千道几何题……解决这些问题的大脑训练是父亲给我的最好礼物。这些几何题,在发展我分析能力的过程中,起了最最重要的作用。”
2018年8月22日

程序员七夕表白攻略:原来数学才是世界上最浪漫的学科!

明天就是七夕了!所以,快去留言区表白&秀恩爱吧!请用最深(rou)情(ma)的语言表达你的爱意,看谁的虐狗姿势最优雅!我们将在点赞数量超过10的留言中精选出6条,赠送这本《数学极客》!
2018年8月16日

泡沫or趋势?我们到底需要什么样的区块链?

完全去中心的区块链架构会带来性能和安全性方面的问题。传统的分布式架构,例如云计算,是通过把一个任务切片,分发到多个节点来并行计算,最后将结果汇总回单一节点,因此效率很高,但中心化程度也很高。
2018年8月16日

七夕关爱单身狗程序猿:4本书给你一个完整的脱单秘籍

Moir),遗传学博士,曾任英国广播公司(BBC)制片人、加拿大广播公司(CBC)欧洲特派编辑,并自己经营一家影片制作公司,专门制作国际性的科学纪录片,目前居住在英国,著有A
2018年8月16日

新手上路必学的Python函数基础知识,全在这里了(多段代码举例)

Python支持所谓的匿名或lambda函数。匿名函数是一种通过单个语句生成函数的方式,其结果是返回值。匿名函数使用lambda关键字定义,该关键字仅表达“我们声明一个匿名函数”的意思:
2018年8月14日

数学不好、英语不好、非本专业,想学Python数据分析,能安排吗?

构建这样的模型并非一蹴而就。这个案例灵感源于蒙特卡洛思想,每模拟一次,程序便要运行17000遍,期间涉及多次参数和代码的调整。其他的鼠标点击类软件很难做这样的模拟,Python的趣味性就在此处。
2018年8月14日

给你多少钱,你才会愿意为国家生孩子?

人口学家梁建章先生提出过一个“生孩子痛苦指数”的概念,数据叔觉得这个概念特别黑色幽默。梁建章认为,中国的高房价、高育儿成本以及中国女性面临的职场和生活的高压力,让中国人“生孩子痛苦指数”居高不下。
2018年8月9日

百度吹过的牛实现了,你的呢?5本书带你搞定AI前沿技术

以上5本书,你最想要哪本?为什么?你还可以说出你的故事,谈谈你的梦想,甚至帮自己的吹吹牛逼。在文末留言区参与讨论,被赞得最高的3条留言以及被我们精选出的3条走心留言的发布者将获赠你想要的那本书。
2018年8月9日

程序猿们,如果你不想跑偏,就千万别读这4本书!

,芝加哥大学妇科及儿科教授,小儿人工耳蜗项目负责人,芝加哥大学医学院“3000万词汇倡议”机构的创始人和主任。她获得了芝加哥大学医学院“杰出项目创新的领导者”奖项。
2018年8月8日

拼智商,谷歌、苹果、微软、亚马逊的AI助手谁赢了?有些结果没料到

https://venturebeat.com/2018/07/25/google-assistant-wins-ai-iq-test-siri-beats-alexa-and-cortana/
2018年8月8日

20位大佬组团“踢馆”,谁超越了图灵?

量子力学、时间箭头、奇点主义、自由意志、不可克隆定理、奈特不确定性、玻尔兹曼大脑……这些统统融于本书最神秘的一章中,延续着图灵未竟的思考。来吧,展开“自由比特构想”,准备好捕捉量子图灵机中的幽灵。
2018年8月7日

大数据不背“杀熟”的锅!高科技公司掌握了你的个人信息,都干了些啥?

不同的信息接触点,也会对我们这样的偏好产生一定的影响,这就是渠道的作用。渠道并不单单指在购买那个点产生的影响,而是整个决策链条上,不同的信息技术渠道都会影响我们的决策。
2018年8月5日

炒币可以换别墅?你兜里的数字货币真的合法么?

但在我看来这种说法是不成立的,因为我国的证券法和公司法,实际上对股票、证券、债券的定义是有严格规定的。“法无禁止即可为”在刑法世界里实际上是走不通的。所以只有当法律有严格规定的情况下才可能构成犯罪。
2018年8月5日

结不起婚生不起娃的低欲望社会来了?这份自救指南拿走不谢!

关于作者:亚当·奥尔特,普林斯顿大学心理学博士。纽约大学斯特恩商学院营销学副教授,同时在纽约大学心理学院任职,曾被评为“全世界40位杰出的40岁以下的商学院教授”。
2018年8月2日

人人都能看懂的机器学习!3个案例详解聚类、回归、分类算法

比较常用的聚类算法有K-Means、DBSCAN等几种,基本思路都是利用每个向量之间的“距离”——这里指的是空间中的欧氏距离或者曼哈顿距离。从远近来进行彼此是否更适于从属与同一类别来做的分类判断。
2018年8月1日

pandas创始人手把手教你利用Python进行数据分析(思维导图)

导读:Python是目前数据科学领域的王者语言,众多科学家、工程师、分析师都使用它来完成数据相关的工作。由于Python具有简单易学、语法灵活的特点,很多需要处理数据的人士想要学习,主要有两大类:
2018年7月30日

美国43.6%的女性和24.8%的男性遭遇过性暴力!这份报告还讲了这些…

大多数女性受害者(71.1%,近3100万)在25岁之前首次经历亲密伴侣的各种形式的暴力,其中1/4的女性受害者(25.8%,约1130万)在18岁之前首次经历过亲密伴侣暴力(图10)。
2018年7月27日

数据告诉你,中国竞争力跟美国相比到底差在哪?

低端制造业可以带来中等收入,但是伴随而来的污染、低质低价,都是恶性循环。低端制造业升级转型到高端制造业,需要高科技,而高科技又不是几十年能追赶上的。中国目前技术可用性不足,恰好就是中国的软肋所在。
2018年7月26日

学习资源有很多,99%的技术大牛推荐了这一个

导读:技术人员学习的方式有很多,比如书籍、视频、博客、信息流和具体的工作任务。此外,公众号也是高效实用的学习方式之一,据统计,超过99%的技术大牛都会看公众号。只要你选对了号,跟对了人,你就是大牛!
2018年7月25日

一人扭转二战局势,30000人要求英国为他道歉!“永恒的图灵”到底有多牛?

1952年,图灵的同性伴侣穆雷协同一名同谋一起闯进图灵的房子盗窃,图灵为此而报警。在警方的几轮审训之后,图灵承认了与穆雷之间的同性恋关系,并被控以“明显的猥亵和性颠倒行为”罪。
2018年7月25日

送书 | 别泡枸杞,别晒步数!7招搞懂健康数据,有型有颜等TA来撩

数字不会讲故事,但人会。在图表上记下评论或插入图片,可以帮助还原数据中的故事。任何你能找到的其他事物——照片、音频资料,当时写下的某些东西——都能帮助你在所量化的指标和未量化的指标之间建立联系。
2018年7月23日

入门科普:什么时候要用Python?用哪个版本?什么时候不能用?

Index,PyPI),用于托管第三方库以及Python增强开发的工具。你可以访问https://pypi.python.org并查看各种程序包。目前,可以安装和使用的程序包超过80,000个。
2018年7月19日

从技术小白到老司机,这20本书帮你“快进”20年

W.Kernighan,贝尔实验室计算科学研究中心高级研究人员,知名的计算机科学家。他参加了UNIX系统、C语言、AWK语言和许多其他系统的开发,同时出版了许多在计算机领域具有影响的著作,如《The
2018年7月16日

送书!1991-2018,区块链的那点事,都在这里了!

1.0,以比特币为代表,通过脚本引擎提供一个可编程的虚拟货币。该阶段的区块链平台使用场景比较单一,主要用在虚拟货币的发行、流通支付,同时提供去中心化的防伪、防篡改以及防范“双花”机制。
2018年7月15日

能救命!你不是药神,但你就是你自己的数据之神!

口罩的第四次是送求别药神。路过患者队伍时,大家自动纷纷摘下口罩(户外的细菌可比餐馆多),这就像脱帽行注目礼一样,囚车虽然有铁栅栏阻隔,但摘掉口罩这个群体动作展现了信任与尊敬的重新建立。
2018年7月12日

你躲得过AI带来的就业大崩溃吗?这5本书助你跟你的焦虑和解

上周,李彦宏在2018百度AI开发者大会上宣布无人车量产,“老司机”们貌似走到被人工智能替代的边缘。按照《就业大崩溃》一书给出的“消失概率”,还有10个职业比司机面临的境况更加“凶险”:
2018年7月10日

世界杯29场点球大战的269个点球数据都在这里!霍金的公式帮了英格兰吗?

如果按球队来看,只参加过1次点球大战的比利时、韩国和巴拉圭只踢了5个点球,全部命中;俄罗斯1次参战(本届),4个全中。那么在接下来的比赛中,会出现历史上第1个罚丢点球的比利时人或俄罗斯人吗?
2018年7月6日

别再传李笑来的录音了!这才是有关区块链最靠谱最简单易懂的科普

文章指出,区块链并非仅仅是一项加密技术或者数字货币,在信息不对称、不确定的环境下,它还可以建立满足经济活动赖以发生、发展的“信任”生态体系。作为比特币底层技术的“链”,其价值远大于比特币本身。
2018年7月4日

2018上半年这10本新书,技术大牛们都在追着看

关于作者:张增骏,智链ChainNova技术总监和架构师。中国信通院可信区块链专家委员会成员,参与讨论并推动可信区块链测试标准的制定,多次受邀到高校与企业分享与推动区块链落地工作。
2018年7月3日

致程序猿:专业课老师没教的,都在这8本书里了

“大学教育应该首先是信仰的培养,让学生在大学期间,能够真正培养确信的能力,让人具有内心的稳定性和内在的定力,让每个学生真正懂得如何树立明确的价值判断,而这也是大学教育最有意义和最有价值的部分。”
2018年6月28日

机器学习入门科普:监督学习和无监督学习都是什么?都能干什么?

机器学习的主要目标是学习、策划和改进数学模型,该数学模型可以使用由环境提供的相关数据进行一次或连续多次的训练得到,利用该数学模型推断未来并做出决定而不需要所有影响因素(外部因素)的全部知识。
2018年6月26日

科普:大数据、人工智能、机器学习与深度学习都是什么?有什么关系?

易用、通用、好用:Spark编程非常高效、简洁,支持多种语言的API,如Scala、Java、Python、R、SQL等,同时提供类似于shell的交互式开发环境REPL。
2018年6月21日

我们研究了853场世界杯比赛,发现了这几条稳赔不赚的竞猜攻略

具体来说,根据足球这项运动在当今规则下的一些特点,会有一些比分比较常见,而另一些就比较罕见。比如2比0、2比1之类的比分比较常见,而3比3、7比1之类的比分非常少见。看来这里似乎有规律可循!
2018年6月20日

到底需要多少人口,才能找出11个会踢球的?

导读:2017年10月,美国队在世界杯预选赛中北美区最后一轮比赛中输给特立尼达和多巴哥,失去了世界杯出线权。美国队被淘汰后,也意味着人口排名世界前3的大国——中国、印度和美国全部与世界杯决赛圈无缘。
2018年6月16日

2018世界杯数据清单:真球迷看球必备,伪球迷速成指南(附完整赛程)

1950年世界杯,乌拉圭赢下了4场比赛中的3场,最终夺冠,是赢球场次最少的冠军。相比之下,2010年的荷兰和2014年的阿根廷都是7场比赛赢了6场,却未能夺冠,两队也是赢球场次最多的非冠军。
2018年6月14日

端午出行大数据:去这几个地方,你就只能看人人人……

数据叔认为,两份榜单数据的差异可能来自两家网站的注册用户归属地的分布。不过两份榜单的重合率还是很高的,人口众多、生活压力大的一二线城市居民,在假期来临时有强烈的“逃离”意愿。
2018年6月14日

各地高考“难度系数”告诉你,天津户口为什么值得抢

2017年全国参加高考人数为940万,录取人数700万,录取率74.46%,各地录取率差异不大。但如果进一步查看各地一本录取率以及“985”和“211”重点高校录取率,情况就明显不同了。
2018年6月6日

学计算机哪家强?清华竟是2018全球第1!你的母校上榜没?

最后我们再来看一下,以2008-2018年为计量标准,中国大陆高校的计算机学科综合排名和AI领域排名情况。高考又要来了,如果你身边有考生有志向在计算机相关领域发展的,可以把这份榜单作为参考。
2018年6月5日

一层一层剥开黑匣子:深度卷积网络的可视化

再看神经元的训练过程。以第3层的几个神经元为例,从左到右是随着训练的进行,神经元的识别目标的变化,如下图所示。可见,一开始神经元并没有明确的识别目标,但随后会逐渐成型,明确针对某一类目标进行识别:
2018年5月31日

小学生都能懂的人工智能:5本书给你剧透未来世界

推荐语:“没有心智社会就没有智能。智慧从愚笨中来。”人工智能之父、图灵奖得主马文·明斯基,对科学和人性的浪漫主义解读。一本引领时代的著作,影响了凯文·凯利,艾萨克·阿西莫夫,侯世达和雷·库兹韦尔。
2018年5月31日

关于Python的一切:2018年,你读这8本书就够了

McKinney是资深数据分析专家,对各种Python库(包括NumPy、pandas、matplotlib以及IPython等)等都有深入研究,并在大量的实践中积累了丰富的经验。
2018年5月30日

LeCun:智能的精华在于预测能力!“预测学习”了解一下!

首先,它是无监督方法,无需人工标记。其次,网络上已经有浩如烟海的视频,截取出的每个片段都可用于训练。而且我们还可用摄像头轻松生成无穷无尽的新视频,甚至可让AI学会主动控制摄像头。
2018年5月29日

Bruce Eckel:我最喜欢Python,Kotlin或将取代Java(附演讲全文+PPT)

Q1:我是一个Android开发者,我平时发现Java需要通过jvm生成Native代码跟底层进行交互,我之前看过Kotlin可以直接编程二进制码,可以绕过JVM这一步,我想知道更多这样的细节。
2018年5月24日

注意!有人正在计算你今天会出现在哪里,并尝试左右你的行为

如果你有孩子,你应该会看到孩子对nintendog狗(或者猫)的喜欢。这是一个游戏,游戏中,人被安排任务来照顾屏幕上的宠物。算法可以计算出什么时候需要带宠物玩,怎么样和主人交流,宠物到底有多饥饿。
2018年5月24日

最全Python数据工具箱:标准库、第三方库和外部工具都在这里了

Plotly提供的图形库可以进行在线WEB交互,并提供具有出版品质的图形,支持线图、散点图、区域图、条形图、误差条、框图、直方图、热图、子图、多轴、极坐标图、气泡图、玫瑰图、热力图、漏斗图等众多图形
2018年5月23日

Bruce Eckel最新演讲:调bug就是浪费生命!放弃吧!(附完整PPT)

编程语言设计以及它所造成的影响是第一个也是最重要的一个挑战,它关系到程序员的效率和生产力;关于并发性,他仍在不断学习、加强这方面的知识;而这次演讲的重点就放在错误的处理这方面。
2018年5月20日

用《复联3》的豆瓣评分教会你正确使用条形图、饼图、漏斗模型

随着计算机软硬件的发展,使用计算机来处理数据并绘制统计图,已经变成人们想当然的选择。我们先回到原点,抛开那些软件给我们提供的、丰富多样的图表选择,只拿出三种最基本的统计图样式,明确他们的特点。
2018年5月17日

入门干货:从《权力的游戏》战斗场景中搞懂数据抽样和过滤

关于作者:王宏志,博士,博士生导师,哈尔滨工业大学计算机科学与技术学院副教授,中国计算机学会高级会员,YOCSEF黑龙江省分论坛AC。研究方向包括XML数据管理、图数据管理、数据质量、信息集成等。
2018年5月15日

别被数据带进沟里:这才是应用数据的正确姿势!

一般一个在线零售商,其转化率在2%左右,如果能到10%就非常不错,大部分转化率在0.5%左右。根据研究,65%的访客会遗弃他们的购物车,其中41%是因为还没想好买不买,25%是因为价格太高。
2018年5月12日

大数据告诉你,送妈妈什么礼物会让她更开心

根据一点资讯在去年母亲节期间的问卷调查,妈妈们最大的乐趣就是买买买。参与这项调查的妈妈们年龄横跨了60后到90后,由此可见,不管新手妈妈还是资深妈妈,过节时让她们买买买才是硬道理。
2018年5月12日

汶川地震10周年:大数据正在攻克地震预测这个“不可能任务”

每年5月12日被定为全国防灾减灾日,这个日期也被中国人铭记。十年以来,每到5月12日前后,关键词“汶川地震”在百度的搜索量都会有一个尖锐的凸起。大数据记载着人们的行为,证实这十年间,汶川从未被遗忘。
2018年5月11日

大数据没用?!张小龙:我们很少看统计数据!

因果:它能激发什么情感?小数据挖掘。一般来说,林斯特龙会在一张大公告板上贴满照片和发现,制作一个时间轴。这时候,公告板反映了所发现的情感基因和因果关系,把这些发现和照片放在一起可以找出共同特征。
2018年5月11日

Python爬虫新手进阶版:怎样读取非结构化网页、图像、视频、语音数据

要从网页中爬虫数据,可使用Python内置标准库或第三方库,例如urllib、urllib2、httplib、httplib2、requests等。本文使用requests方法获取网页数据。
2018年5月10日

今天过节的小青年们,到2030年时会全部失业吗?

瑞银估计,至2030年AI每年为亚洲贡献的经济价值将高达1.8—3.0万亿美元。而AI对金融服务、医疗保健、制造、零售和交通等行业都将产生巨大影响,这些行业加在一起,相当于当前亚洲GDP的三分之二。
2018年5月4日

小米597页招股书中的数据干货,全在这里了!

小米的招股书被多家媒体公开,除小米自身的信息和数据之外,招股书还包括对智能手机、移动互联网、可穿戴设备等相关市场的现状分析和未来预测,干货不少。大数据小编整理了招股书的部分内容,希望对你有所帮助。
2018年5月3日

抖音封杀小猪佩奇,一年赚100亿的“社会人”得罪了谁?

导读:内涵段子被封、今日头条app被下架之后,头条旗下“幸存”的抖音其实一直也没闲着:关闭评论、上线防沉迷系统,昨天又搞出一个大新闻:小猪佩奇被列为“禁止元素”……
2018年4月29日

数据告诉你:跟缺“芯”相比,中国当前的这个问题更致命!

4月23日下午,大数据(ID:hzdashuju)小编应主办方邀请出席了汇智·创新《人口创新力——大国崛起的机会与陷阱》新书发布会。以下内容根据活动现场梁建章、黄文政等人口问题专家的发言稿整理。
2018年4月25日

8本入门级大数据经典图书,开启你的“深度学习” | 世界读书日

机器人是推动新工业革命的关键,人类即将进入万物皆智能的新智能时代,机器智能将越来越多地融入未来生活,引发智能革命或是智能爆炸,而把握未来的好方式就是更加了解机器,以及创造更具智能的计算机和机器人。
2018年4月22日

终于有人把云计算、大数据和人工智能讲明白了!

当然第二名的技术也是非常棒的,有了OpenStack之后,果真像Rackspace想的一样,所有想做云的大企业都疯了,你能想象到的所有如雷贯耳的大型IT企业:IBM、惠普、戴尔、华为、联想等都疯了。
2018年4月20日

AI取代人类?这4种工作仍将是从业者的“铁饭碗” | 未来

日本大型综合建设公司大林组计划从2014年11月开始启用系统,采用NEC的“异种混合学习”机器学习技术,根据楼宇里安装的4500个传感器提供的数据,对24小时或1个月后楼宇的能源消耗量进行预测。
2018年4月19日

180页PPT,讲解人工智能技术与产业发展

导读:这是清华大学计算机科学与技术系教授、博士生导师孙富春在机械工业出版社讲座交流时的PPT,内容包括了人工智能产业的历史背景、现状及未来发展趋势。这180页的PPT干货多多,赶紧收藏起来吧!
2018年4月17日

看完此文再不懂区块链算我输:手把手教你用Python从零开始创建区块链

如果你还不是很了解哈希,可以查看这篇文章https://learncryptography.com/hash-functions/what-are-hash-functions。
2018年4月10日

为什么要学数学?因为这是一场战略性的投资

相信我们的女同学一定会树立足够的信心,别人能做到的,我们通过自己的努力和付出,一定也能够做到!中国科学院唯一一位女数学院士胡和生教授就在我们数学科学学院,她已经为我们树立了榜样,我们更应该加倍努力。
2018年4月10日

日本老爷爷坚持17年用Excel作画,我可能用了假的Excel···

「大数据」为您提供大数据、人工智能、区块链、互联网等领域创新思维、前沿知识、最新技术、应用前景和案例分析,期待与您共同发掘其中潜藏的机会与价值。
2018年4月2日

4个最受欢迎的大数据可视化工具

除此以外,Jupyter还能够与Spark这样的多框架进行交互,这使得对从具有不同输入源的程序收集的大量密集的数据进行数据处理时,Jupyte能够提供一个全能的解决方案。
2018年3月26日

妙解谷歌压箱底面试题:如何正确的从楼上抛鸡蛋

最简单的方式来获取最少楼层数就是将鸡蛋从第一层扔出,然后第二层,然后依次往后叠加。这样一来,当鸡蛋破碎那一刻我们就知道是这一层了。这是一个可靠的算法,但是在最差的情况下它需要的投掷次数是100次。
2018年1月2日

Google发布了2017年最常被搜索的一个词,竟然看哭了几亿人

大数据蕴藏着丰富的信息和价值,如何处理好大数据并发掘其潜藏的商业价值,这是大数据时代的新挑战。我们将为大家提供与大数据相关的最新技术和资讯。
2017年12月29日

程序员这个职业会是另一个即将破裂的泡沫?

如果企业的主要业务并不是“互联网业务”,那么,在互联网上搭建一个网站并不简单。因此,曾经一度非常繁荣的网站承建商这个行业,虽然它们能帮你在互联网上快速建立起一个简单的网站,但也开始变得越来越不赚钱。
2017年12月26日

福利 · 阅读 | 免费申请读大数据新书 第23期

本书由Intel首席平台架构师参与撰写,探讨了机器学习领域的重要主题,包括知识发现、分类、遗传算法、神经网络、内核方法、生物启发技术和深度学习。全书内容精炼,概念简洁,算法细致,应用案例均面向实战。
2017年12月22日

2017年数据可视化的七大趋势!

Pong表示,越来越多的数据可视化设计人员需要考虑他们的作品如何在移动设备上展现。有一种方法是为桌面提供完整、详细的可视化,然后为移动设备将图形分解为一些基本的图形,并用不同的数据表现出来。
2017年12月11日

大数据时代的10个重大变革

在传统科学中,数据分析主要以数学和统计学为直接理论工具。但是,云计算等计算模式的出现以及大数据时代的到来,提升了我们对数据的获取、存储、计算与管理能力,进而对统计学理论与方法产生了深远影响,主要有:
2017年12月8日

全球100款大数据工具汇总(前50款)

web接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索、稳定、可靠、快速、安装使用方便。
2017年12月5日

不止财务自由的诱惑:最顶级的AI科学家正在离开大学

Ghahramani表示:“AI业界有很多非常好的机会,相较而言,大城市的工作机会看起来既无趣,薪水也不高。不管是从智力趣味或是生活方式的角度来看,AI相关的工作都让人难以拒绝。”
2017年12月4日

我是怎样爬下6万共享单车数据并进行分析的(附代码)

proxy在实际使用中,通过proxyProvider.pick()选择代理,然后使用。如果代理出现任何问题,则直接用proxy.fatal_error()降低评分,这样后续就不会选择到这个代理了。
2017年12月3日

一文读懂TensorFlow基础

现在我们需要考虑如何调整参数使成本函数最小,这在机器学习中称为优化算法的设计问题。笔者这里对TensorFlow实现优化的过程作一个简要的介绍,要知道优化算法从某种意义上讲比模型更重要。
2017年11月29日

把思维导图秒变成幻灯?!十分有趣了!

下载其中的pkg扩展名安装包。(https://github.com/jgm/pandoc/releases/download/1.19.2.1/pandoc-1.19.2.1-osx.pkg)
2017年11月17日

炸锅了!Google称2029年人类开始实现永生不死!疾病,衰老,痛苦将彻底消失!?

人类将能够对所有的身体组织,器官活性进行重新修正,不仅如此,还能够研发出直接应对于某类病症的药物,而且这一切的实现不再需要通过试探性治疗手段进行医治,因为这些药品直接应对于该疾病的整个盛衰过程
2017年11月12日

学习机器学习需要具备怎样的数学水平?

大数据蕴藏着丰富的信息和价值,如何处理好大数据并发掘其潜藏的商业价值,这是大数据时代的新挑战。我们将为大家提供与大数据相关的最新技术和资讯。
2017年11月3日

互联网行业哪个职位最有前途?

底层),对于小餐馆来说是很奢侈的。因为小餐馆卖的菜少,食材来源比较单一,数量也不多。但对于大餐馆来说,由于食材的种类繁多,数量巨大,筛选食材也是一门技术活,不过时间长了,还是有点枯燥的。
2017年10月8日

在 Google 工作 10 年,到底能学到啥?

往小了说,身边既有缩在角落里闷头写代码,讨厌和人交流的社交恐惧症患者,也有精神焕发的社交明星。办公室里,有带狗上班的爱心族,有重视家庭的好爸好妈,有整夜整夜奋斗的梦想家,有痴迷奇特爱好的技术极客……
2017年9月24日

是学习Java还是Python?一张图告诉你!

大数据蕴藏着丰富的信息和价值,如何处理好大数据并发掘其潜藏的商业价值,这是大数据时代的新挑战。我们将为大家提供与大数据相关的最新技术和资讯。
2017年9月12日

马云的刷脸支付真的来了!全球首站已上线

那么,用照片能否蒙混过关?蚂蚁金服方面表示,支付宝在肯德基KPRO的点餐机上配备了3D红外深度摄像头,在进行人脸识别前,会通过软硬件结合的方法进行活体检测,误识率低于十万分之一。
2017年9月3日

细思极恐!大数据和机器学习揭示十二星座的真实面目

要有可靠的(经过筛选的)且样本数不是太小的数据。比如,历年诺贝尔奖得主就是很好的数据,仅管有些科目越来越强调团队合作(比如,化学,医学),从而掩盖了单个星座的特质。
2017年8月23日

谷歌搜索揭示人性最黑暗的秘密

奥巴马这一次没怎么谈论宽容的价值。相反,他主要聚焦于激发人们的好奇心和改变他们对美国穆斯林的印象。他说,很多来自非洲的奴隶都是穆斯林;美国第三任总统托马斯·杰弗逊(Thomas
2017年7月26日

一件有趣的事:我用 Python 爬了爬自己的微信朋友

终于可以进入画图阶段了。可以根据自己想要的图片、形状、颜色画出相似的图形(在这里,我使用的是我的头像,当然,为了颜色可以更加鲜艳使最后画出的词云图更加好看易辨,我先对自己的头像用
2017年7月19日

干货 | 从小白到大数据技术专家的学习历程

Sqoop:这个是用于把Mysql里的数据导入到Hadoop里的。当然你也可以不用这个,直接把Mysql数据表导出成文件再放到HDFS上也是一样的,当然生产环境中使用要注意Mysql的压力。
2017年7月19日

福利 · 阅读 | 免费申请读大数据新书 第21期

;系统讲解利用Hadoop和Spark及其生态系统里的一系列工具进行大数据分析的方法。本书还将介绍如何使用基于网络的笔记本,如Jupyter、Apache
2017年7月15日

领英重磅发布《全球AI领域人才报告》:华人力量崛起,行业人才需求激增

人工智能的发展究竟给人类生活带来了哪些变化?当前世界各国的AI发展态势如何?作为全球第一大AI强国以及拥有最大AI人才生力军的中美两国,在AI领域的发展各有何特点和趋势?
2017年7月11日

挖矿的矿工都赚疯了 | 揭秘川西地区的比特币超级矿山

矿场,在很多人的记忆中,原型是煤矿,与大地打交道,挖掘几百米深的矿井,带着瓦斯灯疲倦的矿工,不断飞扬的尘土,不断挖掘黑煤,矿工上下也是黑的,除了牙齿。传输带上源源不断带出煤,然后大货车在一旁等候着。
2017年7月10日

【一文打尽】SQL 数据分析常用语句.....收藏

大数据蕴藏着丰富的信息和价值,如何处理好大数据并发掘其潜藏的商业价值,这是大数据时代的新挑战。我们将为大家提供与大数据相关的最新技术和资讯。
2017年7月10日

【收藏】全球100款大数据工具汇总

web接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索、稳定、可靠、快速、安装使用方便。
2017年7月8日

大数据告诉你,中国女人有多勤奋

更重要的是,这个阶段的女性,不仅仅是职场人士,不仅仅要挣钱养家,不仅仅要和同事、老板、下属、客户等等社会上形形色色的人斗争,还要养孩子,教育孩子。《北平无战事》里面,燕京大学经济学教授梁经伦慨叹:
2017年7月8日

日处理20亿数据,实时用户行为服务系统架构实践

在系统正常状态下,Storm会从Kafka中读取数据,分别写入到Redis和MySQL中。服务从Redis拉取(取不到时从DB补偿),输出给客户端。DB降级的情况下,数据流程也随之改变(如下图)。
2017年7月7日

马斯克最疯狂的公司 Neurallink,重新定义未来人类:人机同体,成为AI

Elon为此辗转反侧。在他看来,超级智能AI的崛起只是时间问题,在那一天到来之前,人类务必要避免自己不落入“其他所有物种”的境地。在AI与其他所有物种共存的未来,在他看来,人类只有一个选择,就是:
2017年7月7日

大数据2017上半年不能错过的15篇文章(精选)

大数据蕴藏着丰富的信息和价值,如何处理好大数据并发掘其潜藏的商业价值,这是大数据时代的新挑战。我们将为大家提供与大数据相关的最新技术和资讯。
2017年7月1日

年中总结,这份PPT指南能帮到你

大数据蕴藏着丰富的信息和价值,如何处理好大数据并发掘其潜藏的商业价值,这是大数据时代的新挑战。我们将为大家提供与大数据相关的最新技术和资讯。
2017年7月1日

满屏血泪!17年创业企业阵亡名单

背景:借卖网在2010年10月上线,隶属于深圳市借卖网电子商务有限公司,是一家从事外贸货源分销的平台,一站式为外贸卖家提供外贸货源采购,仓储库存管理,产品刊登,订单处理,配货包装到全球配送等服务。
2017年6月30日

你是合格的机器学习数据科学家吗?来挑战这40题吧!(附解答)

q1,使该算法返回一个最近邻的观察样本及其类别,在第二步,你在训练数据中找出最近观察样本,然后再一次输入这个观察样本(q1)。该黑箱算法将再一次返回一个最近邻的观察样本及其类别。你需要将这个流程重复
2017年6月30日

大数据给北上广深单身女子画像,魔都女性最难脱单

大数据蕴藏着丰富的信息和价值,如何处理好大数据并发掘其潜藏的商业价值,这是大数据时代的新挑战。我们将为大家提供与大数据相关的最新技术和资讯。
2017年6月27日

大数据时代究竟带来了什么? ——写给普通人看的大数据文章

2012年2月27日,淘宝网数据盛典公布了2011年一系列消费数据。通过对网购人群的消费习惯进行分析,预测2012年的流行趋势,以地图的形式展现中国不同地区的消费偏好,其中新疆网友最爱网购比基尼。
2017年6月26日

吴恩达重磅回归,成立创业公司Deeplearning.ai

上发布了一份公开信,称将会辞去在百度的工作。这一消息的发布震惊业内,当时各方人士也纷纷猜测吴恩达何去何从,甚至臆测吴恩达离开百度的原因。经过近三个月的沉寂,吴恩达终于透露出了最终去处:创业!更多有关
2017年6月24日

40行代码的人脸识别实践

大数据蕴藏着丰富的信息和价值,如何处理好大数据并发掘其潜藏的商业价值,这是大数据时代的新挑战。我们将为大家提供与大数据相关的最新技术和资讯。
2017年6月23日

90%的大数据产品是伪需求,所以没人买单

舆情监测类产品可能是目前市面上同质化最严重的大数据产品之一。市面上有大量的舆情监测产品,所有的舆情监测工具都会提供类似的功能:曝光量、曝光用户数、影响力指数、正向/负向情绪指数、传播趋势图……
2017年6月23日

数据为谁而用?——人性化交互金融知识图谱问答探索

如何为个人客户处理证券市场的纷繁信息,这其实是智能助理的中的第一步的信息收集处理的要求。[5]所以一方面,我们用金融市场相关数据构建知识库;另外一方面,为了更好的人机交互,用
2017年6月22日

福利 · 阅读 | 免费申请读大数据新书 第20期

大数据每月推出免费赠书活动。小编将于今日推5本书供各位微友选择,然后从每本书中选出5位幸运的微友,获赠的名单将在下月的赠书栏目中公布,大家快踊跃参加吧!
2017年6月15日

数据科学家最常用的十种算法(KDnuggets官方调查)

为了更明显的看到差异,我们计算了具体职业分类相比于平均算法使用度的一个算法偏差,即偏差(ALG,类型)=使用(ALG,类型)/使用(ALG,所有的)
2017年6月15日

不要跟赌场说谎,它真的比你老婆还了解你

“一个人在赌场一次花1000美金,但他一年就来一次,他就是VIP;那么另外一个人一次花100美元,但是他一年12个月每个月都来,但是他却不是VIP”,在大量数字信息里发现了这个“魔鬼”之后,Gary
2017年6月12日

不做无效的营销,从不做无效的用户画像开始

行为数据是不是重要?它是很重要,但是我们不能只是根据行为数据来得出答案,更重要的其实是背后的态度数据,我为什么会需要这个东西?我希望解决什么问题?我在买的时候有什么阻力阻止我买?我有什么担心或不满?
2017年6月11日

【专属福利】赠票20张,第九届中国云计算大会专业票

本文将赠送6月14日~16日第九届中国云计算大会(坐标:北京)专业票20张。直接识别以下二维码就可在线申请,会务组将按照报名先后顺序送出,先到先得!
2017年6月10日

大数据等IT职业技能图谱【全套17张,第2版】

大数据蕴藏着丰富的信息和价值,如何处理好大数据并发掘其潜藏的商业价值,这是大数据时代的新挑战。我们将为大家提供与大数据相关的最新技术和资讯。
2017年6月10日

35张PPT,教你快速成为数据分析师

我入行互联网的契机是做了一个“网站分析”的微博账号,做自媒体跟真正的实践者还是有很大距离的,所以推荐一个list的,如果你对网站分析有兴趣,可以专注这些大牛!
2017年6月9日

凯文·凯利:生活在完全没有隐私的世界是种什么体验?

项健康数据,包括皮肤、血液甚至粪便。他每月都会分析粪便中的微生物,观察肠道情况。有了数据,再加上大量资料,斯马尔在没有医生帮助的情况下,诊断出自己患有「溃疡性结肠炎」。后来,医生证实他确实有这个病。
2017年6月9日

哪些大学可报考大数据专业?2017年大数据专业就业前景

3.熟悉Hadoop生态系统相关项目,精通以下项目之一的源码(Hadoop/Spark/Kafka/HBase/Flume/ElasticSearch/Druid/Kylin);
2017年6月8日

25张图让你读懂神经网络架构

长短时记忆网络被证明能够学习复杂的序列,比如:像莎士比亚一样写作,或者合成简单的音乐。值得注意的是,这些门结构中的每一个都对前一个神经元中的记忆单元赋有权重,所以一般需要更多的资源来运行。
2017年6月3日

干货 | 那些你不知道的爬虫反爬虫套路

然后,做反爬虫的就要加班天天研究如何拦截爬虫。做爬虫的被拦截了,就要天天研究如何破解反爬虫策略。大家就这么把资源全都浪费在没用的地方了。直到大家合并了,才会心平气和的坐下来谈谈,都少抓点。
2017年6月3日

别再傻买"畅销书"了,亚马逊推出"最多阅读榜",然后我发现……

另外值得注意的是,在小说类别里,很多上了畅销榜但没上阅读榜的书都是被哈利波特系列挤掉的。作为一个已经完结将近10年的小说系列,依然在阅读榜的Top20里占到5席,可见这个系列有多么长青了。
2017年6月2日

2017互联网女皇报告中文版来了(PPT+文字版)

2016年中国移动互联网用户增长12%至7亿,2015年增速为11%。米克尔说,移动互联网使用时间增长30%。占据中国移动互联网用户时间最多的是拥有微信的腾讯、电子商务巨头阿里巴巴和搜索引擎百度。
2017年6月2日

巧用MapReduce+HDFS,海量数据去重的五大策略

重复数据删除往往是指消除冗余子文件。不同于压缩,重复数据删除对于数据本身并没有改变,只是消除了相同的数据占用的存储容量。重复数据删除在减少存储、降低网络带宽方面有着显著的优势,并对扩展性有所帮助。
2017年6月1日

张小龙内部分享:我们只做一件事情,产品只有一个定位

给大家各种钻,钻体现了什么心理?其实都体现了人性的这几个弱点:各种黄钻、绿钻,他会贪,他要升级;他会嗔,他会跟人比较,说你的钻比我的等级高,所以我也要升上去;他会痴,觉得我一定要把所有的钻给收齐。
2017年6月1日

2017第九届中国云计算大会精彩日程曝光

承继前八届大会的成功经验,第九届中国云计算大会将采用全体大会、专题论坛、展览展示和社交互动平台等多种形式,继续为业界搭建一个云计算大数据技术、产业和应用的交流和传播平台。
2017年5月31日

一张漂亮的可视化图表背后

background-position:center;}当然,背景信息只是补充作用,需要避免喧宾夺主。因此图片做了模糊处理,且加上了深灰色的半透明Mask(此处应用了格式塔理论中的主体/背景原理)。
2017年5月31日

程序猿都不敢用?共享充电宝是否有的救?

想必每个人出行都经历过只有不到5%电量的囧境,在这时候共享充电宝绝对可以解燃眉之急。然而,我也是真的不相信,你真的可以在山巅上来一排充电宝仓,或者在瀑布前悬挂起防水的数据线。
2017年5月30日

2022年国外十大技术预测

这些人很可能是电影看多了。实际上,人工智能做的仅仅是在大范围内找出与众不同的目标物,我们完全不需要有任何的担心或恐惧。但他的这种想法引发了我的思考:未来五年,哪些会成为现实,哪些是无法实现的呢?
2017年5月29日

160w微博、12w评论还原周杰伦怒斥“保安”公关事件 | 大数据舆情监控

对公众人物和企业品牌而言,这并不是什么坏事:每个人都可以在网上自由表达,同时也为我们把握舆情、引动公众言论走向提供了便利。因此,如何在事件被放大之前进行实时监控及合理引导舆论走向显得极为重要。
2017年5月29日

如果看了这篇文章你还不懂傅里叶变换,那就过来掐死我吧

这里有一条数轴,在数轴上有一个红色的线段,它的长度是1。当它乘以3的时候,它的长度发生了变化,变成了蓝色的线段,而当它乘以-1的时候,就变成了绿色的线段,或者说线段在数轴上围绕原点旋转了180度。
2017年5月27日

2000万人口的大北京,上下班原来是这样的(附超炫蝌蚪图)

城市通勤反映的是一个城市中劳动力的活动半径。随着北京城市化和现代化发展进程加快,通勤交通流量的空间分布出现了区域间的分化和区域性的特征。今天,我们用滴滴出行大数据为你重构北京的通勤交通。
2017年5月26日

28页PPT详解腾讯数据挖掘体系及应用

大数据蕴藏着丰富的信息和价值,如何处理好大数据并发掘其潜藏的商业价值,这是大数据时代的新挑战。我们将为大家提供与大数据相关的最新技术和资讯。
2017年5月25日

中国大数据发展调查报告(2017年)

随着大数据政策环境和技术手段的不断完善,大数据行业应用持续升温,中国企业级大数据市场进入快速发展时期。互联网、电信、金融等开始实际部署大数据平台
2017年5月24日

柯洁首战告负AlphaGo,哈萨比斯:这不是人机大战

其实私底下我已经与朋友家人说了很多次这样的想法,现在的AI进步之快远超我们的想象。像国产的绝艺、日产的ZEN虽然和AIphago还有着较大差距,但已经表现出超强的实力了…我相信未来是属于人工智能的。
2017年5月23日

一篇文章解决你所有关于数据分析的问题!

间会穿T恤,下身穿牛仔裤的时间占了62%。工作只占了38%,玩游戏却占了62%,平均每个月会用掉582MB的数据流量。这种图称为信息图,在数据分析这个行业里面,是数据展现工作的主要组成部分。
2017年5月22日

胖是工伤!研究表明,越努力工作的人可能越容易发胖

大数据蕴藏着丰富的信息和价值,如何处理好大数据并发掘其潜藏的商业价值,这是大数据时代的新挑战。我们将为大家提供与大数据相关的最新技术和资讯。
2017年5月21日

理工闷骚男鼻祖:一直贯彻沉默是金,然而,爱情来临之后一秒变话痨

Fowler)的指导下,狄拉克慢慢接触到原子理论,开始研究量子力学,并且用了不到3年的时间,就跻身进入到量子力学一流研究者的行列之中,可以与众多前辈大神波尔、泡利、海森堡等相提并论了。
2017年5月20日

盘点:Java程序员在用的大数据工具

译文链接:http://www.codeceo.com/article/big-data-tools-java-programmer-use.html
2017年5月20日

Intel研究院院长吴甘沙:大数据分析师的卓越之道(珍藏版)

以赛亚柏林有个比喻,有一种人是刺猬,一招鲜吃遍天,还有一种是狐狸,一把钥匙开一把锁,以更开放的态度处理分析、选择最合适的模型。一个技术用到极致是非常厉害的,像贝叶斯,有个很著名的分析师叫Nathan
2017年5月19日

全球顶尖公司的烧脑面试题,普通人一道都答不出来!

直角三角形斜边所对的角是直角,因此,假设其斜边是一个圆的直径,其顶点就可能在圆周的任何一个点上。如果要作一条垂直于斜边的线,那就一定是垂直于圆的直径的线,也就是说,这条线是圆的半径,长度为5cm。
2017年5月19日

深度学习卷积神经网络的秒懂各种操作

大数据蕴藏着丰富的信息和价值,如何处理好大数据并发掘其潜藏的商业价值,这是大数据时代的新挑战。我们将为大家提供与大数据相关的最新技术和资讯。
2017年5月18日

入门级攻略:机器学习 VS. 深度学习

当使用传统机器学习方法解决问题时,经常采取化整为零,分别解决,再合并结果求解的策略。而深度学习主张end-to-end模型,输入训练数据,直接输出最终结果,让网络自己学习如何提取关键特征。
2017年5月17日

点赞撬动的商业帝国丨你的一个赞值多少钱

另一个局限了点赞影响力的因素就是,点赞本身是一种非常弱的“支持行为”。我们的研究表明,一个赞的力量与现实中的一次推荐是不可同日而语的。但是根据麻省理工博士Sinan
2017年5月17日

那些年,追过的开源软件和技术

Java:估计是目前用的最广的项目语言,容易上手,概念简单,无数的库,大量的代码。我就不多介绍了,我自己也是大半的项目用Java写的。缺点时配置比较烦,很多什么XML,Config,适合写服务端。
2017年5月16日

如何通过自学,成为数据挖掘“高手”

(基于内容的推荐,协同过滤,如矩阵分解等)然后在公开数据集上测试,看实现的效果。可以在下面的网站找到大量的公开数据集:http://archive.ics.uci.edu/ml/
2017年5月16日

福利 · 阅读 | 免费申请读大数据新书 第19期

本书通过展示“小熊座”300级自主四轴飞行器的制作示例,为你提供了航空机器人学的实用知识。通过阅读和遵循本书中的步骤及建议,你将学到四轴直升机的工作原理以及它们所带来的工程难题的解决方法。
2017年5月15日

一张图告诉你如何8步炼成数据科学家

Academy)的数学,MIT公开课的线性代数;统计学:Udacity和Openintro;机器学习:Stanford在线中吴恩达(Andrew
2017年5月14日

华为内部狂转好文,大数据,看这一篇就够了!

这些说明什么呢?就是随着大数据和机器学习的进一步进展,这个世界出现了新的智慧生物!大数据和机器学习在改变、重构和颠覆很多企业、行业和国家以后,终于到了改变人类自身的时候了!人类的演进出现了新的分支!
2017年5月12日

避孕套与安全套有什么差别?杜蕾斯&大数据告诉你答案

而不同层次的品牌,往往也对应着不同层次的消费者。这也就解释了为什么习惯说“避孕套”的人,与习惯说“安全套”的人,它们使用的手机品牌也具有较为明显的差异了。(这根网上提到的“小米定律”比较类似)
2017年5月10日

Hadoop没有消亡,它是大数据的未来

生态系统中孵化、开发和维护。开源社区本质上是达尔文式的。它专注于代码质量和行业应用,依赖于路线图和提交者的正确性,如果一个项目缺乏这些,那它会很快走进坟墓。换句话说,生态系统中没有落后者的位置。
2017年5月7日

去哪儿邂逅梦中情人?大数据揭秘各地美女大不同

闲来无事时,京城女子会去听听京剧、歌舞剧、音乐会、演唱会……据网务网站统计,北京各类文艺演出占全国18%。能赚又能花,挡得住雾霾,扛得住房价,能适应京城生活的女子,自然拥有让人敬佩的女王气质。
2017年5月7日

Google、亚马逊、微软 、阿里巴巴开源软件一览

微软的开源JavaScript扩展,为JavaScript添加了类型支持。如果你在开发必须使用JavaScript的Web应用而又觉得类型系统不可获取,TypeScript非常值得尝试。
2017年5月5日

关于数据分析那些事,看这一篇文章就够了

另外,数据分析报告需要有明确的结论、建议和解决方案,不仅仅是找出问题,后者是更重要的,否则称不上好的分析,同时也失去了报告的意义,数据的初衷就是为解决一个商业目的才进行的分析,不能舍本求末。
2017年5月4日

第一代程序员王小波

王小波可以算的上是个GEEK。大学学的贸易,后来又学化学,再后来转到了数学系。他的同学形容他解数学题就像杀猪一样,特别来劲,一道一道解决,那感觉可能就像打CS拿人头一样爽。不过解多了也觉得没意思。
2017年5月3日

浅说深度学习

学习是一个在参数空间里循环往复的过程:当你调整参数改正一次预测,但是模型却可能把原先对的又搞错了。需要很多次的迭代,模型才能具有良好的预测能力,这一“预测-修正”的过程一直持续到模型再无改良空间。
2017年4月29日

我们分析了几千人的面相,竟发现……

然而任何阶级都有天花板。奋斗几年的职场精英渐渐发现,想突破天花板,光靠努力就不够了,反而是“时运”比较重要。就像游戏中,你的等级满了,再与别人PK,实力上相差无几,胜负往往取决于运气。
2017年4月28日

大白话讲解遗传算法

创建C#空项目GenticTSP。然后在AForge目录下找到AForge.dll和AForge.Genetic.dll,将其拷贝到TestTSP项目的bin/Debug目录下。再通过“Add
2017年4月26日

[科普]文科生也能读懂的Deep Learning

大数据蕴藏着丰富的信息和价值,如何处理好大数据并发掘其潜藏的商业价值,这是大数据时代的新挑战。我们将为大家提供与大数据相关的最新技术和资讯。
2017年4月24日

阿里、京东、亚马逊,谁的模式最赚钱? | 图说

亚马逊则是以自营起家,但据公司表示,2015年,第三方卖家已经占到了亚马逊商品总销量的45%以上,而且亚马逊的盈利模式广告之外,还有为第三方卖家提供履单服务的收费(FBA,Fulfilled
2017年4月23日

追踪了783家创业公司五个月,分析了64.7万条数据,我们发现了10个有趣的现象

大数据蕴藏着丰富的信息和价值,如何处理好大数据并发掘其潜藏的商业价值,这是大数据时代的新挑战。我们将为大家提供与大数据相关的最新技术和资讯。
2017年4月22日

跳槽季观察:离职、转行背后的互联网行业大变迁

与去年同期数据相比,教育培训行业招聘活跃度增幅最高,其次则为数据服务、游戏。招聘活跃度指数至少可以说明,在这一行业当中,无论是企业还是求职者都处于活跃期:公司有纳新需求,这一行业对求职者有吸引力。
2017年4月19日

所谓数据驱动,这个锅技术不能背。

数据驱动本身是没问题的,技术创新也确实需要政策,法规有一定的包容性。但我们要知道什么是好的,什么是坏的,如果数据驱动走向了坏的一面,如果技术创新带来了坏的影响,那么,应该想着怎么去纠正,怎么去改进。
2017年4月18日

一文看懂数据可视化:从编程工具到可视化表现方式

定义合适的可视化图形,可以说是最为关键的。一般情况来看,线柱饼等基本图形可以完成我们大部分的需求,这也是分析人员最常用的展现形式;但对于大数据场景或具体业务场景下就需要更加特殊的可视化。
2017年4月17日

做运营必须掌握的数据分析思维,你还敢说不会做数据分析?

自下而上的数据分析思路多用在针对已有数据报表中的数据问题发现,具体思路为:异常数据发现——该异常数据影响因素——影响因素与问题数据之间的相关关系——找出出现异常数据的原因——找到异常数据的解决办法。
2017年4月16日

福利 · 阅读 | 免费申请读大数据新书 第18期

实战维度:以实战为导向,是本书的主旨,除了完全通过手动编程实现网络爬虫和通过Scrapy框架实现网络爬虫的实战案例以外,本书还有博客爬取、图片爬取、模拟登录等多个综合性的网络爬虫实践案例。
2017年4月15日

福利 · 阅读 | 免费申请读大数据新书 第18期

实战维度:以实战为导向,是本书的主旨,除了完全通过手动编程实现网络爬虫和通过Scrapy框架实现网络爬虫的实战案例以外,本书还有博客爬取、图片爬取、模拟登录等多个综合性的网络爬虫实践案例。
2017年4月15日

又一个行业被风吹死了?

Vive已经销售了14万台。目前,Oculus还没有给出具体销售数据,一位“了解情况”的业内人士称,远达不到20万台。索尼PlayStation
2017年4月14日

2017年大数据生态圈三强榜单,快来看看都有谁

MapReduce是一个高性能的分布式计算框架,用于对海量数据进行并行分析和处理。与传统数据仓库和分析技术相比,MapReduce适合处理各种类型的数据,包括结构化、半结构化和非结构化数据。数据量在
2017年4月13日

2017大数据版图最新发布

而且财富1000强公司里面的许多买家在大数据技术方面正在变得越来越娴熟、越来越目光敏锐。这些公司过去几年做了很多功课,正在进入全面部署阶段。这种情况不仅发生在技术导向型的公司,在很多行业都是如此。
2017年4月10日

互联网行业歧视指南

只有BAT,才能歧视BAT。其他互联网企业,只能仰视BAT,你敢歧视?下一秒就买了你,逼得你不得不喊爸爸,实在不行,抄得你叫爸爸。最不能惹的人,就是爸爸,爸爸有钱,说什么都对。
2017年4月2日

国外公司是如何挖掘社交媒体数据的?

一旦收集到社交媒体数据,就可以对其进行评估或分析,从而辨别哪些策略是有效的。当挖掘和分析社交网络时,不妨把社交媒体数据视为原始数据。一旦有了数据,就可以搭建社交媒体分析系统,从而进步一处理原始数据。
2017年4月1日

亚马逊数据专家十年经验总结:成为数据科学家的关键四步

但我后来了解到,图中央的那一撮“独角兽”(中间“数据科学家”色块里的这帮人在圈内被称为独角兽)在现实中极其稀少。即便真存在这种人,也大概会是对各个领域都有涉猎、但没有一门精通的“通才”,而非专家。
2017年3月27日

【突发】百度首席科学家吴恩达宣布辞职(公开信全文)

我将从百度辞职,之前在百度我一直领导AI团队。百度AI非常强大,团队很有天赋。我相信百度的AI会继续蓬勃发展。在百度之后,我很高兴继续致力于我们社会的AI转型和使用AI来帮助每个人更好的生活。
2017年3月22日

大数据的误区:数据统计≠大数据

科技的进步让人变得更懒,也就是我们自身的处理能力降低,无论是主观的还是客观的。而可被选择的对象却在日益增多。从纷繁复杂的商品(电商),到海量曲库中的乐曲;从婚恋网站的男女朋友,到交通管理的信号灯。
2017年3月21日

计算机告诉你,唐朝诗人之间的关系到底是什么样的?

中唐诗人社交网的特征很明显,各位诗人紧紧的团结在以白居易、元稹、刘禹锡为核心的文坛政治局周围,勠力同心,同舟共济,为唐诗从浪漫主义向现实主义的伟大转折做出了历史性贡献。
2017年3月19日

数据科学领域的一张网红图

年受到地铁路线图的启发而创作的一份“如何成为一名数据科学家”的学习路径图,至今依旧是很有指导意义的一份学习参考,算得上是数据科学领域的一张经久不衰的“网红”图了。
2017年3月19日

福利 · 阅读 | 免费申请读大数据新书 第17期

大数据每月推出免费赠书活动。小编将于今日推5本书供各位微友选择,然后从每本书中选出5位幸运的微友,获赠的名单将在下月的赠书栏目中公布,大家快踊跃参加吧!
2017年3月16日

互联网思维的18条法则(值得收藏!)

让用户参与品牌传播,便是粉丝经济。我们的品牌需要的是粉丝,而不只是用户,因为用户远没有粉丝那么忠诚。粉丝是最优质的目标消费者,一旦注入感情因素,有缺陷的产品也会被接受。未来,没有粉丝的品牌都会消亡。
2017年3月13日

“互联网思维”的18条法则

让用户参与品牌传播,便是粉丝经济。我们的品牌需要的是粉丝,而不只是用户,因为用户远没有粉丝那么忠诚。粉丝是最优质的目标消费者,一旦注入感情因素,有缺陷的产品也会被接受。未来,没有粉丝的品牌都会消亡。
2017年3月13日

2017年,为何过半的大数据项目不成功?

成功的大数据项目应该是从企业想要解决的业务问题和希望获得的价值的深刻理解开始。否则,无论企业想实现什么目标,项目都将无法达到预期或提供足够的投资回报,最终结果就会被放弃。
2017年3月12日

不幸的人各有不幸吗?文本分析流浪汉乞讨标语牌后发现的套路(附代码)

呃,这里我们使用这些标语生成假文本似乎玩笑开得有点过了,毕竟现在纽约及其他城市无家可归还是一个很严重的问题。我们的分析就到这里了。如果你对文本挖掘很感兴趣,并且想要进一步了解Andrey
2017年2月28日

数学怪才埃尔德什

大数据蕴藏着丰富的信息和价值,如何处理好大数据并发掘其潜藏的商业价值,这是大数据时代的新挑战。我们将为大家提供与大数据相关的最新技术和资讯。
2017年2月26日

数据分析师内幕揭秘,你想了解的前前后后都在这里

第三,销量上不去了,你得想办法,比如要不要研究下谁会多买,然后派个广告,做个促销,发张会员卡,拯救一下销量(用户画像,用户活跃行为分析,广告投放分析,营销活动分析)。
2017年2月24日

福利 · 阅读 | 免费申请读大数据新书 第16期

大数据每月推出免费赠书活动。小编将于今日推5本书供各位微友选择,然后从每本书中选出5位幸运的微友,获赠的名单将在下月的赠书栏目中公布,大家快踊跃参加吧!
2017年2月15日

谷歌背后的数学原理

大数据蕴藏着丰富的信息和价值,如何处理好大数据并发掘其潜藏的商业价值,这是大数据时代的新挑战。我们将为大家提供与大数据相关的最新技术和资讯。
2017年2月11日

谷歌背后的数学原理

大数据蕴藏着丰富的信息和价值,如何处理好大数据并发掘其潜藏的商业价值,这是大数据时代的新挑战。我们将为大家提供与大数据相关的最新技术和资讯。
2017年2月11日

她用双手改变了无数程序员的生活,你见过的bug都是从她开始,史上第一位女程序员将军技术宅

马克一号被誉为“现代电脑时代的开端”,这个重达四吨的大家伙不仅是第一部万用型计算机,具有一开始运算便无须人为介入的全自动化循序控制能力,它的成功研发还在战时满足了像曼哈顿计划这种项目的大量计算需求。
2017年2月10日

数据分析:微信红包金额分配的秘密

由此可以推测,在微信群聊中发放多个微信红包的情形下,各个红包的金额并非完全随机分配。但是由于微信红包背后的程序未知,所以我们只能够注意到这一现象;其原因可能需要从腾讯公司的程序设计中寻找。
2017年2月2日

一个专家眼中的Go与Java垃圾回收算法大对比

服务1分配内存多于服务2,因此STW暂停在服务1中较高。但STW暂停持续时间在两个服务上都下降了一个数量级。我们看到切换后,两个服务后在GC中花费的CPU使用率增加了约20%。
2017年1月31日

2016年爆热的人工智能,2017年值得加入吗?

现在任何一家人工智能类的公司,都设有机器学习相关职位。然而在现阶段的人工智能公司中,职位与职位之间的概念十分模糊,热门职位算法工程师、数据挖掘工程师和机器学习工程师之间的人才也具有很大的通用性。
2017年1月30日

公司程序员的新年愿望居然是这个,听完我就笑了!

尽管如此,你还是要珍惜身边的程序员,所谓生命不息,编程不止,如果有一天程序员都不编程了,你将不能网购,上不了12306,玩不了手游.......生活处处都会有bug。
2017年1月28日

18 副为程序员定制的对联,总有一副适合你...流泪

大数据蕴藏着丰富的信息和价值,如何处理好大数据并发掘其潜藏的商业价值,这是大数据时代的新挑战。我们将为大家提供与大数据相关的最新技术和资讯。
2017年1月25日

在中国我们如何收集数据?全球数据收集大教程

如果你想要从数据收集之日起的较为完整的宏观经济数据,《新中国五十年统计资料汇编》和《新中国55年统计资料汇编》是一个不错的选择。遗憾的是,它们都没有提供电子版,但后者可以在中国资讯行下载。
2017年1月24日

一篇对大数据深度思考的文章,让你认识并读懂大数据

有人把数据比喻为蕴藏能量的煤矿。煤炭按照性质有焦煤、无烟煤、肥煤、贫煤等分类,而露天煤矿、深山煤矿的挖掘成本又不一样。与此类似,大数据并不在“大”,而在于“有用”。价值含量、挖掘成本比数量更为重要。
2017年1月22日

2017,主要矛盾仍然是不服和跪拜的斗争

大数据蕴藏着丰富的信息和价值,如何处理好大数据并发掘其潜藏的商业价值,这是大数据时代的新挑战。我们将为大家提供与大数据相关的最新技术和资讯。
2017年1月21日

【深度】谷歌、百度、IBM,哪个适合作为你的 AI 和机器学习平台

补充道:“百度在机器学习领域拥有相当深厚的知识、经验和人才储备,但该公司需要更好的市场战略来加速其生态系统的扩张,特别是在企业空间里的扩张。”最近有关百度的负面新闻使该公司形象受损,也是潜在的劣势。
2017年1月20日

大数据的寒冬已至,谁将倒下,谁成巨人?

数据科学的兴起是自2013年来持续提及的预测。实质上目前的很多大数据应用并未涉及到模型,这也是导致门槛低、竞争激烈的重要原因。因为真正大数据的应用应该是“复杂数据的复杂分析”,该领域缺少对应的产品。
2017年1月19日

美国:2016-2045新科技趋势报告

人们将会拥有更多的计算能力以及更广的数码资源。移动网络和云计算将会给人们带来几乎无限的内存和计算能力。虚拟技术和基于软件的系统将会允许政府和企业在不需要昂贵的硬件升级的情况下迅速的调整升级IT系统。
2017年1月16日

从技术 Leader 的招聘需求看,如何转岗为当前紧缺的大数据人才

程序员对这些技术跃跃欲试,知乎上「深度学习如何入门?」「普通程序员如何向人工智能靠拢?」等问题都有很高的关注度。我们在招聘市场也能够看到,越来越多的技术候选人在跳槽时会思考,能否从事相关岗位的工作。
2017年1月14日

打包带走!史上最全的大数据分析和制作工具

作为在大数据领域摸爬滚打叱咤风云的伙计们,也应当有一些实用工具来辅助工作日常。下面是小编精心整理的一些经检测非常实用的工具及网站,呈给大家~~
2017年1月11日

数据科学家自曝工资单!

Central)。在2001年的时候,Datashaping和Analyticbridge每年给我带来$6,000的收入,2005年的时候有$12,000,2010年的时候是$60,000。
2017年1月4日

一名优秀的数据分析师是怎样炼成的?

Marketing,电子邮件营销)的形式向目标用户推送,用户可以直接点击邮件中的链接完成注册。该渠道的注册转化率一直在10%-20%之间;但是8月下旬开始注册转化率急剧下降,甚至不到5%。
2016年12月30日

2016年“大数据”产业的“真实面目”

本文作者江濡山,微信公众号:濡山侃财(ID:jrs_jrs)。哈佛大学肯尼迪政府学院访问学者、高级研究员;香港环球经济电讯社(GEDA)首席经济学家。
2016年12月24日

傅盛:深度学习是一种新的思维方式

谷歌是传统的软件工程思维。用高精尖地图,把一段路的地图精确到厘米级,以便车子开的过程中就知道路况,通过激光来避开路面障碍。但问题在于,这套方案,只有知道地图和路况不发生改变时才能运行。
2016年12月22日

影响计算机算法世界的十位大师

e。他曾经这样回忆自己的父亲:“在我还是个中学生时,他就让我做几千道几何题……解决这些问题的大脑训练是父亲给我的最好礼物。这些几何题,在发展我分析能力的过程中,起了最最重要的作用。”
2016年12月21日

最强单身狗:60年前搞出全球宅男最爱神器,一不小心成人工智能之父

大数据蕴藏着丰富的信息和价值,如何处理好大数据并发掘其潜藏的商业价值,这是大数据时代的新挑战。我们将为大家提供与大数据相关的最新技术和资讯。
2016年12月17日

CCF:2017年大数据发展趋势报告及解读

这个报告我想大家都已经参加多年,可能比较熟悉了,这个报告是大数据专家为每年在技术大会上的保留节目,也就是在大数据专家为内部通过对专家的意见征集,最后投票、汇总形成这样一个对下一年大数据趋势的预测。
2016年12月16日

福利 · 阅读 | 免费申请读大数据新书 第15期

本书将教你充分利用集群硬件优势的Lambda架构,以及专门用来捕获和分析网络规模数据的新工具,来创建这些系统。它将描述一个可扩展的、易于理解大数据系统的方法——可以由小团队构建并运行。
2016年12月15日

一文看懂人工智能:原理,技术和未来

AI也解决了我们人类所面临的核心问题之一:什么是智能(intelligence)?哲学家和科学家一直在努力解决这个问题,而答案却一直难以捉摸、飘忽不定,哪怕这个中心是我们能称之为人的根本属性。
2016年12月13日

如何七周成为数据分析师

Excel的图表可以100%完成上面的图形要求,但这只是基础。后续的进阶可视化,势必要用到编程绘制。为什么?比如常见的多元分析,你能用Excel很轻松的完成?但是在IPython只需要一行代码。
2016年12月8日

谷歌联合创始人Avinash:如何用数据分析闭环引爆百亿美金公司订单3倍增长?

首先:目标受众是谁?事情的发生都是因为有人做了什么。那么你期望做什么呢?受众是所有人,还是用户中的一部分?他们是正确的受众吗?你能触达他们吗?直到你明确了你是要试图改变哪些人的行为,才能去吸引他们。
2016年12月6日

2017年大数据的十大发展趋势

佛瑞斯特研究公司(Forrester)的研究人员发现,2016年,近40%的公司正在实施和扩展大数据技术应用,另有30%的公司计划在未来12个月内采用大数据技术。2016年NewVantage
2016年12月5日

2017年大数据的十大发展趋势

佛瑞斯特研究公司(Forrester)的研究人员发现,2016年,近40%的公司正在实施和扩展大数据技术应用,另有30%的公司计划在未来12个月内采用大数据技术。2016年NewVantage
2016年12月5日

大数据等最核心的关键技术:32个算法

Algorithm)——在数学的优化理论中,单纯型算法是常用的技术,用来找到线性规划问题的数值解。线性规划问题包括在一组实变量上的一系列线性不等式组,以及一个等待最大化(或最小化)的固定线性函数。
2016年11月29日

2016十大热门大数据岗位,拿走不谢

大数据蕴藏着丰富的信息和价值,如何处理好大数据并发掘其潜藏的商业价值,这是大数据时代的新挑战。我们将为大家提供与大数据相关的最新技术和资讯。
2016年11月26日

2017年关于数据科学六大预言

迄今为止,大约只有30%的商业界经历了大数据革命,但是2017年,肯定会看到一个大数据投资的持续增长,尤其是处理“大容量,高速度和多样性的数据”的成本大幅下降以后。根据Information
2016年11月22日

【膜拜大神】当今世界最牛的25位顶尖大数据科学家

X秘密实验室是Google最神秘的一个部门,探索前沿科学技术与未来,这里汇聚了其它高科技公司、各大高校和科研院所挖过来的顶级专家,可能是梦想实现之地,但是也有可能会失败)并作为副总裁(Vice
2016年11月20日

漫画:什么是机器学习?

上个世纪90年代,沃尔玛超市已经是美国最大的零售企业,拥有大量的顾客资源。那时候的沃尔玛已经采用了先进的计算机技术,随时记录着每天众多顾客购物车中所挑选的商品明细。
2016年11月19日

福利 · 阅读 | 免费申请读大数据新书 第14期

在智能制造时代,企业应如何构建基于工业4.0的精益管理体系?又应该如何将理论应用于实践?本书基于大量详实案例,全面总结德国精益管理模式、要素和实施步骤,给出精益管理的正确方向。
2016年11月15日

终年32岁的传奇数学家,生前寂寂无闻,一个世纪后却让硅谷领袖们集体落泪致敬

看到后面几页,哈代不禁惊呼:“这些定理彻底把我打败了,真是见所未见,闻所未闻!”在看完最后一页上的连分式定理后,哈代认为这些定理“一定是成立的,因为没有哪个人类的想象力可以强大到凭空把它们造出来。”
2016年11月14日

如何用大数据思维找女朋友?

例如对方的微博最近更新频率快,内容多为悲伤失意,评论中没有男友的出现,而情敌的微博却欢声笑语一片,这些数据传递的很可能是她失恋了,你有机会了。
2016年11月12日

漫画:什么是大数据

如果没有更加快速有效的海量数据解决方案,那么如此大量多样的数据不但没有带来更多价值,反而成为了系统的负担。关于这一点,谷歌公司率先提出的MapReduce模型为我们带来了新的道路。
2016年11月8日

数据可视化的七大秘密

差不多任何需要针对两个以上的数据集进行清洗的工作总会需要或多或少的人工的工作。有很多工具能够把XLS文件转化为XML的格式或者把时间戳转换为其他日期格式。但是,
2016年11月7日

Gartner公布2017年十大战略科技发展趋势

Gartner将战略科技发展趋势定义为具有巨大颠覆性潜力、脱离初期阶段且影响范围和用途正不断扩大的战略科技发展趋势;这些趋势在未来5年内迅速增长、高度波动、预计达到临界点。
2016年11月5日

自学成才的数据科学家告诉你5个学习大数据的正确姿势!

你需要些东西来激励你不断学习,即使是在半夜公式已经开始变的模糊,你还是想探究关于神经网络的意义。你需要些动力来让你发现统计、线性代数和神经网络之间的联系,当你在困惑“下一步我该学习什么?”的时候。
2016年11月4日

如何找到心仪的数据科学相关工作?

本文将重点讨论如何创建高大上的数据科学作品集。我们将讨论什么技能是雇主希望看到的,以及如何创建一份作品集以有效地展示所有的技能。我们将举例说明作品集中的项目应该如何呈现,并给你一些起步的建议。
2016年11月2日

7步教你打造你的第一份数据报告

以上这两个洞察的例子本身比较简单,但通常来说,即使是复杂的数据报告,也是由一个个相对简单的洞察结论组成的,这其中涉及到问题的分拆,逻辑线的建立等一系列内容。作为初学者,做到自己力所能及的程度就好。
2016年11月1日

霍金剑桥最新演讲:AI可能成就或者终结人类文明(附视频)

现在人工智能的研究日新月异。最新的标志性成果,比如自动驾驶汽车、阿尔法狗战胜围棋世界高手,预示着即将到来新的时代。大小额投资纷纷倾注于这个领域。我们迄今为止所见到的成就,在新时代面前,即将黯然失色。
2016年10月30日

经验贴│怎样进行大数据入门级学习

S:这本书里统计学的理论就讲得比较多了,好处就是你可以用一本书既复习了统计学,又学了R语言。(S/Splus和R的关系就类似于Unix和Linux,所以用S教程学习R,一点问题都没有)。
2016年10月28日

干货:数据分析师的能力和工具体系

无论做数据分析的哪个方向,初级还是高级,都需要有快速学习的能力,学业务逻辑、学行业知识、学技术工具、学分析框架……数据分析领域中有学不完的内容,需要大家有一颗时刻不忘学习的心。
2016年10月25日

如何真正学好数据科学?

我们一味地学习新技术,却很少关注自己的学习动机。数据科学是一个广泛甚至有些模糊的领域,这使它很难掌握。如果没有动力,你很可能学到一半就开始自我怀疑。我知道这不怪你,因为你只是没得到正确的指导。
2016年10月21日

大数据投资人必读:中国大数据发展与投资分析报告

整体来看,大数据产业涉及的领域包括数据生成、数据存储、数据处理以及数据应用等;其产品与服务则包括硬件产品、基础软件、应用软件、信息服务等,以下分别从这几个方面分析大数据产业链的投资机会。
2016年10月16日

福利 · 阅读 | 免费申请读大数据新书 第13期

大数据每月推出免费赠书活动。小编将于今日推5本书供各位微友选择,然后从每本书中选出5位幸运的微友,获赠的名单将在下月的赠书栏目中公布,大家快踊跃参加吧!
2016年10月15日

您的位置信息如何被利用?——基于位置信息的应用和地理信息匹配算法

关于地理信息或空间数据的计算,主要考虑的是经纬度的计算(Lat、Lang),不同的坐标系有差别,主要软件很多:ArcGis、Alteryx、Mapbox、R语言或Python都有相关算法和分析包
2016年10月14日

他是码农鼻祖:颜值碾压吴彦祖,智商完爆爱因斯坦,爱好却叫人吐血...

他把19世纪中叶英国数学家——乔治·布尔的布尔代数和电子电路中开关和继电器的工作原理,独创性地结合在一起,最后写出了那篇后人称为“20世纪最重要的硕士论文”的文章,直接炸出了一个新的学科:信息学。
2016年10月11日

数据分析:微信红包金额分配的秘密

由此可以推测,在微信群聊中发放多个微信红包的情形下,各个红包的金额并非完全随机分配。但是由于微信红包背后的程序未知,所以我们只能够注意到这一现象;其原因可能需要从腾讯公司的程序设计中寻找。
2016年10月10日

硅谷教父凯文·凯利最新预言:未来20年最重要的2个科技趋势!

我相信,我们讲的人工智能、VR,包括这些实时跟踪正处在发展的初期,它能够产生无穷的能量,不断的推动时代往前走。我们有这些工具,有最好的时代,我们有如此众多的机会,而且现在正处在这个时代的一个开端。
2016年10月9日

马云正式宣布:VR购物问世!实体店真的没法活了(内含粉丝福利)

大数据蕴藏着丰富的信息和价值,如何处理好大数据并发掘其潜藏的商业价值,这是大数据时代的新挑战。我们将为大家提供与大数据相关的最新技术和资讯。
2016年10月8日

十张图看懂未来的大数据世界

大数据蕴藏着丰富的信息和价值,如何处理好大数据并发掘其潜藏的商业价值,这是大数据时代的新挑战。我们将为大家提供与大数据相关的最新技术和资讯。
2016年10月1日

万字长文回溯深度学习革命,盘点 16 大历史时刻

家公司,都有产品供你搜索或自动组织没有明确标签的照片。你可以要求系统显示所有带有狗的照片,或者有雪的,甚至抽象些比如含有拥抱场景的。这些公司都有研发中的产品,可以自动生成一句话那么长的图说。
2016年9月29日

为什么有些人用3年的时间获得了你12年的数据分析经验

我练了半年跑步,有次送儿子去某个学校考试,闲着无聊就在400米操场跑了10圈,还感觉蛮轻松的,说实话,我从来没有在操场跑步超过5圈,因为有恐惧症,以前中学大学1000米考试已经要了我的老命。
2016年9月27日

微信应用号?不!微信小程序来了!

OS,这比百度直达号要强大的多,除了移动端流量之外,微信提供的原生能力也是百度所不能比的。中国所有的互联网产品能够站在世界互联网产品行列中傲视群雄的,能够在各个方面做的都世界一流的,非微信莫属。
2016年9月22日

福利 · 阅读 | 免费申请读大数据新书 第12期

document.getElementById('js_content').addEventListener("selectstart",function(e){
2016年9月15日

数据分析真的能驱动用户快速增长吗?

除了E&E,其他博弈性的场景还很多,例如广告里的机制设计问题(也就是竞价市场的规则如何制定);再比如有一定社交性的游戏运营策略,都是从原理上就无法通过简单分流量就能进行有效的A/B测试的。
2016年9月6日

2016年创业公司死亡名单:融资10亿、用户千万也救不活了!

7、在经济下行周期,如果你做好了准备,别人的“危”正是你的“机”。如果你有健康稳定的现金流和充足的现金储备,有足够强大的内外部运营体系和足够好的人才积累,那么你将迎来蓄势待发、整合市场的黄金期。
2016年9月4日

被失业!未来六大传统产业将这样被颠覆(超现实)

IBM公司从20世纪70年开始就致力于机器智能的研究,并且在工业界一直处于领先地位。IBM开发的沃特森(Watson)智能系统可以理解自然语言,分析各种数据和医学影像,帮助疾病诊断和医疗信息的管理。
2016年8月30日

为何你只能做出渣图表?数据可视化的十大误区

设计师要做的,不仅仅是选择合适的图表类型,更要以一种容易理解的方式来呈现信息,设计出更直观的导航系统,让观众做尽可能减少理解方面的麻烦,做到一目了然。
2016年8月29日

2分钟读懂大数据框架Hadoop和Spark的异同

同时,Hadoop还会索引和跟踪这些数据,让大数据处理和分析效率达到前所未有的高度。Spark,则是那么一个专门用来对那些分布式存储的大数据进行处理的工具,它并不会进行分布式数据的存储。
2016年8月28日

说说什么是数据挖掘

绝大多数的数据挖掘工程都是针对具体领域的,因此数据挖掘工作人员不应该沉浸在自己的世界里YY算法模型,而应该多和具体领域的专家交流合作以正确的解读出项目需求。这种合作应当贯穿整个项目生命周期。
2016年8月27日

人工智能、机器学习、深度学习,三者之间的同心圆关系

的广泛应用有关,为了使并行处理更快、更便宜、更强大。这也与近乎无限的存储能力和各类数据洪流(所有的大数据运动)——图像、文本、交易、测绘数据,只要你说得出来——一道进行。
2016年8月24日

裁员浪潮+寒冬大逃杀,互联网人该何去何从?

你可能无法完全规避创业公司会有的种种风险,但你至少可以选择靠谱的老板。请相信我,如果跟着一个靠谱的老板,哪怕最后项目和产品挂了,你也会有更大的可能性和空间能够去积累起来一些自己的核心竞争力。
2016年8月23日

39个大数据可视化工具,哪个才是你的菜?

Tangle是一个JavaScript库和工具,不仅仅是视觉化,还允许设计师和开发者创建reactive程序,对数据的关系可以提供深层理解。例如,一个网页端的转换计算器能够转换货币或测量。
2016年8月20日

他的名字是Linus,他是所有程序员们的上帝

大数据蕴藏着丰富的信息和价值,如何处理好大数据并发掘其潜藏的商业价值,这是大数据时代的新挑战。我们将为大家提供与大数据相关的最新技术和资讯。
2016年8月17日

上班族每次在地铁上花费37分钟,经过9.78站|2号线是上海经济命脉|上海地铁数据趣味研究

大数据蕴藏着丰富的信息和价值,如何处理好大数据并发掘其潜藏的商业价值,这是大数据时代的新挑战。我们将为大家提供与大数据相关的最新技术和资讯。
2016年8月16日

福利 · 阅读 | 免费申请读大数据新书 第11期

本书为解决各种R语言编程问题提供了非常有用的工具和技术,帮助你少走弯路。书中阐释了R语言简洁、优美以及灵活的核心特点,展示了许多必备的技巧,通过它们可以创建在各个场景中使用的优质代码。
2016年8月15日

华章微课堂 | 认知领域的剩余价值——看懂大数据与机器学习

金山软件西山居资深大数据架构师与大数据专家,专注于大数据系统架构以及变现研究。有多年编程经验(多年日本和澳洲工作经验)和多年大数据架构设计与数据分析、处理经验。
2016年8月15日

五亿姓名数据分析|TF-IDF算法揭秘中国人名密码

从下表中可以看到“抗美”和“援朝是1951年的专属名字,抗美援朝战争从1950年10月—1953年7月,最广为人知的上甘岭战役发生在1952年,但其实还有很多艰苦激烈的战役都集中在1951年。
2016年8月12日

写好一份数据分析报告的13个要点

第八、好的分析一定是出自于了解产品的基础上的,做数据分析的产品经理本身一定要非常了解你所分析的产品的,如果你连分析的对象基本特性都不了解,分析出来的结论肯定是空中楼阁了,无根之木如何叫人信服?!
2016年8月4日

写给准数据人的数据世界入门指南

PPT里因为存在具体业务的案例,不便分享,到此为止吧。如果有时间的话,我还是会编脱离具体业务的案例的……这就是写博客的苦逼之处,工作中都是工作的案例,为了写篇博客,还得自己再编一套有板有眼的故事……
2016年8月1日

力荐!大数据等各种IT技能图谱(全套13张)

技术领域(云计算,大数据,运维,安全,开发语言,智能硬件等)及互联网产品、运营等领域学习技能图谱,帮助程序员梳理知识框架结构,并尝试提供路径指导和精华资源,方便技术人学习成长。
2016年7月31日

天龙八部:一张图告诉你如何8步炼成数据科学家

Academy)的数学,MIT公开课的线性代数;统计学:Udacity和Openintro;机器学习:Stanford在线中吴恩达(Andrew
2016年7月30日

如何成为一名大数据工程师?

虽然对于一些大公司来说,拥有硕博学历的公司人是比较好的选择,不过阿里巴巴集团研究员薛贵荣强调,学历并不是最主要的因素,能有大规模处理数据的经验并且有喜欢在数据海洋中寻宝的好奇心会更适合这个工作。
2016年7月20日

12种思维导图工具助你成为结构化思维专家

通过使用它做出的思维导图,你可以建立起一个想法和语言高度联系的网络,此举可以帮助你解决许多更复杂的问题。这款工具里的元素都设计的非常好,因此用户不需要花很多时间去研究该如何使用这款应用。
2016年7月18日

骗子也玩大数据?来自数据分析师的揭秘

我们再以信用卡提额诈骗举例。就目前披露的数据显示,某一银行在短短的3个月时间内接到被骗客户投诉数突增6000多起,占到欺诈案件总数的48%以上。为何看似老套的欺诈手段,为什么还有这么多人上当受骗呢?
2016年7月18日

从O2O到全民直播:95% 的创业者败给了认知界限

现在至少有许多人蜂拥而至,否则短时间内不会出现这么多直播平台,但大多数人对同一件事看好,并非就是真的可以高枕无忧了,历史不会重演,但总是相似,就以o2o这个案例来讲,至少绝大多数初创已经关门大吉了。
2016年7月17日

2016年上半年大数据方向就业形势重磅出炉

从职位的级别划分来看,其薪资范围的幅度很大,初级薪资范围在4-15k之间,中级薪资在6.6-20K之间,高级薪资在12.6-65K之间,所以对于大数据行业的求职者来说,其发展空间很大。
2016年7月16日

福利 · 阅读 | 免费申请读大数据新书 第10期

本书从初学者的角度出发,内容由浅入深,循序渐进。全书从安装到基础函数的使用,对各个操作步骤详细叙述,凡涉及的常用参数均加以说明,每个操作函数均有实际的示例,极大程度地降低了初学者使用函数的难度。
2016年7月15日

关于反爬虫,看这一篇就够了

这个是一个极端的例子。这个东西本意是用来做自动测试的,结果因为效果很好,很多人拿来做爬虫。但是这个东西有个硬伤,就是:效率。此外PhantomJs也是可以被抓到的,出于多方面原因,这里暂时不讲。
2016年7月14日

大数据技能知多少?

扩展的,还会有内存型数据库Redis,图数据库Neo4j,还有全文索引的ElasticSearch和Solr,还有Hbase和Cassandra,这些根据具体的业务,选择性的掌握其中一部分。
2016年7月13日

他是比尔盖茨的偶像,用50年写出编程圣经,被奉为程序员鼻祖

大数据蕴藏着丰富的信息和价值,如何处理好大数据并发掘其潜藏的商业价值,这是大数据时代的新挑战。我们将为大家提供与大数据相关的最新技术和资讯。
2016年7月10日

一篇文章让你看懂数据分析的目的、方法、工具及实际应用

想要找到这些关键点,除了通过用户调研、访谈等切实的洞察用户外,在产品中设置相关数据埋点记录用户的行为,观察其行为轨迹,不能完全替代洞察用户的行为,不过也可以有助于决策产品改进点。
2016年6月30日

Hadoop创始人Doug Cutting谈未来大数据的技术

Cutting十年前创建Hadoop架构的时候,他从未想过这会为企业界带来如此超大规模的计算。“毫无疑问,我当初预想的情况比我们现在所看到的要稍微保守一些。“他在近期伦敦的Strata+Hadoop
2016年6月27日

线下活动:2016软件定义存储(SDS)技术沙龙

本书是软件定义存储(SDS)领域的集大成者和开创性著作。倪光南院士、IDC中国副总裁武连峰、VMware全球副总裁李映、企事录创始人张广斌、DOIT创始人郑信武、猎豹移动CTO
2016年6月20日

福利 · 阅读 | 免费申请读大数据新书 第9期

授人以鱼,全面讲解程序员面试时需要掌握的各种编程必备知识和技巧;授人以渔,针对来自全球顶尖IT企业的极具代表性的面试题给出了解答思路,并揭示了这些企业的面试过程。
2016年6月15日

世界顶尖数据科学家看未来十年大数据发展

我们对未来的预测将会前所未有的精确!举例来说,美国联合包裹服务公司(UPS)已经能够运用置于卡车关键部位上的传感器发回的数据,通过这种方式,他们就能预测机械故障,每年给这家公司节省了数百万美元。
2016年6月14日

腾讯的实践表明:最重要的不是大数据,而是……

社交平台本身就是一个浓缩的小社会,社会的新变化、新趋势,都会在这个平台有所反应。比如,大家越来越觉得,当代年轻人变得无法定义了,他们似乎喜欢追星、喜欢消费,他们究竟是怎样一群人呢?能否做出一些描述?
2016年6月11日

为不擅长编程的人准备的19个数据科学工具

这些过程将在不同的命令中明显递进。该BigML平台对结果提供很好的可视化,并有解决分类、回归、聚类、异常检测和结社发现问题的算法。你可以感觉到他们的接口是如何使用YouTube频道进行工作的。
2016年6月6日

凯文·凯利:大数据时代没有旁观者

另外,不管你们是做哪个行业的,真正对你们构成最大威胁的对手一定不是现在行业内的对手,而是那些行业之外你看不到的竞争对手。接下来,我想给大家说一说那些我认为有可能产生颠覆的领域。
2016年5月23日

长文 | 大数据思维的十大原理

关注相关性而不是因果关系,社会需要放弃它对因果关系的渴求,而仅需关注相关关系,也就是说只需要知道是什么,而不需要知道为什么。这就推翻了自古以来的惯例,而我们做决定和理解现实的最基本方式也将受到挑战。
2016年5月22日

不让谷歌进来是对的。。。

然而,作为一个每天在23:59分发文的公众号,差评君觉得自己非常吃亏,我特么又没条件去现场,大家说来说去也就这么多。。。感觉关于此次大会的几个新鲜玩意儿都已经被友号们说光了。。。=
2016年5月20日

史上最全的大数据分析和制作工具

大数据蕴藏着丰富的信息和价值,如何处理好大数据并发掘其潜藏的商业价值,这是大数据时代的新挑战。我们将为大家提供与大数据相关的最新技术和资讯。
2016年5月19日

福利 · 阅读 | 免费申请读大数据新书 第8期

MATLAB官方(MathWorks)资深大数据挖掘专家撰写,Works官方及多位专家鼎力推荐。从技术、方法、案例、最佳实践4个维度循序渐进地讲解了大数据挖掘技的流程、方法和原理。
2016年5月15日

深解读:什么是数据科学?如何把数据变成产品?

把所有这些应用联系到一起的纽带就是从用户那里采集的数据来提供附加价值。无论这个数据是搜索关键词、语音样本或者产品评价,现在用户已经成为他们所使用的产品的反馈环中重要的一环。这就是数据科学的开端。
2016年5月14日

【福利】最后赠票20张,第八届中国云计算大会半日票

在大会主会以及专题论坛上,目前已经确认参加大会并进行演讲的嘉宾如下,当然伴随大会的推进,还将会有更多嘉宾陆续加入。目前已经确认的演讲嘉宾以及他们的演讲主题包括(嘉宾排序按照确认参会、提交话题顺序):
2016年5月12日

一篇文看懂Hadoop:风雨十年,未来何去何从

up架构遇到了技术瓶颈,不断增加的计算需求迫使软件技术不得不转到分布式方向寻找解决方案。同时,PC服务器技术的发展使得像Hadoop这样使用廉价节点组群的技术变为可行,同时还具有很诱人的性价比优势。
2016年5月11日

全球20个最佳大数据可视化工具,高级PPTers的法宝

它不仅提供了PC桌面版,还提供了服务器解决方案,可以让您在线生成可视化报告。服务器解决方案可以提供了云托管服务。Tableau的客户包括巴克莱银行,Pandora和Citrix等企业
2016年5月10日

陪你三天三夜!看一场数十院士、上百专家演讲的云计算大会应该用什么姿势?

在大会主会以及专题论坛上,目前已经确认参加大会并进行演讲的嘉宾如下,当然伴随大会的推进,还将会有更多嘉宾陆续加入。目前已经确认的演讲嘉宾以及他们的演讲主题包括(嘉宾排序按照确认参会、提交话题顺序):
2016年5月9日

未来世界上市值最高的公司,可能是这位。。

要理解光场技术,大家可以这么想。。。我们目前还停留在屏幕上的像素阶段。。但是如果每个像素不再是点,而是一条射线呢(就像现实生活中这样),那么这就是光场的感觉了,你从不同的角度看,看到的是不一样的!
2016年5月7日

云计算会议千千万 为何你唯独不能错过这一场?(内有粉丝专属双重福利)

硬实力:包括会议召开城市、场地、规模、天数,以及官网、邀请函等物料的质量。不要告诉我一场连地方都不好找的大会,能吸引多么专业的参会嘉宾;也不要告诉我邀请函都做不好、官网都没有的大会,能有多么的高端。
2016年5月4日

一篇对大数据深度思考的文章,让你认识并读懂大数据

有人把数据比喻为蕴藏能量的煤矿。煤炭按照性质有焦煤、无烟煤、肥煤、贫煤等分类,而露天煤矿、深山煤矿的挖掘成本又不一样。与此类似,大数据并不在“大”,而在于“有用”。价值含量、挖掘成本比数量更为重要。
2016年5月3日

从Hadoop洞悉大数据市场:路漫漫其修远兮(内有福利)

当刚看到这些原始数据的时候,我们会发现大数据市场还有非常大的潜在空间。但是现在真正的使用者非常少,而这方面的公司又多如牛毛,意味着大数据科技公司中会被并购。简单地讲,大数据市场会慢慢的变得更加成熟。
2016年4月30日

2016年,文本分析、情感分析和社交分析的10大趋势

HCI》充分地讨论了人机结合条件下机器翻译的状态)我不能说胜利就在眼前,但是多亏了大数据和机器学习,2016年(或2017年)对于大多数任务来说,主流语言的机器翻译能做到足够好。这就是胜利!
2016年4月28日

太阳底下无隐私:那些年我们做的微博数据挖掘

上面就是主页君微博300多位好友的分析,整个计算过程从采集数据到可视化,需要约10秒钟。小球的颜色代表了分组,大小展示了好友的重要性。在中心位置的人,当然是主页君啦。
2016年4月28日

怎样成为一个数据科学家:针对大学毕业生的指导

Borne说(http://www.boozallen.com/)“数据科学家人才短缺的最好解决方案是组成一个数据科学家团队。所以我建议有应该精通两个多个领域的同时对其他领域也能有一个基本的了解。”
2016年4月25日

【真象】关于中国人如何网购,你可能不知道的7个真相

调查中,23.6%的用户有关注这类商品推荐的社交账号或社区。在这部分人群中,他们关注的动机核心是“节省我费心挑选商品的时间”,占比为40.9%。其次为了解一些不知道的商品,或者是推荐的东西符合喜好。
2016年4月25日

10年内,这三大领域将被人工智能和大数据重塑

想象有这样的一种服务,能浏览你过去几年在社交平台上发布的所有内容并且通过情感分析得出你喜欢或者讨厌什么行业或价值观。比如说:你喜欢科技和时尚,但是厌恶酒精和暴力。你爱欧洲,但不怎么喜欢俄罗斯,等等。
2016年4月23日

2016大数据版图(附所有高清、历史版本下载)

然而,随着大数据继续走向成熟,这个术语本身可能会消失,或者变得太过时以至于没有人会再使用这个词。这就是成功赋能技术令人讽刺的命运归宿—由于技术的广泛传播,然后到达无所不在的地步,最后被人熟视无睹。
2016年4月21日

福利 · 阅读 | 免费申请读好书 第7期

大数据每月推出免费赠书活动。小编将于今日推5本书供各位微友选择,然后从每本书中选出4位幸运的微友,获赠的名单将在下月的赠书栏目中公布,大家快踊跃参加吧!
2016年4月15日

爬取QQ空间3000万用户,玩玩大数据分析

如果当我们拥有海量的QQ空间最新说说,和sina微博数据。我想,用它们来做一些股市或者其它方面的分析预测是可行的,准确度应该也是非常高的。我接下来可能会考虑去做这件有趣的事情。
2016年4月12日

干货!21个必知数据科学面试题和答案

这通常是通过添加一个常数到现有的权向量。这个常数通常要么是L1(Lasso)要么是L2(ridge),但实际上可以是任何标准。该模型的测算结果的下一步应该是将正则化训练集计算的损失函数的均值最小化。
2016年4月4日

华为内部狂转好文,有关大数据,看这一篇就够了!

这些说明什么呢?就是随着大数据和机器学习的进一步进展,这个世界出现了新的智慧生物!大数据和机器学习在改变、重构和颠覆很多企业、行业和国家以后,终于到了改变人类自身的时候了!人类的演进出现了新的分支!
2016年3月31日

你的公司是否真的需要大数据战略?

作为数据统治的一部分,公司应该通过定义一系列最佳实践和原理来制定标准,该标准可以使企业创建和维护好数据质量。强大的数据质量可以令企业对关键绩效指标KPI有更深入的了解,从而促进决策制定和业务发展。
2016年3月28日

大数据时代之下,用户隐私的尺度在哪里?

还有一种比较客观中立的观点:为推动大数据的发展,应该允许进行数据加工的企业获得部分权利。但通过这种方式获得权利的同时,企业也需要承担相应的义务。还以匿名处理为例,增加的义务应该包括:
2016年3月27日

大数据商机:用户打瞌睡都值钱

再者,拥有大量人员海量健康数据的公司,可以根据已经推测的预期结果,让某种医药生产厂商来决定是否要扩大或者缩减对抗某种疾病的药品的生产规模,以适应未来的潜在病患的购药需求。
2016年3月16日

大数据:更多的数据还是更好的算法?

这就是分析员的困境,而这种困境是目前分析工作的常态,也许压力不是来自于领导,但也有可能来自于市场的压力,个人绩效的压力,时间精力的有限,经验和知识的匮乏,甚至是内心无法言明的情绪等。
2016年3月9日

Hadoop之父Doug Cutting眼中大数据技术的未来

回首过去,10年前我们决不会猜到Hadoop将会在这般的滔天巨变中发挥如此关键性的作用。对于今天所取得的一切成就,感到十分自豪和惊喜。随着数据世纪的到来,期待看到Hadoop继续发挥它的影响。
2016年3月7日

大数据的误区:数据统计≠大数据

科技的进步让人变得更懒,也就是我们自身的处理能力降低,无论是主观的还是客观的。而可被选择的对象却在日益增多。从纷繁复杂的商品(电商),到海量曲库中的乐曲;从婚恋网站的男女朋友,到交通管理的信号灯。
2016年3月3日

其实这些数据科学专长,才是老板们最想要的!

如上所述,SQL是最常见的技能,在Linkedin发布的所有数据科学工作中占比达到了57%。Hadoop排在第二,占比49%。这并不出乎CrowdFlower公司CEO和创始人Lukas
2016年2月22日

豆瓣还是朋友圈:大数据、新方法和日常问

上面的结论还不够,虽然作者已经说明了情感共享确实能够影响观影人数,但我们还要排除替代性的解释,最主要的就是排除学习。作者考虑了两种不同的学习机制。第一种学习机制是社会学习(social
2016年1月7日

用户画像全解析 | 都在说用户画像,你真的了解透了吗?

用户画像的焦点工作就是为用户打“标签”,而一个标签通常是人为规定的高度精炼的特征标识,如年龄、性别、地域、用户偏好等,最后将用户的所有标签综合来看,就可以勾勒出该用户的立体“画像”了。
2016年1月6日

自拍有风险!大数据在用什么姿势“出卖”你?

而就在几个月前,某ISIS成员在其“总部大楼”自拍,并且在社交网络上大肆吹嘘这里的指挥能力有多么“炸裂”。结果一语成谶,22小时之后,这幢大楼就被美军三枚导弹“强拆”了,“炸裂”得粉身碎骨。
2016年1月2日

经验 ▏美国数据分析师分享Amazon面试经验

你可以料到以下领域会被问及:统计学、机器学习、预测、算法、所有计算机系本科生应该了解的知识,以及与上面所有领域相关的扩展性和表现。哦对了,你还要准备用一种你选择的语言编程。小菜一碟吧?!
2015年12月26日

大曝光 | Facebook内部高效工作指南

结合,创造不间断工作时间:一个小会,也会毁了一个下午,因为它会把下午撕成两个较小的时间段,以至于啥也干不成。PS:当看到一个程序员冥思苦想时,不要过去打扰,甚至一句问候都是多余的。
2015年12月21日

2016年大数据发展七大趋势

雾计算正在迅速地获得大量动力。雾计算是指推进连接到物联网的终端设备和存储数据的云计算之间的存储、传输和计算。随着物联网的进步,雾计算势头越来越猛,因为传感器变得相当精密,它们现在可以收集大量数据。
2015年12月19日

13个大数据应用案例,告诉你最真实的大数据故事

十多年前,音乐元数据公司Gracenote收到来自苹果公司的神秘忠告,建议其购买更多的服务器。Gracenote照做了,而后苹果推出iTunes和iPod,Gracenote从而成为了元数据的帝国。
2015年11月21日

“大数据”时代,什么是数据分析做不了的?

当大量个体对某种文化产品迅速产生兴趣时,数据分析可以敏锐地侦测到这种趋势。但是,一些重要的(也是有收益的)产品在一开始就被数据摈弃了,仅仅因为它们的特异之处不为人所熟知。
2015年11月15日

还在考虑国内游?大数据告诉你出境游才是真会玩

大数据蕴藏着丰富的信息和价值,如何处理好大数据并发掘其潜藏的商业价值,这是大数据时代的新挑战。我们将为大家提供与大数据相关的最新技术和资讯。
2015年11月13日

凯文·凯利:未来20年科技的必然走向(10月22日最新演讲)

其中有一个流是量化自我,八年前我就量化自我出了一本书,就是如何去跟踪自己的情况。包括技术、设备、传感器、软件等等集合在一起来追踪我们自己的生活状况,人们也可以开发自己的一些设备来达到这些目的。
2015年10月25日

谷歌董事长大胆预言:互联网即将消失,物联网无所不能

总之,我们可以发现物联网概念是在互联网概念的基础上,将其用户端延伸和扩展到任何物品与任何物品之间,进行信息交换和通信的一种网络概念。物联网和物联网概念的关系也是相互依存的关系。
2015年10月11日

十张图看懂未来的大数据世界

大数据蕴藏着丰富的信息和价值,如何处理好大数据并发掘其潜藏的商业价值,这是大数据时代的新挑战。我们将为大家提供与大数据相关的最新技术和资讯。
2015年10月7日

大数据研究常用软件工具与应用场景

为此,本文针对研究人员(非技术人员)的实际情况,介绍当前大数据研究涉及的一些主要工具软件(因为相关软件众多,只介绍常用的),并进一步阐述其应用特点和适合的场景,以便于研究人员能有的放矢的学习和使用。
2015年9月28日

大数据技术Hadoop面试题,看看你能答对多少?答案在后面

添加了一个新的标识符ClusterID用于标识集群中所有的节点。当格式化一个Namenode,需要提供这个标识符或者自动生成。这个ID可以被用来格式化加入集群的其他Namenode。
2015年9月24日

陈根:可穿戴设备或促无线技术走向融合

这让我们看到,随着可穿戴设备的智能化,以及物联网的发展,无线传输技术已经成为了一项核心的连接技术。尽管目前的无线传输技术呈现多样化,也各有所长,但这只是目前的一个发展阶段。
2015年8月26日

中国互联网公司最新最全阵亡名单,涉及16个领域千余企业!附死因和反思!

经过2014年的调整,房产行业告别“黄金时代”,面临一轮新的洗牌,“大鱼吃小鱼”的并购现象成为新常态。用一位从业者的话说:这个行业太拥挤了,有1000个玩家,市场只能容纳100个,900家都得滚蛋。
2015年8月12日

给刚玩Hadoop的朋友一些建议

开发人才目前比较匮乏,基本都集中在互联网,但这个是一个在相对短时间内能解决的事情,随着Hadoop培训的普及和传播。以及Hadoop本身在接口方面的完善,这样的人才会越来越多。
2015年6月30日

大数据的未来:机器人的世界,还是人类的机器世界?

而今我们对数据的处理上,也需要面对“实时数据”和“历史数据”结合的问题。举个例子,如果你在淘宝搜索茶叶,推荐系统应该从历史数据中推荐各式茶叶,还是应该结合当前你的购物车数据,推荐更适合你的偏好品牌?
2014年11月5日

玩转大数据,你可能需要这12种工具

大数据蕴藏着丰富的信息和价值,如何处理好大数据并发掘其潜藏的商业价值,这是大数据时代的新挑战。我们将为大家提供与大数据相关的最新技术和资讯。
2014年10月31日

大数据应用程序最佳选择:是SQL还是NoSQL?

SQL用户和程序员可用跨多个后端系统重复使用其API和UI知识,减少了应用程序的开发时间。标准化还允许声明性第三方提取、转换、加载(ETL)工具,使企业可以在数据库之间以及跨系统传输数据。
2014年3月24日