新书上市 | 以过去预测未来,有趣的时间序列
以前,预知未来仿佛是人们崇拜的玄学,现在数据分析做到了。随着数据的多样化、统计学的飞速发展,以及机器学习的应用,我们可以获得的数据越来越丰富,通过分析数据所得出的结论变得越来越有价值。
这两年,与我们生活有密切联系的时间序列数据总被提及。它是什么呢?百度百科的定义是:“时间序列数据是同一统一指标按时间顺序记录的数据列。”你可能觉得有些晦涩难懂,加个场景给大家解释一下,比如天气预报中的天气数据、经济政策影响下的股票数据、医学诊断所依据的心跳数据等,这些我们身边的事物,时时刻刻都会产生按照时间时间顺序排列的数据,这些数据,就是时间序列数据。
我们从按照时间顺序排列的数据点中提取出有意义的模式和统计信息就是时间序列分析。这样做既是为了审视历史,也是为了预测未来。时间序列分析通常是为了回答一个因果问题:过去如何影响未来?
本书内容
《时间序列分析实战:基于机器学习和统计学》通过介绍时间序列分析的实用技巧,如何通过结合机器学习方法和传统的统计方法来分析各类时间序列数据,并为大家提供了通过使用Python语言进行分析的示例和R语言分析的示例。本书共有 17 章,首先概览时间序列分析的历史,然后介绍数据的获取、清洗、模拟和存储手段及方法,接着关注可用于时间序列分析的建模技术,最后带领大家共同探讨时间序列分析在几个常见领域中的应用。可以让数据分析师、数据工程师和其他与数据打交道的读者快速上手。时间序列在我们目前的生活当中无处不在,它也是数据分析的重要研究对象。
本书特色
这本书是不错的资源。每个数据科学家都会在某个时刻开始处理时间序列或其他类型的函数型数据。这本书介绍了机器学习和时间序列分析,并提供了精心设计的示例。
——Andreas W. Kempa-Liehr博士
奥克兰大学工程科学系讲师
本书适合人群
在本书出版之前,我们有对作者艾琳·尼尔森(Aileen Nielsen)进行采访,作者指出这本书非常适合以下两类人进行学习:
第一类是那些很少研究时间序列数据的数据科学家。这类人可能是行业资深人员或初级分析师。资深的数据分析师可以略过每章的概念介绍部分,但仍将受益于每章关于最佳实践和错误应对的讨论。作者试图让每章都保持独立完整,但仍然建议初级数据分析师通读全书。
第二类是在企业和组织内部广泛收集数据,并负责监督和分析这些数据的人。你需要拥有一定的技术背景,但不一定是专业的程序员。本书有助于指出你在企业中应用时间序列分析的机会,即使当前并没有使用时间序列分析也没有关系。同时,本书将指导你使用现有的数据资源来解决企业遇到的新问题。
温馨提示
虽然作者在文中对每一种所使用的技术,都进行了相关的概述,但是如果作为初学者还是需要在继续阅读相关章节之前,对所使用的技术进行更加深入的了解学习。同时作者也为大家提供了相关技术的免费在线资源或者教程的更多信息。
关于统计学和机器学习,你应该熟悉以下内容:
统计学基础:方差、相关性和概率分布等概念。
机器学习:聚类与决策树。
神经网络:何谓神经网络,以及如何训练神经网络。
新书上市,限时折扣