首先再次框定本文研究范围—能源经济和金融领域与能源工程领域的边界并不明晰,而本文的主要研究对象是广义的能源经济学/金融学应用。所谓“广义”即定义为涉及有关类型的市场变量(如价格、投资和消费者最佳行为以及公共政策)的问题。然后说明用来识别文献双重检索办法(double checking)的方法:1、识别期刊:找到可能发表ML技术在能源领域应用的刊物,具体方法是在一些文献索引【SCImago Journal Rank (SJR), Science Citation Index Expanded (SCIE), Social Sciences Citation Index (SSCI), and Arts & Humanities Citation Index (A&HCI)】中寻找能源相关和经济相关的期刊。2、找关键词:利用下表中的关键词库进行搜索
指出没有包括的文献及理由:本研究不包含三种专门的电器工程期刊【IEEE Transactions on Power Systems, Electric Power Systems Research, and International Journal of Electrical Power & Energy Systems】,因为其他关于电力市场预测的调查对这类论文提供了更深入、专业的分析。 指出可能遗漏的问题及原因:1、可能忽略了在主流经济学期刊之外刊物上发表的论文,所以统计出的结果可能偏低。但是由于本文的目标是对相关论文的内容和方法进行深入的阐述和总结,而非单纯的统计分析,因此这一问题并不严重。2、还可能会漏掉一些ML在能源行业的应用进展,例如一些专有技术,因为这些都是不可公开获取的,这也导致了对该领域前沿水平一定程度上的低估。
3、其他能源商品价格预测包括柴火 (Koutroumanidis et al., 2009), 天然气(Nguyen and Nabney, 2010; ˇCeperi´c et al., 2017)和碳价(Fan et al., 2015; Zhu et al., 2017; Sun et al., 2016; Zhu et al., 2018)。二、预测建模能源的消耗或供求为了进行短期和长期的规划,了解未来的能源需求和消耗水平是至关重要的。能源消耗预测通常使用滞后的消耗值和一组外生的社会经济和技术变量,如人均GDP、人口和技术趋势等。和之前的价格预测相比,消耗预测的一个关键特点是不受市场效率动态的影响。1、长期预测ML模型目前已经被应用于对总能源需求和各部门能源需求的长期预测。但是挑战在于,此类应用中的观测值往往较少,削弱了ML方法的固有优势。一些文献运用神经网络模型预测国家层面能源的消耗:
Sözen and Arcaklioglu (2007) and Sözen et al. (2007)使用人工神经网络预测土耳其的各部门能源消耗和温室气体排放
Geem and Roper (2009)用人工神经网络估计韩国的能源需求
Liu et al. (2016)将灰色预测方法与BP神经网络模型相结合,对西班牙经济部门的能源消耗进行预测
2、电力需求预测电力需求预测是能源经济学中的传统研究领域之一,该研究方向有关论文的整体结构和组成大部分比较相近,即使用传统的时间序列模型,SVM,人工神经网络,以及最近的前馈和反馈多层模型,GAs和PSO也经常被使用.3、智能电网负荷预测与国家层面的预测相比,ML更适合这种短期电力的需求预测,因为它设计对大量潜在输入变量的高频观测,ML能够充分发挥它的优势.有一些利用ML来研究电力负荷预测的文献,例如Liu et al. (2014), Coelho et al. (2016), Bassamzadeh和 Ghanem (2017), Mohan et al. (2018), Anderson et al. (2011) and Li et al. (2018b).还有一个相关的研究方向是对电网故障概率的预测,Rudin等人(2012)提出了一种基于电网组件故障可能性的排序算法.4、天然气需求预测作者列举了一些预测天然需求的论文:Azadeh et al. (2010), Szoplik (2015), 和Panapakidis和 Dagoumas (2017),并详细讲解了一些论文的研究内容:
6、煤炭需求预测利用ML技术进行煤炭消耗量预测的文献较少,如Yun-cai (2003), Xuemian and Guohao (2008), and Yang et al. (2014).Jia等(2007)采用多输入单输出支持向量机模型对1980-2002年中国煤炭需求进行预测.三、其他应用1、模型校准
5、数据处理在许多应用程序中,数据的完整性和质量在整个过程中很重要,数据缺失会带来各种各样的问题.而ML是一个识别离群值、推测缺失数据的强大工具,并可以缓解与不完整数据相关的潜在问题(Abdella and Marwala, 2005; Nelwamondo et al., 2007).Li等(2017)在大数据驱动的模型中采用人工智能算法对油价趋势进行了预测.Zhang等(2018)应用支持向量机、AdaBoost等机器学习方法对数据进行挖掘和分析,结论表明机器学习方法能够有效的解决能耗数据缺失的问题.四、不同的机器学习技术比较1、支持向量机:
从表中(表中数据为两两之间的p值)可以看出,SDAE-Bagging模型与其他模型之间的p值均小于0.1,且根据赵的原文可知,该模型的DA最高,MAPE和RMSE最低,表明预测精度优于其他模型。 二、可处理不同种类和大量的输入项机器学习模型对变量的格式要求极低。在处理大量以及多维数据时,不需人工降维与考虑共线性问题,可以自动选择用于预测目的的正确因素,深度学习模型更是如此。同时,定量和定性数据可以同时出现,这一优点对能源部门极为重要。三、具有发现复杂关系的能力机器学习模型会找到输入和输出数据之间可能存在的关系结构。对于传统模型,贝叶斯平均模型(BMA)允许运行一系列模型,但需要提前制定每个模型的结构,但机器学习模型则会自动找到更高维、更复杂,以及非线性的关系。四、对数据质量的敏感性较低对于传统的计量经济学模型来说,观测数据的缺失现象不可避免,而机器学习模型中,已开发了模糊模型与GNN模型等对数据质量要求较低的模型。Alobaidi et al.(2018)基于此类集成模型提供了对于低质量数据性能提升的简介。五、对数据的预处理要求低时间序列数据通常需要进行数据预处理,这耗费了大量的时间。但由于机器学习模型可以将这些特征视为数据的附加特征,不需要对数据进行大量的预处理,机器学习模型会自动发掘使性能提高的特性,并呈现到结果中。与此同时,若是需要对数据进行转换(例如将绝对数变为增长率),主动的预处理对提高性能也是可行的,即数据预处理并不是必要的。六、可灵活运用于回归、分类或排名领域机器学习模型中,监督类算法可运用于回归、分类或排序领域,根据研究问题的不同,可自由改变输出项,例如:可将预测问题转化为分类问题,以简化计算。七、局限性与挑战:1、性能问题预测的精度会根据基础变量的不同差距较大,当基础变量为高效市场中的交易资产,预测的准确性就会受到挑战,因为市场价格的结构已经非常接近模型所能预测的价格(Ceperic et al. (2017))。2、过拟合问题任何预测方法都有过拟合的风险,机器学习也不例外。比如当拟合模型中包含样本噪声,尝试进行数据预测时会达到很高的精度。处理的方法常使用交叉验证,以计算测试误差,在这种情况下,测试误差近似于底层分布的真实测试误差。而随机森林等算法已包含了交叉验证的过程。3、泛化能力问题机器学习算法的一个主要目的是最小化可计算的经验风险,来最小化不可计算的预期风险,从而获得较低的泛化差距,但泛华差距成为了制约许多机器学习模型应用的瓶颈(如前馈神经网络)。正则化对泛华误差起到修正作用,包括隐式和显式两类,它们都对网络的有效容量起到控制作用:其中隐式正则化利用网络结构、学习算法或数据的特点来控制有效容量(如随机梯度下降,卷积层,批量归一化);显式正则化则与隐式相反,不是网络结构、算法或数据的结构部分,很容易添加或删除(如权重衰减、dropout算法、数据增强与随机深度)。4、自然黑箱问题以ANN和SVM为代表的机器学习算法,被认为是黑箱型算法。与更透明的线性回归模型相比,很难对结果进行解释。但也有一些算法提供了对每个特征影响的识别,并识别了特征之间的线性和非线性能力,典型例子为决策树。建模师需解决的主要问题是,重心放在预测还是解释,这需要对于特定场景灵活选择。5、对大量数据的要求宏观经济领域由于数据量较少(常为50-100),无法使用机器学习模型。Dietterich(2000)认为可以使用集成学习方法弥补,Moshiri和Cameron(2000)等学者认为可以使用经济理论指导变量选择。6、缺乏统计检验由于机器学习不再关注计量经济学中的回归系数,而是关注预测结果的精度,缺乏对自变量的检验,近年学者正在尝试开发。7、对稳健性的评估由于机器学习算法的非线性和动态性,常常稳健性较差。因此在使用机器学习算法进行建模时,常将数据集分成训练集与测试集,检验其稳健性。8、专注于市场价格的预测由于机器学习算法的推行会影响人们的行为,故具有外部性,例如当用于预测交易资产价格时,会立即影响人们的决策,进而影响价格。因此,一个机器学习算法的成功会对下一个算法造成阻碍,其推行是有限制的。