查看原文
其他

周志华NSR文章:开放环境机器学习(Open ML)

The following article is from 中国科学杂志社 Author 《国家科学评论》

海归学者发起的公益学术平台

分享信息,整合资源

交流学术,偶尔风月

现有机器学习技术往往依赖于封闭环境假设,即假定学习过程中涉及的诸多要素保持不变。然而,现实学习任务面临的环境是开放的,各种学习要素可能会随时间发生变化。因而,如何使机器学习适应开放环境成为重要的研究问题。


封闭环境机器学习中的典型变量

近期,南京大学周志华教授在《国家科学评论》(National Science Review, NSR)发表题为“Open-environment Machine Learning”的文章,对开放环境机器学习(简称Open ML)的研究内容进行了界定,并对相关进展进行了回顾总结。

具体而言,文章明确了开放环境机器学习面临的四个主要挑战,并分别介绍典型的应对思路。

以森林病虫害预测任务为例:

  1. 1.    标记集合发生变化随着时间推移,可能会有新的病虫类型出现。针对该类问题,典型应对思路包括:先通过异常检测技术对潜在新类别进行识别,再进一步精化将其加入标记集合进行增量学习。
  2. 2.    特征空间发生变化森林部署的数据监测传感器由于寿命有限,研究人员需要在其失效前加装新的传感器以保证有效的监测,这将导致特征空间发生变化。针对该类问题,典型应对思路包括:利用新旧特征共存时的数据学习特征之间映射关系,从而使旧模型在新空间也能发挥作用。
  3. 3.    数据分布发生变化夏季绿叶茂盛,而冬季叶萎雪积,直接利用旧分布上训练出的模型可能无法在新任务上取得良好性能。针对该类问题,典型应对思路包括:利用滑窗或遗忘法降低历史数据在学习目标中的权重,构建多个分类器并采用集成学习等手段缓解分布变化带来的影响。
  4. 4.    学习目标发生变化随着收集数据的增多以及模型准确率的提高,学习目标可能由追求更高的准确率变更为追求更低的耗电量。针对该类问题,典型应对思路包括:考察不同学习目标之间的相关性,将旧模型输出作为基础,复用相应模型以优化新的学习目标,实现学习目标的快速切换。
文章还对建立开放环境机器学习理论进行了探讨并给出了初步框架。

作者认为,亟需研究能够适应开放环境的机器学习理论与方法,这将为提升和保障人工智能系统的稳健性提供关键技术支撑。


点击“阅读原文”阅读原文。

扩展阅读

 【合成氨】铀配合物对氮气的裂解及氢化反应 | NSR
环形二价功能核酸的通用型构建策略
区块链共识:最新进展 | NSR
一种全植入式脑机接口的临床应用进展 | 清华李路明团队NSR
本文系网易新闻·网易号“各有态度”特色内容
媒体转载联系授权请看下方

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存