近日,人工智能领域顶级国际期刊 IEEE Transactions on Pattern Analysis and Machine Intelligence(IEEE TPAMI,影响因子24.314)接收了火山语音团队的最新技术研究成果,即“基于迁移核函数的多源迁移高斯回归模型”(TRANSFER KERNEL LEARNING FOR MULTI-SOURCE TRANSFER GAUSSIAN PROCESS REGRESSION)。 该论文针对目前研究领域关注较少的多源数据迁移回归问题做了创新性基础探究,提出一种基于多源迁移核函数的迁移高斯回归过程模型,并在理论与实验两个层面验证了模型的有效性:即理论上展示了迁移效果优劣与域相关性的必然关联;实验中验证了模型可以高效提升多源数据的迁移效果。
背景介绍
一直以来,高斯过程回归模型(Gaussian process regression model, i.e., GP)作为一类基础的贝叶斯机器学习模型,在工程与统计等领域的回归问题中有着广泛应用,其身影也遍布语音相关领域中,例如基于贝叶斯的语言模型以及基于高斯过程回归模型的多说话人语音合成。 传统的高斯过程回归模型需要大量的有监督数据进行训练才可发挥好的效果,但在具体实践中,收集和标记数据是一项昂贵且费时的工程。相比之下,迁移高斯过程回归模型(Transfer GP)能够高效利用不同领域(domain)的数据来降低标记成本,使多源数据应用更加高效。 基于此,该论文创新提出一种基于多源迁移核函数的迁移高斯回归过程模型,旨在处理多源(Multi-source)情况下的迁移回归问题。主要贡献是提出一种能够有效建模不同领域之间相关性的迁移核函数(transfer kernel),并在一些多源但低资源回归场景下提升迁移效果。更重要的一点,提出的理论对于研究不同领域相关性关于迁移效果的影响,具有重要意义。