scheduled sampling翻译成“计划采样”, 用于解决exposure bias问题。传统的神经网络训练时和预测时的输入不一样,当在某一步做出一个错误选择后,后面可能会产生累积错误。论文原文:Scheduled Sampling for Sequence Prediction with Recurrent Neural Networkshttps://proceedings.neurips.cc/paper/2015/file/e995f98d56967d946471af29d7bf99f1-Paper.pdf
5、Self-critical sequence training
针对图像描述(Image Caption)的问题。论文原文:Self-critical Sequence Training for Image Captioninghttps://arxiv.org/abs/1612.00563
6、seq2seq中的beam search算法
Beam Search算法是以较少的代价在相对受限的搜索空间中找出其最优解,得出的解接近于整个搜索空间中的最优解。Beam Search算法一般分为两部分:路径搜索:是指在受限空间中检索出所有路径。路径打分:是指对某一条路径进行评估打分。论文原文:Sequence-to-Sequence Learning as Beam-Search Optimization.https://arxiv.org/abs/1606.02960
7、Coverage 机制
解决seq2seq模型生成句子中经常有重复片段的现象。论文原文:Get To The Point: Summarization with Pointer-Generator Networkshttps://arxiv.org/pdf/1704.04368.pdf注:如果上面的论文链接不能打开,可以Google学术搜索论文。认为文章有价值的同学,欢迎关注我的专栏,跟踪搜索引擎、推荐系统等机器学习领域前沿。https://zhuanlan.zhihu.com/c_1218177030141050880参考文献:https://easyai.tech/ai-definition/encoder-decoder-seq2seq/https://blog.csdn.net/appleml/article/details/87929579https://blog.csdn.net/thormas1996/article/details/81536977https://zhuanlan.zhihu.com/p/47929039