其他
【强基固本】如何通俗的理解beam search?
“强基固本,行稳致远”,科学研究离不开理论基础,人工智能学科更是需要数学、物理、神经科学等基础学科提供有力支撑,为了紧扣时代脉搏,我们推出“强基固本”专栏,讲解AI领域的基础知识,为你的科研学习提供助力,夯实理论基础,提升原始创新能力,敬请关注。
地址:https://zhuanlan.zhihu.com/p/82829880
假设一个搜索任务
中文输入:"我" "恨" "你"
英文输出:"I" "H" "U"
exhaustive search(穷举搜索)
I-I-I
I-I-H
I-I-U
I-H-I
I-H-H
I-H-U
I-U-I
I-U-H
I-U-U
H-I-I
H-I-H
H-I-U
H-H-I
H-H-H
H-H-U
H-U-I
H-U-H
H-U-U
U-I-I
U-I-H
U-I-U
U-H-I
U-H-H
U-H-U
U-U-I
U-U-H
U-U-U
greedy search(贪心搜索)
第1个时间步长:首先翻译"我",发现候选"I"的条件概率最大为0.6,所以第一个步长直接翻译成了"I"。 第2个时间步长:翻译"我恨",发现II概率0.2,IH概率0.7,IU概率0.1,所以选择IH作为当前步长最优翻译结果。 第3个时间步长:翻译"我恨你",发现IHI概率0.05,IHH概率0.05,IHU概率0.9,所以选择IHU作为最终的翻译结果。
beam search(束搜索)
第一个时间步长:如下图所示,I和H的概率是top2,所以第一个时间步长的输出的候选是I和H,将I和H加入到候选输出序列中。
第2个时间步长:如下图所示,以I开头有三种候选{II, IH, IU},以H开头有三种候选{HI, HH, HU}。从这6个候选中挑出条件概率最大的2个,即IH和HI,作为候选输出序列。
第3个时间步长:同理,以IH开头有三种候选{IHI, IHH, IHU},以HI开头有三种候选{HII, HIH, HIU}。从这6个候选中挑出条件概率最大的2个,即IHH和HIU,作为候选输出序列。因为3个步长就结束了,直接从IHH和IHU中挑选出最优值IHU作为最终的输出序列。
beam search不保证全局最优,但是比greedy search搜索空间更大,一般结果比greedy search要好。 greedy search 可以看做是 beam size = 1时的 beam search。
“强基固本”历史文章
浅谈扩散模型的有分类器引导和无分类器引导
Jeff Dean:机器学习在硬件设计中的潜力
Softmax 函数和它的误解
关于神经网络,一个学术界搞错了很多年的问题
学习=拟合?深度学习和经典统计学是一回事吗?
信号与系统——卷积
机器学习回归模型相关重要知识点总结!
纯工程经验:谈谈目标检测中正负样本的问题
数字图像处理基本知识
关于机器学习这门炼丹术,理论基础到底有多可靠?
数据统计分析的16个基础概念
机器学习理论基础炼丹总结
超全725个机器学习术语表
OpenCV高性能计算基础介绍
更多强基固本专栏文章,
请点击文章底部“阅读原文”查看
分享、点赞、在看,给个三连击呗!