如果你手里有一把锤子，你看什么都像是钉子：隐狄利克雷模型是个啥？

查看原文

其他

如果你手里有一把锤子，你看什么都像是钉子：隐狄利克雷模型是个啥？

原创 2017-11-19 文摘菌 大数据文摘

大数据文摘字幕组作品

YouTube网红小哥Siraj Raval的趣味小视频系列The Math of Intelligence又来啦！这期我们来讲一讲机器学习里的生成式模型。

上面这位萌萌哒（？）的男子

就是数学家狄利克雷

他的全名非常长长长长

Johann Peter Gustav Lejeune Dirichlet

这种读不出来的名字一看就是德国人

今天我们就来讲讲

一种最常见的生成式模型

隐狄利克雷模型

到底是个啥

先说生成式模型

（Generative Model）

它的对立面是判别式模型

（Discriminative Model）

判别式模型告诉我们已有的数据是什么

生成式模型则可以生成新的数据

怎么样

是不是超酷！

生成的数据呢

就是下面这样的

▼

图：Ian Goodfellow的论文里，GAN生成模型生成的动物图片

LOL WTF

哈哈哈哈哈

或者是下面这样的

▼

图：大数据文摘文章《根本停不下来！给它一个轮廓，TensorFlow还你一只完整的喵》（点击阅读）

隐狄利克雷

Latent Dirichlet Allocation (LDA)

就是一个生成式模型

它的名字来自狄利克雷分布

就长这样

▼

这个模型还是由

吴恩达

最早推广的！！！

它的用途是

给一段话生成一个主题

它先看每个词可能属于什么主题

比如

“小猫很可爱”这句话

“小猫”和“可爱”

可能都是关于动物的

那么这句话的主题就是动物

模型里的“隐”字代表

通过“推断”

而不是直接观察得到的变量

因为我们只能观察到词语

而模型生成的主题是由推断得出的

好了不能再剧透更多了

更生动详细的解释

请大家观看视频

时长9分钟

有中文字幕哦

▼

https://v.qq.com/txp/iframe/player.html?vid=u05069gzbqq&width=500&height=375&auto=0

如果你有一把锤子

那么在你看来

无论什么看起来都像钉子

如果你有一篇文章

那么你就想提炼它的主题

没有主题？

那就用算法生成一个

这就是

隐·狄利克雷·模型

最后来讲一个笑话——

青年问禅师：“我觉得我在这个世界上是多余的，没有人需要我。”

禅师说：“就像你所学的数学，无论怎样复杂艰深的函数，都有适合的图形对应。你只是还没找到那个图形而已。”

青年沉思一番，提笔写下了狄利克雷函数的解析式。

via知乎@朱子帅

（文摘菌备注：狄利克雷函数图像无法画出）

再送你一个Yann LeCun的凝视——

图：Yann LeCun是Facebook人工智能研究部门负责人，也是纽约大学教授，他被称为卷积神经网络之父。

原视频来自YouTube - The Math of Intelligence (8)，作者Siraj Raval，大数据文摘已取得翻译授权。

本期工作人员

翻译：Zach Tian、Melody

校对：数据酱、龙牧雪

时间轴：Zach Tian、龙牧雪

项目管理：大力

后期+文案+统筹：龙牧雪

课程推荐

数据科学实训营第4期

报名优惠倒计时第2天！

如果，你正在求职、跳槽、研究，需快速提升实战技能

如果，你渴望大展身手，搏一席之地

如果，你想在数据时代掌握主动权

那么，你需要实训营助你一臂之力！

扫描海报二维码，获取成长机会！

志愿者介绍

回复“志愿者”加入我们

往期精彩文章

点击图片阅读

学会了玩街霸Ⅱ的AI，你怕不怕？

反向激励，在加速这个社会的黑化

呼伦贝尔跨省抓捕，我弟弟指居期间死亡，泣求自治区调查真相

把抄袭说的如此冠冕堂皇，雷军让年轻人丢掉了耻辱感

2024【公共营养师】报名通道已开启，不限学历，23岁及以上可报!还能领2000补贴

Wealth | 中国成本轮金价涨势的前沿和中心