Suits and Hoodies

其他

写在 LLaMA 2 发布的边上

年前一样发生过,闭源的优秀的框架,例如百度和谷歌的自研框架,被一群由研究生开源的粗糙的开源框架所打败。后面大厂吸取教训,在框架领域持续开源,打造自己名声的同时推动了整个业界的发展。(2)
2023年7月19日
其他

看百度文心一言实力,再聊ChatGPT触类旁通的学习能力如何而来?【转载】

图文原创:亲爱的数据美国大模型水平领先,国内大模型蓄势而发。国内大模型参与者众多,百度文心一言第一个有勇气站出来发布。此处应有掌声。事前事后,中国网友的呐喊声不绝于耳:“文心一言到底什么水平啊?”其实网友更想知道:国内AI大模型到底什么水平。因为国内目前只发布了一个AI大模型,所以在打造知名度上,百度领先。同时,据“亲爱的数据”获得的信息,2023年3月底还会有一个国产AI大模型发布。但是,未获许可,不能公开。有竞争是好事,内卷式消耗才是坏事。社会各界人士的花式问答固然有趣,“亲爱的数据”还是选择了一位AI大佬设计的“蜜熊测试”。《蜜熊测试:5分钟感受大模型“实力指数”》(可点击跳转阅读)对,没看错,“蜜熊”就是蜂蜜和熊。理解它几乎没有任何难度,可以说这是个零门槛游戏。我们从“蜜熊测试”游戏中找几个难题。问:一头熊一天吃14罐蜂蜜,请问它一年吃多少罐蜂蜜?文心一言:14×365=5110
2023年3月21日
其他

蜜熊测试:5分钟感受大模型“实力指数”

各种大模型方兴未艾,测试的方式也千奇百怪,于是我们开始探讨这样一个问题:怎么样判断一个大模型的质量,至少直观地知道它“是不是还可以”,限时五分钟?基于这个想法,我们设计了八个关于熊和蜂蜜的问题,我们称作“蜜熊测试”。题目非常简单,不过覆盖了数学、生活常识、逻辑、互联网梗、电商等几个领域:1.
2023年3月20日