查看原文
其他

比Whisper快6倍,体积小50%的语音识别模型:Distil-Whisper

ai 梭哈AI
2024-11-27

Distil-Whisper:比Whisper快6倍,体积小50%的语音识别模型。它在Whisper核心功能的基础上进行了优化和简化,速度提高了6倍。主要优点包括速度、尺寸、准确性、抗噪声、减少幻听和推测性解码。该模型使用了伪标签方法和知识蒸馏,参数减少了51%。实验结果显示,Distil-Whisper在处理速度和准确性方面都有显著提升。评论中的一些关键亮点包括该模型适用于移动设备、对长音频的处理效果更好以及与Whisper模型的兼容性。

评论中的一些亮点包括:1)Distil-Whisper是否能与fast-whisper相媲美;2)期待该模型可以部署在移动设备上;3)该模型支持几种语言;4)Distil-Whisper在处理长音频时表现更好;5)Distil-Whisper可以作为Whisper模型的替代品使用。

git:

https://github.com/huggingface/distil-whisper

论文:

https://arxiv.org/abs/2311.00430

继续滑动看下一个
梭哈AI
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存