其他

Google 开源 seq2seq,通用编码器&解码器框架

2017-03-16 技术最前线

(点击上方蓝字,快速关注我们)


转自:开源中国,

https://www.oschina.net/news/82926/google-open-source-seq2seq


谷歌又开源了,这次是开源了一款用于 TensorFlow 的通用编码器&解码器框架(encoder-decoder framework),可用于机器翻译、文本摘要、会话建模、图像描述等。



设计目标/特性


  • 通用性:Google 最初为机器翻译开发了这个框架,但是后来用于各种其他任务,包括摘要、会话建模和图像描述。只要你的问题可以以一种格式编码输入数据,并解码为另一种格式,你应该能够使用或扩展这个框架。

  • 可用性:你可以使用单行命令训练模型。支持多种类型的输入数据,包括标准的原始文本。

  • 再现性:使用 YAML 文件配置训练流程和模型。这也允许其他人运行和你完全相同的模型配置。

  • 可扩展性:代码以模块化的方式构建,并且易于拓展。例如,添加新类型的注意机制或编码器架构仅需要最少量的代码即可修改。

  • 文档:所有代码都使用标准的 Python docstrings 记录,有书面指南帮助开始执行常见任务。

  • 良好的性能:为了使代码足够简洁,没有试图榨干所有性能,但是实现速度已足以涵盖几乎所有的生产和研究用例。tf-seq2seq 还支持分布式训练,从而折中计算能力和训练时间。


觉得这条资讯有帮助?请转发给更多人

关注 技术最前线 看 IT 要闻

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存