沙龙干货 | 智能写稿技术在58部落内容社区的应用实践
The following article is from 58技术 Author 李忠
智能写稿机器人是指利用NLP相关技术自动化进行稿件文章创作,目前已广泛应用在如体育赛事报道、财经信息发布、天气预报、商品属性介绍等,相比人工创作,机器写稿具有低成本、高效率的特点, 从而解决传统写作成本高、速度慢、数量少的问题。
58同城技术委员会与携程技术沙龙、DataFunTalk、腾讯云于2020.10.27-2020.11.17日期间联合举办了一系列有关"大数据与AI技术实践相关专场"的分享。其中58同城AI Lab算法高级架构师李忠于2020年11月17日19点在线上参与分享了《智能写稿技术在58部落内容社区的应用实践》。
然后介绍了机器写稿目前两种主流方式: 一种基于结构化数据+模板的创作方式,另外一种是针对已有数据内容通过文本生成、文本聚合、自动抽取等NLP技术进行的二次创作方式。
最后详细介绍了智能写稿在58部落内容社区的应用实践。58同城是一个信息分发的平台存在海量的有关招聘、房产、车等相关的结构化信息数据, 这些海量素材为机器写稿创作提供了数据可能。
分享中详细介绍了58智能写稿如何利用这些海量的结构化信息数据自动化生成介绍车辆、房产、招聘等信息,机器写稿文章相比原始通过机械式的展示车辆、房产、招聘等帖子的基本信息属性外,更可带有叙事性、情感化的介绍相关帖子信息,让阅读者更容易接受。
同时在58部落内容社区内有大量的用户分享创作,为了激化用户参与度、丰富部落社区话题多样性,58智能写稿还针对用户的动态感想、评论数据上做了二次加工聚合,如通过把用户关于职位感想、企业评论、面试经历进行分类聚合,让用户能够更加直观地了解某个职业、某个企业在用户群体中口碑与评价。
分享录像回放:
AI Lab 招聘信息欢迎关注开源项目 qa_matchqa_match是58同城开源的一款基于深度学习的问答匹配工具,支持一层和两层结构知识库问答。qa_match通过意图匹配模型支持一层结构知识库问答,通过融合领域分类模型和意图匹配模型的结果支持两层结构知识库问答。qa_match同时支持无监督预训练功能,通过轻量级预训练语言模型(SPTM,Simple Pre-trained Model)可以提升基于知识库问答等下游任务的效果。
github地址:https://github.com/wuba/qa_match
文章介绍:
欢迎关注部门微信公众号:58AILab
欢迎在欣秀(https://app.ic3i.com)平台上加入"58同城AILab技术沙龙"圈子,一起交流技术,可以扫描以下二维码加入该圈子。