58AILab

其他

58同城AI Lab产品能力介绍

Lab隶属于TEG技术工程平台群,成立于2018年5月21日,旨在推动AI技术在58同城的落地,打造AI中台能力,以提高前台业务人效、收入和用户体验。AI
2021年11月18日
其他

人物|韩伟:黄页商家智能聊天助手用户体验深度优化

2021年9月10日-9月13日,2021世界机器人大会在北京举行,本届大会以“共享新成果,共注新动能”为主题,全面展示机器人领域新技术、新产品、新模式、新业态,围绕机器人研究、应用领域及人工智能的创新发展开展高水平交流活动。本届大会包括论坛、博览会、机器人大赛等活动,论坛由3天主论坛、20余场专题论坛组成。大会邀请了300余位国内外顶尖科学家、国际组织代表、企业家代表等共同参会,围绕科技前沿、技术创新与突破、新兴产业应用等巅峰论道,机器人的新发展、新风向、新机遇、新应用和新融合,专题论坛聚焦“专精特新”,钻研细分领域,凝聚行业巅峰。58同城TEG
2021年11月16日
其他

PPT+视频回放 | 58同城&天津大学:AI集群资源调度和应用混部技术沙龙

导读近年来,人工智能技术的快速发展对高效率智能计算系统的需求越来越大。在58同城平台内部,越来越多的服务使用深度学习模型和技术来驱动,这些工作负责具有一些典型的特性:例如在线推理服务请求的“高峰低谷”现象,导致部分时段系统资源利用率偏低;离线训练集群则存在部门之间资源争抢、分配不公等问题,导致GPU集群吞吐量下降。购置和维护GPU加速器设置带来了昂贵的开销,如何改善AI计算平台的资源使用效率成为了亟需解决的问题。2021年11月3号,18:00~21:00,由58同城和天津大学主办的58技术沙龙《AI集群资源调度和应用混部》正式与大家见面了!本次沙龙由58同城AI
2021年11月10日
其他

人物|李忠:AI面试机器人打造智能化招聘

2021年7月30日-7月31日,第七届全球互联网架构大会在深圳如期举行。全球互联网架构大会(简称“GIAC”)是长期关注互联网技术与架构的高可用架构技术社区和msup推出的面向架构师、技术负责人及高端技术从业人员的年度技术架构大会,是中国地区规模最大的技术会议之一。第七届GIAC会议,共涉及24个专题,84个议题,参与人数达1000多人,组委会从互联网架构热门的前沿趋势、云原生、智能数据、爆款架构演进、卓越工程实践等领域甄选前沿的有典型代表的技术创新及研发实践的架构案例,分享他们在本年度值得的总结、盘点的实践启示,打造一个分享及讨论平台,帮助和指导听众了解和改进互联网构建方式。58同城TEG
2021年11月4日
其他

专访58同城詹坤林:“灵犀”智能语音语义平台助力58同城产业化

10月10日,2021大数据科技传播与应用高峰论坛暨“科创中国”试点城市推进式在湖南衡阳召开,论坛上揭晓了“大数据科技传播奖”,其中,来自58同城AI
2021年10月12日
其他

58同城自研智能语音语义平台“灵犀”获2021大数据科技传播奖

中国科技新闻网10月10日讯(杨晶佳)10月10日,2021大数据科技传播与应用高峰论坛暨“科创中国”试点城市推进式在湖南衡阳召开,论坛上发布了“大数据科技传播奖”获奖名单,其中,58同城AI
2021年10月10日
其他

沙龙干货 | NER技术在对话系统中的应用实践

36:(视频回放)导读在58同城C端用户和B端商家IM微聊在线沟通场景下,我们应用对话机器人打造了商家智能聊天助手,对话机器人通过与C端用户沟通获取商机反馈给B端商家。在人机对话过程中我们需要识别出电话、地址、时间、服务对象等商机信息。本次议题将重点分享对话场景下的NER技术实践,首先介绍模型选型,然后介绍数据增强、模型融合、对话上下文引入等调优经验。嘉宾介绍:桑海龙,58同城AI
2021年8月19日
其他

58同城AI Lab招聘产品经理、开发工程师

Lab旨在推动AI技术在58同城的落地,打造AI中台能力,以提高前台业务人效、收入和用户体验。部门介绍,具体见:58同城AI
2021年8月16日
其他

58同城AI Lab部门介绍

Model的原理和实践基于HMM-GMM的语音识别算法介绍AI算法平台AI正在驱动行业变革,为加速58同城AI应用的落地,我们自2017年10月开始构建了一套通用的AI算法平台(WPAI,Wuba
2021年8月16日
其他

人物|王焱:58同城流式语音识别引擎应用实践

5月20日-5月22日,第十三届中国系统架构师大会(SACC2021)在云端以网络直播的形式成功举行。会议的主题为“数字转型、架构重塑”,聚焦业务架构演进、分布式存储、音视频技术、云技术、信息安全等多个领域,云集了国内CTO、研发总监、高级系统架构师、开发工程师和IT经理等技术人群共同参与。58同城AI
2021年7月22日
其他

WPAI支持58同城第2届AI算法大赛

58同城第2届AI算法大赛于2021年7月9日启动竞赛报名,比赛提供一批58招聘实际推荐场景中的数据,参赛者可以基于用户的历史行为数据,利用机器学习算法预测出用户对于不同职位的浏览和投递概率,比赛以浏览、投递预测结果的加权AUC值进行评分,详细介绍可参考文章《58同城AI算法大赛开始报名,欢迎参赛》。本次比赛,我们开放了58同城AI算法平台WPAI,提供一批GPU计算资源供参赛者使用,参赛者可以在平台上完成模型的训练和评测。58同城AI算法平台WPAIWPAI(Wuba
2021年7月20日
其他

语音机器人中应用端到端模型控制对话跳转

29:5636:(视频回放)导读语音机器人即利用语音识别、语义理解和语音合成技术赋予机器多轮对话交互能力,使机器能模拟真人与用户对话,它可以代替或辅助人工来完成一些例程化工作,被广泛应用于产品营销、服务通知、用户调查等多种场景。本文将首先介绍58语音机器人的总体架构,然后介绍基于规则、文本匹配的对话跳转策略,最后介绍一种基于端到端模型的对话跳转策略,并比较不同方法的线上实际效果。嘉宾介绍:宋玉美,58同城AI
2021年7月15日
其他

58同城AI算法大赛开放报名,欢迎参赛

招聘是58同城的核心业务之一,企业可以在58平台上发布职位,用户可以在平台上浏览职位,浏览完后若对该职位有求职意向可以进一步投递自己的简历,企业收到求职者的简历后便可开展后续招聘流程,如简历审核、发起面试等。在58招聘推荐系统中,如何提高用户对职位的点击(浏览)率和转化(投递)率至关重要。本次比赛,我们提供了一批58招聘实际推荐场景中的数据,参赛者可以基于用户的历史行为数据,利用机器学习算法预测出用户对于不同职位的浏览和投递概率。本次比赛以浏览、投递预测结果的加权AUC值进行评分。本次比赛,我们开放了58同城AI算法平台,提供一批GPU计算资源供参赛者使用,参赛者可以在平台上完成模型的训练和评测。本次比赛由58同城技术委员会举办,欢迎大家报名参加。大赛海报报名指引01进入“58技术”官网PC端浏览器打开58技术网站
2021年7月10日
自由知乎 自由微博
其他

直播预告 | 58同城&来也科技NLP技术沙龙

Lab算法高级工程师,2019年10月加入58同城,目前主要负责智能客服算法研发工作。2017年硕士毕业于哈尔滨工业大学,曾就职于猎豹移动,从事多轮对话算法研发。2.
2021年6月21日
其他

智能问答机器人问答引擎架构实践

智能问答流量详情动态策略调整在实际业务场景中,统一的问答策略虽然能满足业务需求,但整体服务耦合度高,灵活性较差,导致整体效率偏低。在很多场景下,QABot都会执行很多个性化的操作。图12
2021年6月9日
其他

人物 | 詹坤林:AI技术助力CRM系统智能化

,这里核心是建模用户兴趣和内容,以优化点击率、转化率。在CRM系统中,商机组销售人员拿到一个商机列表后需要拨打跟进所有商机,用户接通后与其沟通,形成有效转出商机,销售人员的行为路径是
2021年6月8日
其他

沙龙回顾 | 58同城智能问答算法实践

58同城智能问答算法实践沙龙直播背景介绍:我们自2017年开始研发58智能客服系统(代号帮帮),提供自动问答机器人、人工IM在线沟通和智能辅助聊天整套解决方案,已被广泛应用于58同城各业务客服团队和用户沟通场景,大大节省了客服人力。2019年,我们将智能客服应用于58平台C端用户和B端商家在线沟通场景,打造智能客服商家版(帮帮商家版)平台,为B端商家提供智能聊天助手,提高了商家获客效率。近期我们举办了一场技术沙龙,
2021年6月7日
其他

星火在CRM商机智能分配场景的应用实践

导读为了更好地支持销售人员获取商机,CRM系统提供了商销匹配、未覆盖分配、一键申领、新增商机分配、刷新商机分配等多种功能。AI侧使用个性化推荐算法、个性化搜索排序算法,通过直接提高成单链路中间环节的关键指标的方式,来提高最终的成单转化率。CRM商机智能分配简介CRM商机智能分配就是要在海量的历史商机中,给销售人员提供更优质的、更匹配的商机,从而提高成单转化率。相关商机分配详细逻辑请参见文章
2021年6月3日
其他

58同城 TEG AI Lab 成立三周年纪念

平台全集团广泛使用,GPU卡规模超过200张,CPU节点超过100台,并上线向量检索平台
2021年5月22日
其他

58同城向量检索平台架构实践

导读向量检索在很多AI场景都会应用到,例如:在推荐系统中,召回环节基于用户向量计算其最相似的N个物品向量;在问答系统中,基于问题向量匹配相似的N个问题;在视频或图像检索中,通过对视频截图提取向量,然后搜索相似图像及图像对应的视频。背景为了满足业务上对向量检索的需求,降低学习成本,提高开发效率,我们开发并上线了向量检索平台。我们支持了Faiss算法库,实现了几种常用索引的全量索引构建、实时增量索引、实时在线检索,旨在帮助用户更快更好的使用海量高维向量相似性检索功能。整体架构WEB接入平台:
2021年3月4日
其他

帮帮商家版智能问答模型优化实践

导读58同城是国内最大的生活服务信息服务平台,连接着数千万C端用户和数百万B端商家,为了提升B端商家和C端用户的有效连接,基于智能对话机器人我们构建了帮帮智能客服商家版,其中一项功能为在微聊中对用户问题进行智能回复。背景智能回复流程由QABot机器人和Taskbot机器人两部分构成,如图所示,第一部分QABot机器人用于解答用户问题,第二部分Taskbot机器人用于引导用户留下更多信息以及商机,当前智能回复已接入黄页多个二级类目,本文我们主要讲述QABot机器人相关实践探索。
2021年3月1日
其他

3人半年打造语音识别引擎——58同城语音识别自研之路

导读大多数人会认为研发语音识别技术是一条艰难的道路,投入会巨大,道路会很漫长。我们于2019年11月组建了3人团队自主研发语音识别技术,包括2名算法工程师和1名后端工程师,历经半年,自研语音识别引擎效果超过第三方采购厂商,成功打造了58语音识别引擎。本文将分享我们自研语音识别技术历程,望对走在自研道路上的同行有一定借鉴意义。本文收益:了解语音识别基本概念、语音数据标注、算法模型、工程架构。阅读时长:本文共
2021年2月3日
其他

过往,不负韶华,未来,惟有奋斗——AI Lab三年总结和未来规划

Lab培养了多名高职级产品技术人员,成功晋级2名T8、1名T7、6名T6、1名P6,目前团队包括1名T9、3名T8、3名T7、13名T6。部门高职级人才几乎全为内部培养,均是伴随着AI
2021年1月29日
其他

AI + CRM 提高企业的 "绩" 和 "效"

导读2020年Q4,我们开展了黄页CRM商机智能分配项目,上线了机器学习分配模型,在各城市ABTest上线模型期间,将直销团队密歇根商机组的转出商机数提升了31.8%,将电销团队60秒有效通话商机数提升了
2021年1月20日
其他

喜讯!AI Lab选手在58同城第六届编程大赛中获冠、亚、季军奖!

2020年12月24日~2020年12月26日,58技术委员会联合人力资源部神奇学院举办了58同城第六届编程大赛。在历时3天的紧张比赛中,共有241个团队/个人报名,累计提交代码7774次。最终,58同城AI
2021年1月13日
其他

开源|qa_match更新啦——新增知识库半自动挖掘模块

qa_match是58同城推出的一款基于深度学习的轻量级问答匹配工具,V1.0版本于2020年3月9日发布,2020年6月更新v1.1版本。可参见:开源|qa_match:一款基于深度学习的层级问答匹配工具、开源|qa_match更新啦——支持轻量级预训练、提高问答通用性。2020年12月份,qa_match进行再次升级,更新至v1.3。项目信息开源项目名称:qa_matchgithub地址:https://github.com/wuba/qa_match开源协议:Apache
2021年1月4日
其他

58同城AI Lab部门介绍

Model的原理和实践AI算法平台AI正在驱动行业变革,为加速58同城AI应用的落地,我们自2017年10月开始构建了一套通用的AI算法平台(WPAI,Wuba
2021年1月2日
其他

58同城AI Lab招聘产品经理、开发工程师

Lab目前负责的产品包括智能客服、语音机器人、智能语音分析平台、语音识别、智能写稿、CRM商机智能分配系统、AI算法平台等,未来将持续加速创新,拓展AI应用。
2021年1月1日
其他

年度回顾 | 58同城 AI Lab 2020年对外技术交流总结

58同城AI算法大赛颁奖典礼+解题方案分享》。为了便于大家继续学习和演练技术,我们在赛后重新开启了比赛结果提交入口和AB榜单,并且将一直开放,欢迎大家继续提交结果冲击榜单,详细可访问
2020年12月31日
其他

基于一种改进的Wide&Deep 文本分类在用户身份识别上的实践

导读在互联网平台中,通常包含C端和B端两种客户。为了更好地服务C端用户,识别出用户身份十分重要。本文详细介绍了在用户身份识别过程中如何解决冷启动时少样本的问题,并比较了关键词匹配、XGBoost、TextCNN、改进的Wide
2020年12月25日
其他

沙龙干货 | 智能写稿技术在58部落内容社区的应用实践

智能写稿机器人是指利用NLP相关技术自动化进行稿件文章创作,目前已广泛应用在如体育赛事报道、财经信息发布、天气预报、商品属性介绍等,相比人工创作,机器写稿具有低成本、高效率的特点,
2020年12月24日
其他

基于VGGish的声音类别分类在语音机器人的应用实践

Lab技术交流社区欢迎在欣秀(https://app.ic3i.com)平台上加入"58同城AILab技术沙龙"圈子,一起交流技术,可以扫描以下二维码加入该圈子。
2020年12月23日
其他

PPT+视频回放 | 《如何打造高性能向量检索平台》58同城AI Lab后端高级工程师,陈泽龙

如何打造高性能向量检索平台向量检索广泛应用于各类机器学习系统,如在推荐系统召回环节基于用户向量计算其最相似的K个物品向量,在问答系统中使用用户输入语句向量匹配最相似的问题,在图片检索系统中基于图片向量检索最相似的图片等。为了快速满足上层应用对向量检索的需求和提高研发效率,我们基于Faiss打造了一套向量检索平台。本次议题首先介绍平台总体架构,然后介绍增量索引、分布式索引和检索服务,并分享系统优化过程中遇到的问题及解决方法。分享嘉宾:陈泽龙,58同城AI
2020年12月14日
其他

语音识别中的WFST和语言模型

Semiring中,我们关注的是最佳路径问题,即最短路径搜索,则从状态0到状态3的得分表示为和中的加权最短路径。WFST在语音识别中主要是扮演解码图的角色,所以在ASR中经常使用Tropical
2020年12月12日
其他

PPT+视频回放 | 《"灵犀"智能语音分析平台后端架构设计》58同城AI Lab后端资深工程师,刘晟源

"灵犀"智能语音分析平台后端架构设计语音是58同城生活服务平台上用户之间的重要沟通媒介,C端和B端用户之间可以通过电话、音视频通话建立连接,58同城销售客服人员会通过呼叫中心与客户进行电话沟通,这些场景下产生的海量语音数据具备巨大的挖掘价值,我们打造了"灵犀"智能语音分析平台,利用自研语音识别引擎将通话录音转换为文本,使用NLP技术挖掘文本语义标签,构建了语音质检、用户画像等AI应用。本次议题将首先介绍灵犀平台总体架构,然后介绍海量语音数据的下载/存储方案、语音转文本服务、语义标签挖掘/存储/检索流程,最后介绍Web可视化接入系统。分享嘉宾:刘晟源,58同城AI
2020年12月11日
其他

PPT+视频回放 | 《智能客服商家版后端架构设计》58同城AI Lab后端资深工程师,何帅

智能客服商家版后端架构设计58同城智能客服系统"帮帮"诞生于2017年,被广泛应用于58各前台业务线的客服人员和用户沟通场景,折合节省客服人力约500人,大大提高了客服人效。2019年,我们将智能客服应用于58同城C端用户和B端商家沟通场景,打造了智能客服商家版平台——"帮帮商家版",助力B端商家提高获客效率和增加收益。本次议题将首先介绍"帮帮商家版"微服务架构,然后介绍数据存储、对话管理、可插拔式QABot、TaskBot的设计,最后介绍帮帮商家版在黄页微聊代运营场景中的应用实践和效果数据。分享嘉宾:何帅,58同城AI
2020年12月9日
其他

PPT+视频回放 | 《语音识别引擎后端架构设计》58同城AI Lab后端架构师,王焱

语音识别引擎后端架构设计语音是58同城生活服务平台上用户之间的重要沟通媒介,C端和B端用户之间可以通过电话、音视频通话建立连接,58同城销售客服人员会通过呼叫中心与客户进行电话沟通,每年会产生数百万小时的通话录音,这些语音数据具备巨大的挖掘价值,我们自主研发了58生活服务领域的语音识别引擎,效果优于同类型语音厂商和业界通用语音识别厂商。本次议题将讲述我们如何从0到1构建语音识别后端服务,首先介绍系统总体架构,然后介绍语音文件转写服务,包括语音文件解析、语音解码和docker服务部署,再介绍实时语音识别服务,包括音频字节流的交互和实时解码过程,最后总结开发过程中遇到的问题及优化实践经验。分享嘉宾:王焱,58同城AI
2020年12月8日
其他

语音识别中Chain Model的原理和实践

model采用的训练策略是MMI区分性训练,核心点还是损失函数的计算方式,如下图:我们上面讲到损失函数计算方式是,分子由音频的标注文本序列计算,分母是由lattice来做近似计算。chain
2020年11月27日
其他

人物 | 陈兴振:58同城AI算法平台的演进与实践

Lab技术交流社区欢迎在欣秀(https://app.ic3i.com)平台上加入"58同城AILab技术沙龙"圈子,一起交流技术,可以扫描以下二维码加入该圈子。
2020年11月23日
其他

智能语音机器人中VAD语音端点检测算法优化实践

VAD的正向准确率与正向召回率均优于双门限端点检测,其F1值相对双门限端点检测绝对提升约20%。备注正向准确率正向召回率正向F1值WebRTC
2020年11月22日
其他

槽位识别与纠错在智能语音机器人中的实践

“我想买那个别克7268”,NER识别出车品牌“别克”,车系“7268”,但其实用户想表达的是“别克GL8”,通过槽位纠错可以将车系“7268”纠正成“GL8”,可以更好识别用户意图,
2020年11月13日
其他

沙龙干货|58同城-深度学习平台资源使用率优化实践

Manager等。英伟达及VMware的产品按照显卡收费,价格较高且使用较为复杂;GPU-Sharing开源,但主要是基于显存进行vGPU划分,不满足平台使用需求;OrionX和GPU
2020年10月28日
其他

直播回顾 | 58同城AI算法大赛颁奖典礼+解题方案分享

以人工智能技术为核心的智能客服近年来被广泛应用,它不仅能给用户提供高效和个性化的客户服务体验,还可以为企业节省大量客服人力成本。智能客服的本质是充分理解用户的意图,在知识库中精确查找与之相匹配的内容,自动回答用户的问题。文本匹配、分类是智能客服里最核心的技术,同时也是自然语言理解领域中的核心问题之一。58同城2017年就打造了智能客服系统,近几年一直专注于人工智能技术的优化和应用场景的拓展,目前智能客服已被广泛应用在客户服务、售前导购等场景,为公司提高了人效并增加了收益。58技术委员会联合人力资源部神奇学院举办了58同城首届AI算法大赛,提供了一批58智能客服实际场景中的数据,跟参赛者一起探讨文本分类、匹配问题。本次大赛历时50天,共有158支队伍参赛,吸引了国内60所高校的在校学生以及30家知名企业的技术人员,最终比赛角逐出了十强团队。AI算法大赛十强团队2020年9月16日16:00-18:00,我们举办了颁奖典礼直播,并邀请了优胜者分享了各自的解题方案。颁奖典礼由58同城人力资源部神奇学院技术培训负责人袁媛主持,首先邀请了58同城副总裁、技术委员会主席王少峰进行致辞。58同城AI
2020年9月22日
其他

沙龙干货 | 58同城智能语音机器人后端架构解析

Protocol):实时传输协议,为端到端都是实时传输提供时间信息和流同步,RTP包包头介绍几个比较重要的字段,PT全称payload
2020年9月18日
其他

使用qa_match开源工具完成58同城AI算法大赛

背景以人工智能技术为核心的智能客服近年来被广泛应用,它不仅能给用户提供高效和个性化的客户服务体验,还可以为企业节省大量客服人力成本。智能客服的本质是充分理解用户的意图,在知识库中精确查找与之相匹配的内容,自动回答用户的问题。文本匹配、分类是智能客服里最核心的技术,同时也是自然语言理解领域中的核心问题之一。58同城举办了首届AI算法大赛,具体参见文章《58同城AI算法大赛最新动态,欢迎关注》,当前已经有159支团队报名,欢迎大家参赛。本文将介绍如何使用我们的开源工具qa_match中的SPTM
2020年8月12日
其他

人物|詹坤林:语音语义技术打开58同城的另一扇门

7月25日-26日,汇集了2020大数据、AI最新技术实践的线上大会DataFunCon成功举行。本次大会由20余位知名专家学者出品,设置了19场专题分享,有超过90位一线资深技术专家参与分享。更汇集了1500余家企业,超过11000名技术管理者、大数据及算法工程师报名参加本次DataFunCon线上大会。58同城AI
2020年8月7日
其他

干货总结 | 58同城语音识别技术的探索和实践

导读语音是58同城用户之间的重要沟通媒介,58同城C端用户和B端用户之间可以通过网络音视频通话、电话建立连接,58同城数千名销售和客服人员会通过呼叫中心与客户进行电话沟通,这些场景下会产生大量的语音数据,这些语音数据可以通过语音识别技术转换为文本,并做进一步挖掘,以提取有价值的数据。本次议题将首先介绍语音识别在58同城的应用场景以及语音数据采集标注,然后详细介绍基于Kaldi的Chain
2020年8月1日
其他

干货总结 | AI技术如何打造智能语音质检系统

导读58同城拥有数千名销售和客服人员,每年会拨打数百万小时的电话,我们构建了一套智能语音质检系统,利用语音识别技术将语音转化成文本,然后利用NLP技术对通话文本进行分析挖掘,实现机器自动质检,这可以规范化销售和客服工作,提高客户服务质量。本次议题将首先介绍语音质检系统的总体架构,然后详细分享语音质检中涉及到的语音处理与NLP技术,包括单声道语音分离、角色识别、文本标签挖掘等,最后会介绍58销售客服场景下的语音质检应用案例。嘉宾介绍:陈璐,58同城AI
2020年7月29日
其他

58 同城对话机器人应用实践:本地生活服务场景中的商家智能助手

和对话机器人方向也被研究界寄予厚望。伴随着工业界和研究界的关注,对话机器人稳步向前发展,越来越多的企业在把对话机器人应用到产品中。那么,目前业界如何构建这些对话机器人?主要使用什么技术?深度学习和
2020年7月28日