58技术

其他

iOS不必现崩溃的点对点解析以及治理

00引言客户端应用中崩溃类型有多种,包括普通崩溃,主线程卡死,野指针崩溃,后台崩溃等等。当进程发生崩溃后系统会自动生成相应的崩溃信息,我们可以根据符号表解析崩溃日志,线上用户可以通过Bugly等第三方工具收集并解析堆栈。但是在解析的过程中大家可以发现解析一个崩溃日志操作非常繁琐,有时候出现解析失败的情况,甚至会解析错误。本文章主要介绍多个不同系统崩溃日志的解析方案。01背景当重要客户或测试人员在App使用过程中反馈在某场景下发生了一个闪退现象,研发人员收到反馈后尝试复现又是一个不必现的问题。那我们的第一个反应就是从线上Bugly等第三方平台查询该设备的记录或者直接用户的设备中将崩溃日志导出来,对它进行解析并分析堆栈。但是在解析过程中就会发现可能会存在很多限制以及问题。1.1
2022年7月22日
其他

开源|WBBlades重要节点更新-专为提效而设计

技术特点支持快速检测一个静态库的链接后大小无需编译链接。举例说明:如果你想知道接入或更新一个SDK对会增加多少包大小,可以用使用包大小检测工具检测,而无需将SDK接入编译链接成功后进行测算。2.2
2022年7月7日
其他

58同城AI算法大赛开放报名,欢迎参赛

招聘是58同城的核心业务之一,企业可以在58平台上发布职位,用户可以在平台上浏览职位,浏览完后若对该职位有求职意向可以进一步投递自己的简历,企业收到求职者的简历后便可开展后续招聘流程,如简历审核、发起面试等。在58招聘推荐系统中,如何提高用户对职位的点击(浏览)率和转化(投递)率至关重要。本次比赛,我们提供了一批58招聘实际推荐场景中的数据,参赛者可以基于用户的历史行为数据,利用机器学习算法预测出用户对于不同职位的浏览和投递概率。本次比赛以浏览、投递预测结果的加权AUC值进行评分。本次比赛,我们开放了58同城AI算法平台,提供一批GPU计算资源供参赛者使用,参赛者可以在平台上完成模型的训练和评测。本次比赛由58同城技术委员会举办,欢迎大家报名参加。大赛海报报名指引01进入“58技术”官网PC端浏览器打开58技术网站
2021年7月9日
其他

CRM商机智能分配系统中的多目标排序算法

Bottom结构必须使用同样的底层特征,在目标相关性不够高时,有较大概率造成两个目标都无法良好学习的严重后果。举个例子,假设某次训练多任务深度学习模型的目标分别是如何定义猫与如何定义狗,Share
2021年7月7日
其他

流式和离线语音场景下VAD语音端点检测算法实践

导读近年来,AI智能语音应用在58同城广泛落地。无论是智能语音交互平台还是“灵犀”智能语音分析平台,都需要对电话语音进行处理分析,服务上层应用。如果把音频信号比作水流,语音端点检测(VAD,
2021年5月31日
其他

58同城Hadoop2.6升级3.2实践

导读Hadoop3已经发布了多个稳定版本,最新版本为3.3.0,Hadoop3.x中增加了很多特性和重大改进。在HDFS方面,最主要是EC能力成熟,显著降低HDFS数据存储成本。在Yarn层面,支持多集群Federation,可以有效利用多YARN集群空闲资源,达到降本增效的目标。此外,还有大量其他新的特性,有效提高集群的稳定性及效率,降低运营成本。升级背景
2021年5月28日
其他

Swift Hook新思路--虚函数表

导读业界对Swift的Hook大多都需要依靠OC的消息转发特性来实现,本文从修改Swift的虚函数表的角度,介绍了一种新的Hook思路。并以此为主线,重点介绍Swift的详细结构以及应用。引言由于历史包袱的原因,目前主流的大型APP基本都是以Objective-C为主要开发语言。但是敏锐的同学应该能发现,从Swift的ABI稳定以后,各个大厂开始陆续加大对Swift的投入。虽然在短期内Swift还难以取代Objective-C,但是其与Objective-C并驾齐驱的趋势是越来越明显,从招聘的角度就即可管中窥豹。在过去一年的招聘过程中我们总结发现,有相当数量的候选人只掌握Swift开发,对Objective-C开发并不熟悉,而且这部分候选人大多数比较年轻。另外,以RealityKit等新框架为例,其只支持Swift不支持Objective-C。上述种种现象意味着随着时间的推移,如果项目不能很好的支持Swift开发,那么招聘成本以及应用创新等一系列问题将会凸显出来。因此,58同城在2020年Q4的时候在集团内发起了跨部门协同项目,从各个层面打造Objective-C与Swift的混编生态环境——项目代号
2021年5月19日
其他

Flutter代码覆盖率研究

推荐阅读:基于next.js的服务端渲染解决方案58信息安全—营销反作弊业务的算法实践58信息安全-图神经网络在业务反欺诈中的应用实践58同城商业生态与智能发展中心反作弊测试平台建设
2021年5月14日
其他

58同城商业生态与智能发展中心反作弊测试平台建设

导读对于反作弊紧急上线且直接影响在线收入的需求,要求测试高效且质量高,所以我们对业务和系统的分析的理解,引入测试平台的思路搭建了反作弊测试平台,本文主要介绍了58同城商业生态与智能发展中心反作弊测试平台的建设。背景当前移动时代,流量快速变现的利益驱动下,流量造假时有发生,作弊流量使广告主为作弊流量付费,损失了广告主的利益;同时商业广告系统需要为处理造假流量消耗一定的资源,极端情况下甚至会影响商业广告系统的稳定性及在线生产能力;但是反作弊过分严格,商业广告系统本身收益也会受到损失,因此各大商业广告系统中会研发各种反作弊技术合理地过滤作弊流量。反作弊业务简介业务特点反作弊业务主要负责过滤虚假流量;首先,需要通过算法及用户行为分析等方法识别出作弊特征;然后,对每一条流量进行特征提取,将提取后的特征与已知的作弊特征进行匹配;如果该流量的特征匹配作弊特征,会被认定为作弊流量。原理见示意图:
2021年5月12日
其他

58信息安全—营销反作弊业务的算法实践

Aggregation,主要是将第一步划分出来的社区聚合成为一个点,即根据上一步生成的社区结构重新构造网络。重复以上的过程,直到网络中的结构不再改变为止。应用效果以58某营销活动为例,来介绍Fast
2021年5月10日
其他

基于next.js的服务端渲染解决方案

导读对于面向C端用户的界面来说,性能优化一直是一个永恒的问题,随着前端技术的发展,针对性能每个时间段都会有相应的更加优秀的解决方案,基于React,Vue的服务端渲染无疑是当代最先进的一种,Next.js就是基于React的一个侧重于服务端渲染的开源框架。在58同城汽车业务中对Next.js的应用中,我们在Next.js中加入了我们对业务的思考,演变成CarNext
2021年4月26日
其他

系列 | 58集团白盒代码审计系统建设实践2:深入理解SAST

理解AST抽象语法树在计算机科学中,抽象语法树(Abstract
2021年4月23日
其他

技术沙龙 | 58同城内容安全工程架构与算法实践

2021年4月27日,18:30-20:30,由58同城与DataFun联合主办的58同城安全风控技术沙龙《内容安全工程架构与算法实践》正式与大家见面了!58安全风控体系被广泛应用于集团的内容安全治理、业务安全对抗、活动反作弊等业务工作中。本次分享从整个安全风控体系出发,聚焦安全能力领域的体系化建设,针对UGC/PGC产品中的内容管控问题,探讨内容安全能力的工程架构与算法实践。▌听众收益通过本次分享,可以了解到这样几方面内容:从安全风控整体出发,如何打造安全能力典型的UGC/PGC产品场景中面对的挑战和能力建设思路在工程架构方面,如何更高效、更可靠的提供能力输出在算法实践方面,如何更精准、更泛化的打造能力内核▌日程安排▌详细介绍
2021年4月21日
自由知乎 自由微博
其他

系列 | 58集团白盒代码审计系统建设实践1:技术选型

作为白盒静态扫描领域的领头产品,拥有极其深厚的技术积累以及专业的产品技术团队。其产品能力都为业界翘楚。笔者曾经和Coverity的售前及售后团队有过一定的交流,可以总结以上商业产品的优点及缺点:优
2021年4月19日
其他

58信息安全-图神经网络在业务反欺诈中的应用实践

导读近年来,中国互联网经济产业飞速发展,互联网服务也逐渐渗透到国民经济和社会生活的方方面面,互联网平台用户群体和市场规模急剧增长,滋生了巨大的黑色产业利益链,黑产团伙开始从“攻击渗透系统获利”进化到利用“业务风控缺失进行大规模牟利”的模式,并且开始呈现规模化、产业化、专业化的趋势,互联网业务安全面临严峻的挑战。导语58同城作为国内最大的生活信息服务平台,以“让生活简单美好”为使命,为广大市民提供分类信息服务,同时也为商家提供全方位的市场营销解决方案。为了保障集团核心业务安全,安全团队做了很多开创性的工作,设计和研发了安全平台和反欺诈体系。我们首先分析黑产欺诈行为的特点,总结反欺诈体系中的主流应对方法及其适用的场景,梳理在信息服务场景下的典型欺诈方式,提出应用图神经网络的方法,捕获黑产用户在设备聚集性、内容相似性、行为协同性方面深层次的鲁棒性特征,鉴别用户是否有欺诈风险。设计对比实验表明,该方法具有识别精准度高、鲁棒性强、训练效率高等特点,为保障业务安全和构建反欺诈体系提供了一种切实可行的技术路线。黑产反欺诈现状分析作为风控行业的从业者,只有对黑产常见的欺诈行为方式和攻击手段有深入理解,才能在更深刻的理解业务风险以及当前反欺诈体系的薄弱环节。本节主要从业务安全的视角系统梳理了黑产欺诈行为的特点,总结与黑产斗争过程中的经验与教训。2.1.黑产反欺诈现状分析互联网黑产欺诈行为纷繁复杂,而且善于隐藏踪迹,我们通过对大量数据进行总结分析,黑产欺诈行为主要有以下3个典型特点:聚集性据《2019中国数字金融反欺诈全景报告》指出,黑产市场规模已达千亿级别,相关从业人员超过200万人,黑产已经从单打独斗发展成了有组织、有分工的团伙经营模式。黑产团伙在实施欺诈行为的过程中,在多个维度都表现出显著的聚集性,比如说共用相同的硬件设备资源,降低攻击成本。专业性黑产从业者拥有大量的硬件资源,如身份证、银行卡、手机号、IP池等,并且也具有非常高的技术水平,擅长各种自动化脚本编写、外挂制作、逆向反编译破解等技术手段,具有显著的专业性特征。2017年,“快啊答题”打码平台使用vgg16卷积神经网络模型,搭建了一套验证码自动识别平台,累积破解验证码1200亿次。对抗性黑产欺诈问题难以解决的根源来自于对抗性,实际工作中我们经常会遇到以下情况:针对专项问题治理的模型或策略刚上线,拦截性能突出,线上问题迅速得到控制,随着时间推移,黑产通过改机工具、IP代理、文本变形等方式掩盖其行为轨迹、改变行为模式,模型主键失效,线上问题死灰复燃,然后工作人员又步入问题样本收集、Bad
2021年4月16日
其他

开源 | 应用 Umajs 高效构建 Node.js Web 工程指南

数据。通过框架内置的这些参数装饰器获取请求的参数称的上是轻巧快捷了。除此之外,框架还提供了自定义参数装饰器的功能以便于针对不同的业务场景做定制化处理。接下来我们看一下如何实现自定义参数装饰器://
2021年4月14日
其他

沙龙干货| 深度学习在58APP首页推荐排序上的实践

PB格式的模型,在用到这个模型的时候要注意一些参数的保存。前面介绍过BN层在模型中的重要性,我这里列举了TensorFlow里面的关于BN的一些
2021年4月12日
其他

沙龙干货| 58同城-向量化召回上的深度学习实践

gram。先讲一下我们的训练流程:向量训练,首先可以从HDFS日志上提取出用户的点击行为,对于每个点击行为,把点击的ItemID
2021年4月9日
其他

沙龙干货 | 深度学习在58租房搜索排序中的实践

concat层往下是共享的。从损失函数上来看,是CTR和CTCVR的一个加权损失函数。我们前面说的业务背景,是连接行为的产生必须依赖于点击行为。从概率计算的关系上来看是
2021年4月7日
其他

Taro 3.2 版本正式发布:React Native 支持,王者归来

的覆盖度,使用成本等几个方面继续完善。不断提升API与组件的覆盖度,尽可能减少与H5、小程序端的差异。通过增加新手教程,减少项目初始化步骤,提供更多的案例等方面,不断降低使用成本。Taro
2021年4月2日
其他

智能预警在风控场景中的实践与思考

导读本文以58信息安全风铃监控预警系统为原型,重点从线上数据生产到指标计算、存取、阈值设置的角度介绍一些实践中的通用技术点,以解决信息安全风控对抗过程中在高并发情形下面临的问题和挑战。风控场景面临的挑战在风控业务场景中,黑产是极为猥琐的,他们会想尽一切办法来逃避我们的检测,因为在我们的系统里多待一分钟,他们就能得到网民的流量,就有可能获利。因此如何快速有效的发现黑产的攻击,能够实时的动态感知到黑产不断变化的作案手段是整个风控环节面临的巨大挑战。图一
2021年3月31日
其他

沙龙干货 | BERT在58搜索的实践

BERT语义模型初探有了数据之后,就可以开始来做模型实验。第一种尝试的结构是一个标准的基于Bert的交互式文本匹配任务。结构是将
2021年3月29日
其他

58 同城 App 性能治理实践-iOS 启动时间优化

内置的一个代码覆盖率检测工具,在编译时,它能够根据我们的编译配置,将一系列以__sanitizer_cov_trace_pc_为前缀的函数插入到我们自定义的函数内,比如,我们在Clang的自定义配置
2021年3月26日
其他

58安全-违规水印检测的技术实践

导读58同城作为国内领先的分类信息网站,每天接受的图片流量高达数亿。上传的图片中不可避免会包含违规水印,仅仅依靠人工审核不能满足网站的要求,急需要自动审核的功能。而目标检测与业务问题结合,是一种有效检测识别违规水印的重要手段。目标检测不仅可以判断出图片中是否含有违规水印,还可以确定违规水印的数量、位置、大小,得到的结果充分满足审核的需要。业务背景58同城作为国内领先的分类信息网站、专业的“本地、免费、真实、高效”的生活服务平台,包括本地服务、房产、招聘、二手市场、金融、汽车等业务板块,拥有庞大的活跃用户群,每天接受的图片流量高达数亿。由于58用户成分众多,包括个人、商家、中介等各种属性,上传的图片中不可避免会包含违规水印,例如:含有其他非合作网站水印或logo的图片,这类图片属于盗图;含有马赛克的图片,网站要求经纪人发布的房源图片是实拍并且没有经过二次加工的原图,而含有马赛克的图片大部分是为了遮挡水印而且不是原图;含有微信logo的图片则是经过二次加工或来自其他地方的非原图;含有二维码的图片则是违反了联系方式不允许出现在图片上的规则。下图图1为违规图片实例,图2为正常图片实例。数量庞大的违规水印仅仅依靠效率低成本高的人工审核远远不能满足网站的要求,为了达到规范网站环境的目的,迫不及待需要自动审核的功能。
2021年3月24日
其他

Taro 3.2 适配 React Native 之样式内幕

t.jSXExpressionContainer(t.arrayExpression(class2StyleExpression.concat(expression)))
2021年3月22日
其他

Taro3.2 适配 React Native 之运行时架构详解

的写法。(https://mp.weixin.qq.com/s/-7G7NMHX8ol99QxkswFOxg)直接基于源码去打包运行时适配,如何做适配,需要适配哪些内容?入口文件及配置,Taro
2021年3月19日
其他

58安全-证件识别之版面分析实践

导读本文介绍OCR技术在58信息安全场景中的一些落地实践,主要聚焦于OCR技术中的版面分析环节。OCR任务一般包括文字检测、文字识别和版面分析三部分,版面分析是影响文字识别和信息结构化的关键环节。本文就证件/票据识别场景分享版面分析相关方法和实践经验。背景58涵盖的业务广泛、场景众多,多数场景涉及证件、票据、图文的识别,如房产业务线的房产证/身份证的识别,汽车业务线的行驶证/驾驶证/过户票的识别,信安/黄页的营业执照/图文识别等等。通过OCR技术可以有效地识别以上证件/票据等内容,助力业务进行身份认证、资质审核和辅助填写等工作,如图1所示,节省人力成本、提升用户体验。目前信息安全部已具备身份证、行驶证、驾驶证、营业执照、房产证等10余项OCR能力,实践了多种版面分析方法,并根据实际应用场景和痛点进行探索和优化。本文所有图片中的人物信息均为虚拟信息。图1
2021年3月17日
其他

直播预告 | 多目标排序在推荐系统中的实践

专注于大数据、人工智能技术应用的分享与交流。发起于2017年,在北京、上海、深圳、杭州等城市举办超过100场线下沙龙、论坛及峰会,已邀请近600位专家和学者参与分享。其公众号
2021年3月15日
其他

安居客小程序持续交付之路

导读随着小程序的日益发展,对于小程序付过程中的各种问题也越来越值得我们关注,本文介绍了安居客小程序持续交付从无到有的整个过程,以及过程中各阶段遇到的问题、思考及解决方案。背景安居客小程序业务覆盖新房、二手房、租房、
2021年3月12日
其他

技术沙龙 | 第十九期 58同城搜索推荐深度学习专题沙龙

近年来,深度学习在搜索推荐上广泛应用,已然成为召回排序等核心能力的主流技术。58搜索推荐团队一直以来紧跟深度学习前沿,结合业务特点,持续架构升级与优化迭代,实现了深度学习在各场景的全面落地,效果上也得到了显著提升。本次沙龙主要介绍深度学习在58搜索推荐场景下的相关实践,比如租房业务上序列化深度学习模型与多目标优化的结合;Bert模型在搜索深度语义相关性模型上的应用;向量化召回上从Word2Vec到双塔模型的迭代升级过程;精排上提出了适配业务特点的多通道序列化深度学习模型。(关注公众号,会后下载PPT)01活动介绍主办方:58同城、AICUG人工智能社区直播时间:3月16日周二
2021年3月10日
其他

五八搜索实时索引实现和重构

导读倒排索引是搜索引擎的核心技术,主要于解决海量数据下的快速检索问题。同数据库技术中索引原理一样,在搜索引擎中创建了倒排索引后,查询性能非常好,但是数据的快速/大量更新却是个棘手的问题。在实际应用中,往往优先保证检索性能而牺牲了更新的时效性。本文主要介绍了我们是如何在保证检索性能情况下,通过底层数据结构的优化,实现实时倒排索引更新,即在文档更新后毫秒级内即可通过索引查询出来。前言假设一个用户查询“java高级工程师”(即查询query),我们需要返回所有包含“java高级工程师”相关的文档(doc)。直观反应就是把所有的文档遍历一遍,在每个doc中查找,并判断其是否包含该query中所有的词,最后返回包含该query的所有doc集合。文档集合比较小的时候,该实现方法是可行的,但如果候选文档集合大小为几千万、几亿(甚至几百亿:如Google),该实现方案就会面临比较大的问题:遍历全部文档做查询匹配,耗时可能是几秒、几十秒甚至更高,对一个在线服务来说是不可接受的。因为搜索服务是需要立刻返回结果,需要一秒内或几十毫秒就给用户呈现搜索结果,让用户感受不到计算延迟。为了解决这个问题,搜索引擎采用了“倒排索引”的技术来实现在海量文档中快速查询。搜索引擎中的倒排索引技术倒排索引(英语:Inverted
2021年3月8日
其他

智能标题生成在58招聘业务中的探索

导读文本生成是自然语言处理(NLP)领域中非常重要且具有一定挑战性的分支。本文以实际业务中标题生成的需求为背景,结合主流的文本生成方法进行实践,并对当前的方法进行改进,有效提升了用户体验与招聘双方的连接效率,实现了为招聘业务赋能。背景文本生成作为自然语言处理领域的一个重要分支,近年来随着深度学习技术的不断发展,基于神经网络的文本生成技术得到了广泛的关注与应用。58同城作为国内互联网招聘行业巨擘,其招聘平台每天会有大量招聘信息发布及更新。这些招聘信息中存在着标题低质化、标题同质化等问题,比如许多帖子有着相同的标题例如清一色的都为厨师,这样会严重影响用户体验,降低招聘双方连接效率。为了解决这些问题,我们开发了一种基于职位信息的智能标题生成系统,该系统采用Pipeline、Seq2seq两种方式实现智能标题的生成,下面将从这两方面进行详细阐述。
2021年3月5日
其他

58同城向量检索平台架构实践

导读向量检索在很多AI场景都会应用到,例如:在推荐系统中,召回环节基于用户向量计算其最相似的N个物品向量;在问答系统中,基于问题向量匹配相似的N个问题;在视频或图像检索中,通过对视频截图提取向量,然后搜索相似图像及图像对应的视频。背景为了满足业务上对向量检索的需求,降低学习成本,提高开发效率,我们开发并上线了向量检索平台。我们支持了Faiss算法库,实现了几种常用索引的全量索引构建、实时增量索引、实时在线检索,旨在帮助用户更快更好的使用海量高维向量相似性检索功能。整体架构WEB接入平台:
2021年3月3日
其他

直播预告 | 城市计算技术沙龙 - 58同城房价预估

城市计算是一个通过不断获取、整合和分析城市中多种异构大数据来解决城市所面临的挑战的过程。城市计算将无处不在的感知技术、高效的数据管理和分析算法,以及新颖的可视化技术相结合,致力于提高人们的生活品质、保护环境和促进城市运转效率。城市计算帮助我们理解各种城市现象的本质,甚至预测城市的未来。DataFunTalk、美团于2021年3月13日(周六)09:30-12:00
2021年3月3日
其他

帮帮商家版智能问答模型优化实践

导读58同城是国内最大的生活服务信息服务平台,连接着数千万C端用户和数百万B端商家,为了提升B端商家和C端用户的有效连接,基于智能对话机器人我们构建了帮帮智能客服商家版,其中一项功能为在微聊中对用户问题进行智能回复。背景智能回复流程由QABot机器人和Taskbot机器人两部分构成,如图所示,第一部分QABot机器人用于解答用户问题,第二部分Taskbot机器人用于引导用户留下更多信息以及商机,当前智能回复已接入黄页多个二级类目,本文我们主要讲述QABot机器人相关实践探索。
2021年3月1日
其他

搜索引擎中相似字符串查找那些事儿

length)。其中,莱文斯坦距离允许增加、删除、替换字符这三个编辑操作,最长公共子串长度只允许增加、删除字符这两个编辑操作。一些主流搜索引擎如著名开源搜索引擎Elastic
2021年2月26日
其他

从探索到实践,iOS动态库懒加载实录

导读业务功能只增不减,图片已无压缩空间,业务代码无法快速下线,一个历经10年,由2000万条指令、6万多个类构成的APP如何才能在业务迭代过程中实现启动优化与下载优化?背景经过近10年的迭代,iOS客户端已经接入了几十个三方SDK,达到100余个静态库。这些SDK在启动阶段会启动和加载,如某SDK在启动阶段hook大量的系统方法,其中一个类的load方法的耗时就已经达到了数十ms。但是它的业务却处于二级页面,甚至更深的入口,因此很多用户在APP使用过程中都不会触发此业务场景,这就造成了启动任务的浪费。除此之外,iOS客户端一直在致力于降低APP的下载大小。图片压缩、无用代码删除等常规技术手段都经过尝试后,可优化的范围越来越小。通过与苹果的开发者关系部的多次沟通,苹果建议我们使用动态库来实现APP的增量更新。
2021年2月24日
其他

3人半年打造语音识别引擎--58同城语音识别自研之路

导读大多数人会认为研发语音识别技术是一条艰难的道路,投入会巨大,道路会很漫长。我们于2019年11月组建了3人团队自主研发语音识别技术,包括2名算法工程师和1名后端工程师,历经半年,自研语音识别引擎效果超过第三方采购厂商,成功打造了58语音识别引擎。本文将分享我们自研语音识别技术历程,望对走在自研道路上的同行有一定借鉴意义。本文收益:了解语音识别基本概念、语音数据标注、算法模型、工程架构。阅读时长:本文共
2021年2月22日
其他

不可错过!58技术2020年度热文Top10合集来了

uri,访问状态,耗时等信息,优点是能得到访问量和访问时长等数据,缺点是每次都需要人工手动查询,缺乏无可视化平台和预警,如某一台机器故障/性能故障则完全无感知
2021年2月1日
其他

帮帮商家版黄页微聊代运营中的商机槽位识别实践

推荐阅读:分布式一致性在58招聘的实践深度学习在58租房搜索排序的应用智能客服新三网场景问答模型优化实践58安居客二手房
2021年1月29日
其他

智能客服新三网场景问答模型优化实践

导读帮帮智能客服是58同城自主研发的智能客服系统,新三网场景是58智能客服在房产领域垂直深耕的一个典型场景。该场景面向的是赶集网、安居客、58同城的房产经纪人用户。随着新三网使用量的增加我们对新三网场景的问答模型进行了迭代优化,为用户提供更加准确、快速、高效的服务,以节省人工客服成本,提高人效。整体架构帮帮智能客服整体技术架构如图-1所示,包括主体服务、ABTest服务、标注系统、知识发现系统及意图识别等模块。主体服务与接入管理模块支持配置化,快速接入场景;ABTest服务能够使我们快速对比实验模型;知识发现系统及标注系统可以丰富我们的知识库同时为模型迭代提供数据支持。
2021年1月27日
其他

深度学习在58租房搜索排序的应用

导读深度学习得益于良好的深层特征表达性,目前在视觉、文本、语音等领域获得了广泛的应用。搜索领域紧贴用户需求,作为深度学习商业变现最成功的路径之一,众多头部企业发展出了许多优秀的应用。58同城是国内最大的生活信息服务平台,涵盖房产、招聘、黄页、二手车等多个业务,在多个业务线的搜索服务上,TEG搜索排序部持续对外提供稳定的排序能力。应用背景本文聚焦租房业务线,围绕数据、模型,对搜索排序应用深度学习提升连接效率的经验做阐释。58APP端用户的一个典型使用场景如图1所示。用户通过搜索某一具体小区名或点选某一具体地铁站,发起一次搜索请求,服务端检索到一批相关帖子后,采用某种策略区分帖子的展现位置,最终返回给用户排序后的帖子列表。图1
2021年1月25日
其他

AI + CRM 提高企业的 "绩" 和 "效"

导读2020年Q4,我们开展了黄页CRM商机智能分配项目,上线了机器学习分配模型,在各城市ABTest上线模型期间,将直销团队密歇根商机组的转出商机数提升了31.8%,将电销团队60秒有效通话商机数提升了
2021年1月22日
其他

分布式一致性在58招聘的实践

导读58招聘业务从分类信息演化而来,每天为百万计的求职者和企业主提供服务。平台提供了多款产品来承载商业变现。在团队内部,广泛使用了自研的分布式一致性框架(ETX)来解决商业产品的最终一致性问题。本文从框架的原理,架构和运行指标多个方面加以阐述。CAP和BASECAP原则CAP原则指的是在一个分布式系统中,
2021年1月22日
其他

腊八遇大寒--岁寒人暖,诸事粥全

#腊八遇大寒--岁寒人暖,诸事粥全#
2021年1月20日
其他

58安居客二手房 API Gateway Sidecar 实践

导读58安居客二手房业务线的技术架构合并后,许多老页面需要逐步的重构成同一套技术体系,Web端采用NodeJs渲染,App后端API采用Java,再加上部分老的页面仍然使用的PHP。我们在对外接口这一层有很多通用的拦截功能,例如签名验证、用户票据验签、反爬虫拦截、公共参数处理、城市域名解析等。3套不同的技术栈意味着这些功能都要用不同的语言重复开发3遍,各端逻辑难以统一和维护,面临不少困难,因此亟需一个API网关能够统一的处理这些逻辑,降低维护成本。背景58安居客二手房业务线的技术架构合并后,许多老页面需要逐步的重构成同一套技术体系,Web端采用NodeJs渲染,App后端API采用Java,再加上部分老的页面仍然使用的PHP。我们在对外接口这一层有很多通用的拦截功能,例如签名验证、用户票据验签、反爬虫拦截、公共参数处理、城市域名解析等。3套不同的技术栈意味着这些功能都要用不同的语言重复开发3遍,各端逻辑难以统一和维护,面临不少困难,因此亟需一个API网关能够统一的处理这些逻辑,降低维护成本。API
2021年1月20日
其他

营销自动化系统设计与实现

下单满5单],[发帖数达到10条]]动作执行控制:该模块负责执行系统对用户的营销动作(例如:发短信、发优惠券等)。当状态控制进行每一次状态变更后,都会通知该模块去执行营销动作(Marketing
2021年1月18日
其他

文本预训练模型在信息安全场景的探索和实践

导读本文介绍文本预训练模型在信息安全场景的一些探索和实践,主要聚焦于对话文本分类。信息安全场景种类繁多,其中一项具体业务是对用户提交的举报内容进行审核,判断被举报对象是否有违规问题。用户提交的举报材料有多种形式,而双方沟通的文字对话记录是一项关键证据。少量的对话文本可以通过人工的方式进行审核,而更大量、更快速的识别还需要借助算法。背景从NLP角度看,识别上述虚假问题属于文本分类任务,输入双方对话文本,对定义的虚假问题做出识别和判定。依据不同的需求,任务可分为“多类别分类”和“多标签分类”两种,如图1所示。以下以租房场景“识别双方身份”任务为例介绍算法探索实践,该任务需要基于对话文本,同时识别双方(发帖方/浏览方)的身份信息(房东/中介/未知)。图1
2021年1月15日
其他

从Mach-O角度谈谈Swift和OC的存储差异

导读本文从二进制的角度初步介绍了Swift与OC的差异性,包括Swift在可执行文件中函数表的存储结构、函数的存储结构等(目前只列出基本结构,泛型等结构描述会陆续补充)。为了方便阅读理解,文末附有Demo地址。OC版本的二进制解析工具已经开源,针对Swift的二进制解析工具目前正在开发中,近期即将发布,敬请关注WBBlades~背景经过数年的更新,Swift的ABI终于稳定了。由此引来的就是各大厂对Swift引入的争相尝试。为此58同城APP在集团内发起了引入Swift语言的协同项目—混天项目。混天项目从混编架构、工具链、基础组件、UI组件等多方面着手,旨在提高Swift引入后的开发效率。本文是混天项目工具链组阶段性研究成果。动态调用在正文开始之前,我们先来看个与主题无关的例子。class
2021年1月13日
其他

Taro2.x 跨端开发实践

导读随着业务的快速发展以及要拓展在线渠道至APP、小程序以及M站。与此同时,用户数量的上升需要优化前端的性能和用户体验。本文主要介绍业主业务如何利用Taro2.x实现跨端来进行业务的快速迭代。背景业主业务之前一直是以h5的形式嵌入安居客和58app中的,用户如果需要自己发布卖房信息或者委托经纪人,是只能在app中操作的。为了达到以下三个目标:提高用户体验需要将发房渠道扩展到小程序和M站节约成本和减少重复性劳动我们尝试进行跨端开发(React
2021年1月11日