查看原文
其他

一行代码实现地址信息解析

费弗里 Python大数据分析 2022-11-16

添加微信号"CNFeffery"加入技术交流群

本文完整示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/PythonPracticalSkills

这是我的系列文章「「Python实用秘技」」的第8期,本系列立足于笔者日常工作中使用Python积累的心得体会,每一期为大家带来一个几分钟内就可学会的简单小技巧。

作为系列第8期,我们即将学习的是:一行代码解析地址信息

在日常数据处理的过程中,有时候拿到手的是完整的地址信息,如果需要从地址信息中解析出相应的各级行政单元名称,方式有很多,而今天要介绍的方式只需要一行代码即可快速实现。

首先我们需要安装jionlp这个非常好用的文本预处理工具包,建议使用国内镜像安装:

pip install jionlp -i https://pypi.douban.com/simple/

安装完成后,只需要使用其parse_location()接口即可进行地址信息的解析,且具有多种不同的功能:

  • 基础的省市区信息提取
  • 街镇乡、村或居委会信息提取

通过设置参数town_village=True,还可以额外尝试提取出街镇乡、村或居委会信息等级别的信息字段:

  • 自动补全省市信息

若地址信息中缺失省市信息也无妨,在不存在歧义的情况下,parse_location()会自动关联并补全相关信息:

除此之外,parse_location()还具有旧地名修正为新地名、自定义行政区划词典等功能,你可以在其官方文档https://github.com/dongrixinyu/JioNLP/wiki/Gadget-说明文档#地址解析中了解更多。


本期分享结束,咱们下回见~👋

加入知识星球【我们谈论数据科学】

500+小伙伴一起学习!








· 推荐阅读 ·

pandas中鲜为人知的隐藏排序技巧

在jupyter中实现实时协同是一种什么体验

新一代Python包管理工具来了


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存