查看原文
其他

Python有嘻哈:Crossin教你用代码写出押韵的verse

2017-09-04 crossin Crossin的编程教室

托某奇艺选秀节目的福,“嘻哈”无疑是这个夏天最热的音乐标签。年初的时候,我们教室实习生小D还是网易云上一只忧郁的民谣狗(参见 数据分析:当赵雷唱民谣时他唱些什么?)。没想到一夜之间,他的歌单已被HipHop占据,俨然一只黑怕老炮儿。

这对小D来说可谓一大利好:本来报个吉他班,学了仨月才把1645摸熟,如今去淘宝了一把嘻哈四件套,找段beat,药药切克闹,就嗨起来啦!

小D underground听多了就想找人battle。隔壁老王他早就不爽了,这次一定要写段词来diss他!但像小D这么real的rapper是绝对不屑套别人的词的,这可难为坏他小学及格的作文水平了。

小D一连几天闷头在纸上写写画画,也没憋出来几句。我实在看不下去了,不就是写点押韵的词嘛,交给哥来帮你搞定。小D一脸鄙夷:你还会写歌词?我微微一笑:词我是写不了,但我们会什么?编程啊!都什么时代了,还要靠人力嘛。

我的想法很简单:就是找些嘻哈歌手的歌词,把里面的词语都拿出来。当想要写一段歌词时,只要给一个参考词,就帮你找出押韵的备选词。当然太简单的单字押韵我都懒得列出来了,咱们要做就做双押和三押!

说干就干!

  1. 拿网易云的接口,抓了十几位中文嘻哈歌手的歌单,包括:

    红花会、PGone、VaVa、艾福杰尼、BooM黄旭、Bridge、GAI爷、TizzyT、JonyJ、小青龙、辉子、孙八一、谢帝、马思维、满舒克、Mc光光

    import requests url = 'http://music.163.com/api/playlist/detail?id=402614161'
    req = requests.get(url) data = req.json()
  2. 把他们的歌词全抓下来,共 459 首歌曲

    import requests url = 'http://music.163.com/api/song/lyric?os=pc&id=411988938&lv=-1&kv=-1&tv=-1'
    req = requests.get(url) data = req.json()
  3. 用我们之前介绍过的结巴分词(参见【编程课堂】jieba-中文分词利器),把歌词处理下,分成一个个的词语,得到 21206 个词

    import jieba seg_list = jieba.cut("我做的说唱从来不是为了混这圈子", cut_all=True) print("Full Mode: " + "/ ".join(seg_list))
    ''' 结果 Full Mode: 我/ 做/ 的/ 说唱/ 从来/ 从来不/ 不是/ 为了/ 混/ 这/ 圈子 '''
  4. 用 xpinyin 将处理出来的词语转成拼音

    from xpinyin import Pinyin p = Pinyin() print(p.get_pinyin(u"嘻哈"))
    ''' xi-ha '''
  5. 有了拼音就好办了。从网上找个押韵表,把这些嘻哈词语分门别类,就大告功成啦。最后得到 2845 个双押及三押的备选词汇

    一、佳麻  a ia ua   第十部 麻、佳半,部分入声

    二、开来  ai uai    第五部 佳半、灰半

    三、先寒  an ian uan üan 第七部 寒删先元半十四部覃盐咸

    四、江阳  ang iang uang 第二部 江阳

    五、逍遥  ao iao     第八部 萧肴豪

    六、国歌  e o uo    第九部 歌,部分入声

    七、灰微  ei ui   第三部 支微齐,部分入声

    八、森林  en in un ün  第六部 真文元半,十三部 侵

    九、冬青  eng ing ong iong 第一部 东冬,十一部 庚青蒸

    十、希奇(儿)i(er并入) 第三部 支微齐,部分入声

    十一、诗词 i(整体认读)第三部 支微齐,部分入声

    十二、别叠 ie (y)e      部分入声,佳麻二韵部分字

    十三、忧愁 ou iu     十二部 尤

    十四、读书 u      第四部 鱼虞,部分入声

    十五、须臾 ü       第四部 鱼虞,部分入声

    十六、绝学 üe      部分入声

  6. 最后,用django搭个网站,把这功能做成可在线访问的

接下来,小D要做的事就只剩下:想一个词,然后去搜一下有什么其他词跟它配。比如要diss老王,搜一下“老王”:                      

于是小D就写下了:

隔壁老王,你不要嚣张,放学之后给我等在操场

实在太方便啦!

如果你也想来首自己的嘻哈,点击文章下方的“阅读原文”,进入网站自个儿玩儿去吧!

想要完整代码及详细讲解的,请在公众号(Crossin的编程教室)里回复 嘻哈

最后,本人亲自演示,如何用搜出来的双押词汇加上一段简单beat做出一段嘻哈歌曲。

https://v.qq.com/txp/iframe/player.html?vid=x13242zg0a2&width=500&height=375&auto=0

多谢各位homie支持,别忘了转发文章以及给我的知乎专栏点赞!



  • 点击左下角“阅读原文”,查看嘻哈押韵词汇检索工具

  • 代码问题请在论坛 bbs.crossincode.com 上发帖提问

  • 欢迎加入讨论交流群组共同学习进步

  • 别忘了将我们的文章转发朋友圈或在知乎上为我们的专栏点赞,你们的支持将会让编程教室做得更好:)




近期文章推荐阅读:

听说你好不容易写了个爬虫,结果没抓几个就被封了?

编程新手:看懂很多示例,却依然写不好一个程序

喏,你们要的 PyCharm 快速上手指南

几个以前发过、回复过很多次、比较有用的学习资源

给伸手党的福利:Python 新手引导

如何用100行Python代码做出魔性声控游戏“八分音符酱”

数据分析:当赵雷唱民谣时他唱些什么?

我扒了杜蕾斯的微博

Python 爬虫爬取美剧网站

今天,你抢到票了吗?

爆款游戏《贪吃蛇大作战》的 Python 实现



欢迎加入

Crossin的编程教室

crossincode.com

读者交流QQ群:657099683

微信请加 crossin123 留言入群(新手/进阶/爬虫)


  请把我们分享给身边爱学习的小伙伴 :)  

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存