一键批量下载微信公众号文章内容/图片/封面/视频/音频,支持导出html和pdf格式,包含阅读数/点赞数/在看数/留言数
Editor's Note
分析一个公众号的数据
The following article is from 苏生不惑 Author 苏生不惑
苏生不惑第
314
篇原创文章,将本公众号设为星标
,第一时间看最新文章。
之前分享过听说公众号深圳卫健委被网友投诉尺度大,我抓取了所有文章标题和阅读数分析了下 ,后来发现这个号的封面图真有意思,于是批量下载了所有封面图,如果有需要在公众号后台对话框回复 封面
获取所有封面图的网盘地址。
所有封面图的文件名为文章发布日期加标题,方便搜索。
下载的html文件可以用谷歌浏览器打开,即使文章被删了在本地也能继续看。
def export_pdf():
import pdfkit,os
print('导出 PDF...')
htmls = []
for root, dirs, files in os.walk('.'):
for name in files:
if name.endswith(".html"):
print(name)
try:
pdfkit.from_file(name, 'pdf/'+name.replace('.html', '')+'.pdf')
except Exception as e:
print(e)
export_pdf()
转换后的pdf文件比html文件大。
因为我的文章不发音频,这里以默默道来这个号为例,单篇文章隧道里的光 的音频可以用idm直接下载。
def audio(res,headers,date,title):
aids = re.findall(r'"voice_id":"(.*?)"',res.text)
time.sleep(2)
tmp = 0
for id in aids:
tmp +=1
url = f'https://res.wx.qq.com/voice/getvoice?mediaid={id}'
audio_data = requests.get(url,headers=headers)
print('正在下载音频:'+title+'.mp3')
with open(date+'___'+title+'___'+str(tmp)+'.mp3','wb') as f:
f.write(audio_data.content)
批量下载音频效果:
同样我的公众号也不发视频,这里以阿斗归来了这个号为例,单篇文章神雕侠侣,绝迹江湖!金庸经典武侠《神雕侠侣》大结局 的视频也可以用idm下载。
def video(res, headers):
vid = re.search(r'wxv_.{19}',res.text).group(0)
time.sleep(2)
if vid:
url = f'https://mp.weixin.qq.com/mp/videoplayer?action=get_mp_video_play_url&preview=0&vid={vid}'
data = requests.get(url,headers=headers).json()
video_url = data['url_info'][0]['url']
video_data = requests.get(video_url,headers=headers)
print('正在下载视频:'+trimName(data['title'])+'.mp4')
with open(trimName(data['title'])+'.mp4','wb') as f:
f.write(video_data.content)
批量下载视频效果:
最后说下批量下载文章里的图片,也是正则匹配图片链接批量下载:
def imgs(content,headers,date,position,title):
imgs=re.findall('data-src="(.*?)"',content)
time.sleep(2)
num = 0
for i in imgs:
num+=1
img_data = requests.get(i,headers=headers)
print('正在下载图片:'+i)
with open(date+'___'+title+'___'+str(position)+'___'+str(num)+'.jpg','wb') as f:
f.write(img_data.content)
批量下载图片效果:
下载的图片文件名为文章发布时间加文章标题和数字:
最近原创文章:
除了跳过 app 启动广告,这个 app 还能帮你自动收集支付宝蚂蚁森林能量
网易云音乐每天自动听歌300首升级LV10,b站每天自动签到升级LV6,京东每天自动签到领京豆,微信运动每天自动修改步数
分享几个音乐神器 APP,免费听全网音乐,一键解锁网易云音乐变灰歌曲
如果文章对你有帮助还请
点赞/在看/分享
三连支持下, 感谢各位!