查看原文
其他

三分钟掌握文件格式识别

2018-01-14

作者 大邓

fleep是一个为Python而写的检测文件类型的库,用法十分简单,功能强大。

使用方法

fleep有一个主函数get(),该函数提取128bytes就能判断一个文件的格式信息。

get()返回的对象有以下几种方法:

  • type() 返回文件类型列表,如图片、文档、可执行文件、压缩文件

  • extension() 返回文件格式列表,如图片中有jpg、png、jpeg

  • mime 以上两种信息都提供,如 image/png

get返回的对象,还能提供检测文件类型与格式,返回布尔值:

  • type_matches() 检测文件类型,,返回布尔值

  • extension_matches() 检测文件格式,返回布尔值

  • mime_matches() 检测文件类型与格式,返回布尔值

使用示例

import fleep

with open("png_image", "rb") as file:    info = fleep.get(file.read(128))


#文件类型
print(info.type)  # ['image']

#文件类型的具体信息(如图片中,具体可分为jpg/png/gif等)
print(info.extension)  # ['png']

#文件类型及具体类型信息
print(info.mime)  # ['image/png']

#检测是否为某种文件类型,返回布尔值
print(info.type_matches("image"))  # True

#检测是否为某种具体的文件类型,返回布尔值
print(info.extension_matches("gif"))  # False

#检测是否为文件类型及具体类型信息,返回布尔值
print(info.mime_matches("image/png"))  # True

支持的格式

Image

bmp、gif、ico、jp2、jpeg、png、psd、webp

Video

avi、flv、mkv、mp4、mpg、wmv

Document

doc、docx、epub、pdf、ppt、xls、xlsx、xml

Executable

com、exe、jar

System

cab、cat、dll、sys、sdb、drv

Database

sqlite

数据采集

文本处理分析

图片数据处理

其他


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存