查看原文
其他

10行代码,用Python写一个USB“病毒”?

DeepWeaver Python大本营 2019-04-08


参加 2019 Python开发者日,请扫码咨询 ↑↑↑


作者 | DeepWeaver

责编 | Jane


【导语】作者一个突发奇想的 idea,一边研究一边就做出了这个“病毒”,用了 10 行代码就在不知不觉中 Copy 了你的 U盘!此教程仅限于技术学习交流,切莫用于其他不正当用途哦!


昨天突发奇想:当我们把 usb 插进去的时候,能不能自动执行usb上的程序。查了一下,发现只有 windows 上可以,具体的大家也可以搜索(搜索关键词 usb autorun)到。但是,如果当一个 usb 插入时,在后台自动把 usb 里的重要文件神不知鬼不觉地拷贝到本地或者上传到某个服务器,就需要特殊的软件辅助。


于是我心想,能不能用 python 写一个程序,让它在后台运行。每当有 u 盘插入的时候,就自动拷贝其中重要文件。


如何判断U盘的插入与否?



首先我们打开电脑终端,进入 /Volumes 目录,这时候插入 U盘,可以发现它被挂载在了这个目录之下,也就是说,我们只要在固定时间扫描这个目录,当这个目录有新文件夹出现的时候,很可能有 U盘 被插入了。


我的设计是这样的,用 time.sleep(3) 函数,让程序保持运行状态,并且每隔三秒查看一下 /Volumes/ 目录,如果多出来文件夹,就将其拷贝到另外的文件夹。


# encoding=utf-8
from time import sleep
import os, shutil
usb_path = "/Volumes/"
content = os.listdir(usb_path) # os.listdir(路径)返回路径下所有文件以及文件夹的名称
while True:
    new_content = os.listdir(usb_path) #每隔三秒扫描一次/Volumes/
    if new_content != content: # 如果发现异常,即多出一个文件夹,则退出
        break;
    sleep(3)
x = [item for item in new_content if item not in content]
# 找到那个新文件夹,返回包括新文件夹string类型名称的列表,这个表达方法很pythonic
shutil.copytree(os.path.join(usb_path, x[0]), '/Users/home/usb_copy')
# shutil.copytree 把目录下所有东西一股脑复制进/Users/home/usb_copy, 
# 放进了自己的home目录下


就像标题所示,我们真的只用了 10 行(其实是11行,凑个整:)完成了这个“病毒”。我们可以发现 usb 中的目录,在插入半分钟后全部躺在了 home 目录下了。


如何选择性的复制文件?


刚刚我们写了一个很简易的脚本测试了一下这个想法的可行性,但是还是有问题。刚才之所以能把 U盘 中所有文件很快复制进去,是因为U盘中只有两三个文件,大小不超过 15M。如果目标U盘中有很多电影,音乐,这些我们并不需要的文件,我们的程序就应该能跳过它们,仅仅选择一些重要的比如 .docx 比如 .ppt 文件,或者仅仅复制最近修改过的那些文件,或者排除所有大小大于 5M 的文件。我们可以用 python 做到吗?当然!


os.walk 递归文件夹中所有文件


举个例子,我在某目录下创建了 testwalk 文件夹,里面有 file123.txt 三个文件,folder123 三个文件夹,其中 folder1 中有文件 file4.txt 以及 folder4


➜  testwalk touch file1.txt file2.txt file3.txt
➜  testwalk mkdir folder1 folder2 folder3
➜  testwalk cd folder1
➜  folder1 touch file4.txt && mkdir folder4
➜  folder1 cd ..
# 上面创建了这些文件以及文件夹,你也可以在图形界面上创建
# tree 是个很好玩的命令,可以直观地显示文件路径
➜  testwalk tree ./
testwalk/
├── file1.txt
├── file2.txt
├── file3.txt
├── folder1
│   ├── file4.txt
│   └── folder4
├── folder2
└── folder3

4 directories, 4 files


现在我们来测试一下


import os
for root, dirs, files in os.walk("./testwalk/"):
    for name in files:
        print(os.path.join(root, name))
    for name in dirs:
        print(os.path.join(root, name))
-----------------------------------------------------------------------------
运行结果:
./testwalk/folder1/file4.txt
./testwalk/folder1/folder4
./testwalk/file2.txt
./testwalk/file3.txt
./testwalk/file1.txt
./testwalk/folder2
./testwalk/folder3
./testwalk/folder1


root 存放的是当前位置,它会把 ./testwalk/ 下所有的文件夹作为根目录,往下搜索


for root, dirs, files in os.walk("./testwalk/", topdown=False):
    print(root)
./testwalk/folder2
./testwalk/folder3
./testwalk/folder1/folder4
./testwalk/folder1
./testwalk/


单独查看 dirs


for root, dirs, files in os.walk("./testwalk/"):
    for name in dirs:
        print(os.path.join(root, name))

./testwalk/folder2
./testwalk/folder3
./testwalk/folder1
./testwalk/folder1/folder4


单独查看 files


for root, dirs, files in os.walk("./testwalk/", topdown=False):
    for name in files:
        print(os.path.join(root, name))

./testwalk/file2.txt
./testwalk/file3.txt
./testwalk/file1.txt
./testwalk/folder1/file4.txt


好了,我们现在需要递归 usb 文件夹,找到所有的 file,查看大小,如果小于,比如 3M,就拷贝进 home,大于就舍去。


shutil模块


import shutil
>>> help(shutil)
>>> dir(shutil)
['Error''ExecError''SpecialFileError''WindowsError'
'_ARCHIVE_FORMATS''_BZ2_SUPPORTED''_ZLIB_SUPPORTED''__all__',
 '__builtins__''__doc__''__file__''__name__''__package__',
 '_basename''_call_external_zip''_destinsrc''_get_gid''_get_uid',
 '_make_tarball''_make_zipfile''_samefile''abspath'
'collections''copy''copy2''copyfile''copyfileobj',
 'copymode''copystat''copytree''errno''fnmatch'
'get_archive_formats''getgrnam''getpwnam''ignore_patterns'
'make_archive''move''os''register_archive_format''rmtree'
'stat''sys''unregister_archive_format']


好吧,看不懂,还是得看官方文档。


现在我们拿刚才的文件夹举例子,如果想把 file1.txt 拷贝到 folder2:


>>> shutil.copy2('./file1.txt''./folder2')
------------------------------------------------我是分割线-----------
➜  folder2 ls
file1.txt


还有许多使用工具在 shutil 里面这里就不详述了。


os.path.getsize() 判断大小


os.path.getsize(文件名)返回的是一个单位为 byte 的数值,如果用来查看文件大小,我们则需要手动写一个函数,将其换算成容易阅读的形式。


movie = /Users/home/somemovie.rmvb
def convert_bytes(num):
#   this function will convert bytes to MB.... GB... etc
    for x in ['bytes''KB''MB''GB''TB']:
        if num < 1024.0:
            return "%3.1f %s" % (num, x)
        num /= 1024.0

def getDocSize(path):
    try:
        size = os.path.getsize(path)
        return size
    except Exception as err:
        print(err)
print(convert_bytes(getDocSize(movie)))
结果:
1.3 GB
[Finished in 0.1s]


这里我们只要选择文件大小小于 3M 的即可,3M = 3 * 1024kB = 3 * 1024*1024byte


for root, dirs, files in os.walk(os.path.join(usb_path, x[0])): #MyUSB location
    for name in files:
        file = os.path.join(root, name)
        if os.path.getsize(file) < 3*1024*1024:
            shutil.copy2(file, target_folder)


结合 shutil.copy2 就可以把选定大小的文件复制进我们的目标文件夹了


如何指定文件类型


这里就需要正则表达式来帮助我们了。正则表达式内容很多,《python核心编程》中用了整整一章来讲,所以我们也不深入了,感兴趣的可以看一下。


链接:

https://docs.python.org/2/library/re.html


如下,我们让指定文件后缀以及指定文件大小可以复制进我们的目标文件,别忘了导入 re


import re
...
regex_filename = re.compile('(.*zip$)|(.*rar$)|(.*docx$)|(.*ppt$)|(.*xls$)')
for root, dirs, files in os.walk(os.path.join(usb_path, x[0])): #MyUSB location
    for name in files:
        file = os.path.join(root, name)
        if regex_filename.match(file) and os.path.getsize(file) < 1024*1024:
            shutil.copy2(file, target_folder)


用更加复杂的正则表达式可以更好地指定文件类型


根据修改时间筛选文件


>>> from os.path import *
>>> help(getmtime)
getmtime(filename)
    Return the last modification time of a file, reported by os.stat().

>>> help(getctime)
getctime(filename)
    Return the metadata change time of a file, reported by os.stat().


这时候我在目录下创建了一个文件叫做 newfile


>>> getctime("newfile")
1522746383.716875
# 我们可以看到返回的time是从某个时间到现在的秒数,如需阅读,我们需要time.ctime来转换
>>> import time
>>> time.ctime(1522746383.716875)
'Tue Apr  3 17:06:23 2018' # 这就是刚才创建的时间啦
>>> help(time.ctime)ctime(...) # 查看文档
    ctime(seconds) -> string

    Convert a time in seconds since the Epoch to a string in local time.
    This is equivalent to asctime(localtime(seconds)). When the time tuple is


总之,对每一个文件进行修改时间的筛选可以只复制那些近期,或者特定时期修改或者添加过的文件,这个功能在特定情况下很有用。


总结


其实,标题这么起只是为了吸引大家注意,这就是一个小程序,也谈不上病毒。我更想通过这个例子,展示 python 对于文件处理的强大能力,引发大家的学习热情。以上实现都是基于 macos,linux 应该一样,windows 稍加修改也可以成功。


原文链接:

https://zhuanlan.zhihu.com/p/35256334

本文经作者授权转载,禁止二次转载


(*本文为Python大本营转载文章,转载请联系作者)


福利

扫码添加小助手,回复:1,加入Python技术交流群,共享Python学习资料,定时更新。


2019 Python开发者日

敲黑板划重点!7 折优惠限时抢购中,3 月 31 日前可享受优惠价 499,欢迎点击阅读原文报名参加。更多详细信息请咨询13581782348(微信同号)。



你也可以点击阅读原文,查看大会详情。

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存