查看原文
其他

linux中wget并行下载文件的几种姿势

运维贼船 2024-03-28

Editor's Note

作者用心了,很多文章都总结很到位!

The following article is from 入门小站 Author 入门小站


wget可以下载文件。一般使用可以同时下载一个文件,某些时候我们需要下载多个文件,这个时候为了节约时间就需要并行下载文件

使用wget下载文件

使用wget下载文件相当简单:

> wget https://rumenz.com/static/v/v.mp4

这样运行一次只能下载一个文件。

不过我们可以用 shell 脚本来在一个命令中下载多个文件:

#!/bin/bash
while read file; do
    wget ${file}
done < rumenz.txt

rumenz.txt包含所有必须下载的文件,每个文件都有自己的一行:

https://rumenz.com/static/v/v.mp4
https://rumenz.com/static/v/v1.mp4
https://rumenz.com/static/v/v2.mp4

但是这种方法还是串行的下载文件,并不能节省下载时间。我们可以通过并行下载文件来加快速度。

使用 wget并行下载

我们可以通过不同的方式并行制作wget下载文件。

Bash 方法

使用&wget进程发送到后台:

#!/bin/bash
while read file; do
    wget ${file} &
done < rumenz.txt

wget每次调用都被派生到后台并在其自己单独的子 shell 中异步运行。

尽管我们现在并行下载文件,但这种方法不能反馈出错的信息。

wget Fork

使用-b参数,让wget将自己Fork到后台:

#!/bin/bash
while read file; do
    wget ${file} -b
done < rumenz.txt

就像&运算符一样,每个调用都被派生到后台并异步运行。但不同的是-b参数还为我们提供了每次下载的日志文件。我们可以grep这些日志文件来检查没有发生错误。

使用xargs

优雅的解决方案就是使用xargs,可以设置同时运行的最大进程数

#!/bin/bash
cat rumenz.txt | xargs -n 1 -P 2 wget -q

使用-q静默方式。如果不设置xargs会将所有进程的输出重定向到 stdout,会输出很多信息。如果没有发生错误,它将以 0 值退出,否则以 1 值退出。


往期推荐:

Windows系统被养蛊,这些下“崽”器简直神了!


圣诞节来了,教你用各种编程语言手写一棵圣诞树


Jenkins 安装配置教程



继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存