图片助手(ImageAssistant):一款功能强大的网页图片提取利器

博主是一个平时喜欢在网上下载漂(Mei)亮(Zi)壁纸的人,偶尔会砰见有些网站设置一些障碍阻拦网友下载图片,比如屏蔽右键啦、要求登录啦(登录后又要积分)之类的,还有一种是一个页面放一个图,每看一个图要按一下按钮,一不小心就点到开新窗口的广告了。有些博客网页(如网易、Lofter)有很多美图,也没有啥保存限制,但一个一个下也是很麻烦的事情(人总是很挑剔哈),总之钻木取火是很不方便的,各种曾经的纠结就让博主萌发了做一款专门用来分析网页图片并提供筛选下载功能的扩展的想法。经过超过半年时间的酝酿开发,一款能够初步让博主满意的扩展——图片助手(ImageAssistant)终于完成了。

她是一款怎样的扩展?

她是一款包含网页图片提取、筛选、下载功能的chrome扩展(当然也能运行于各式360浏览器、猎豹浏览器、百度浏览器、UC浏览器、115浏览器等众多定制的浏览器),不论你是网页设计师、程序员还是普通网友,她高效的图片筛选、下载功能都能为你所用。

图片提取

图片来源有两个,页面元素分析及HTTP请求监听。

其中页面元素分析图片提取包含三种模式,一种基本图片提取模式和两种加强提取模式。

在基本提取模式中,提取范围囊括网页中的图片元素SRC地址及包含图片地址的属性值、链接中包含的图片地址、各DOM元素的样式图片、IFRAME框架内容中的图片元素;通过AJAX动态加载的以上各元素属性也在提取范围(页面采用动态延迟载入么?没问题!只要是图片,也是她的菜)。

在某些情况下,网页更原意展示图片的缩略图,而大尺寸的图片则以动态链接的形式呈现给用户,此时可以通过加强模式之预取链接数据来偿试获得图片数据。

在更为罕见的情况下,大尺寸的图片会被嵌在当前链接的新页面中,此时可以通过加强式之分析预取数据来偿试获得更完整的图片数据。

你或许想到了,网页加载图片不一定会放到DOM里,也可能是直接由FLASH加载的,或者被加载后用于绘制到CANVAS上,通过这两种方式加载的图片不就没有办法获取么?其实这两种情形也已经被考虑了,图片提取的另一个数据来源是请求监听,这两种方式加载的图片也能被获取了。

可以说在页面中能够看到的图片元素几乎都能够被提取,哪怕是“丰富多彩”的嵌入式广告所包含的图片也不例外(请先把你的Adblock plus关了)。

图片筛选

扩展提取的图片由单独的筛选页呈现给用户筛选,所有图片都已经按照图片尺寸(面积)由大到小排列了。可供筛选的选项包括图片的类型(BMP、PNG、JPG、GIF、SVG、WEBP、ICO)及可自定义筛选选项的图片大小。

筛选针对大规模图片展示做过优化,内存不是太小的话(不小于8G,图片吃内存啊),一次性容纳五千张供筛选的图片也不会有什么问题(内存不够会被CHROME干掉)。

使用快捷键可以关闭顶部菜单,一来增加预览空间,二来加快操作速度。

哪些场景适合使用她?

设计师迅速获取网页素材,游戏开发人员从网页游戏中提取材质,批量下载壁纸,批量看站点图片……

以下展示几个比较有代表性的使用场景:

批量下载百度壁纸:

批量下载百度壁纸,批量下载桌面壁纸

批量下载百度壁纸,批量下载桌面壁纸

只要你的机器性能够好,内存够大,主要是网络够快的话,一小会儿的功夫下载上千张1080P的壁纸都不是问题。

批量下载百度壁纸,批量下载手机壁纸

批量下载百度壁纸,批量下载手机壁纸

不光是桌面壁纸,只要在百度页面里设定好手机分辨率再用扩展提取,下载大量适合你手机屏幕大小的壁纸也是很简单的事情。

用了她,再也不需要一张一张点开另存为了,下载壁纸是不是变得简单高效呢?

批量下载图片搜索结果:

批量下载图片搜索结果

批量下载图片搜索结果

本篇讨论的是扩展,所以不要问我是怎么打开google的。之前打算在百度上演示这个的,但搜apple后百度更倾向于让我看苹果公司。还是google上靠谱些,搜apple更倾向于给用户展示水果。当然你也可以用这种方式来找适合桌面大小的壁纸啦。

提取微信页面所用素材(原来有这么多看不见的元素啊):

获取微信页面所用素材

获取微信页面所用素材

微信的PC网页登录页是不是很简单呢?用工具扒扒看,哇,原来还隐藏了好多素材。

提取cnBeta中的网页元素,包括嵌入式页面广告:

提取cnBeta中的网页元素,包括嵌入式页面广告

提取cnBeta中的网页元素,包括嵌入式页面广告

哦,这个例子拿cnBeta来试的,关掉Adblock Plus后页面内容“丰富”多了,用工具扒一扒,嵌入式页面广告图片都出来了,功能是不是很强大?cnBeta的广告着实是多啊,加载众多广告所耗费的流量比加页面自身耗费的流量多多了。

批量提取网友收集素材资源:

批量提取网友收集素材资源

批量提取网友收集素材资源

好心的网友在网易博客上发了一些自己收集的PS素材,是不是很喜欢呢?一个页面一个页面点开再一个一个另存为到本地么?白头发都出来了,用工具吧,使用重型武器氢弹后你只需要点击面面列表底部的页码,所有列表里中页面的图片就都被扒下来了。

批量浏览魅族论坛摄影板块中帖子里的图片:

批量浏览魅族论坛摄影板块中帖子里的图片

批量浏览魅族论坛摄影板块中帖子里的图片

这个没什么好说的,有时浮躁了一个个点开看真心受不了,用工具一次性提取所有当前列表中页面所包含的图片看。

提取网页游戏割绳子(Cut The Rope)中用到的材质:

提取网页游戏割绳子(Cut The Rope)中用到的材质

提取网页游戏割绳子(Cut The Rope)中用到的材质

这个游戏都玩过吧?它有网页版的,是不是想看看它是由哪些基本元素组成的(不是做IT的或许就没兴趣了)?用基本模式就能提取到组成游戏的基本元素了。

提取HTML5 3D网页游戏/DEMO中使用的材质:

提取HTML5 3D网页游戏/DEMO中使用的材质

提取HTML5 3D网页游戏/DEMO中使用的材质

这是一个HTML5 CANVAS演示DEMO–3D赛车。没有深入研究过,不过看它用到的贴图材质似乎很厉害的样子。

宅男神器,宅男看图必备,批量浏览妹子图:

宅男神器,宅男看图必备,批量浏览妹子图

宅男神器,宅男看图必备,批量浏览妹子图

上图是用加强模式(氢弹)从一个Lofter归档页中提取的,妹子图是一个宅男们热衷的话题,有工具自然方便多了。

扩展在以上场景中的应用是不是能带来很多便捷呢?更多的使用方式等待你去发掘,你需要做的就是安装她,狠狠地使用她。

如何得到她?

想真实体验到扩展功能及精心设计的细节肯定需要安装它,你可以通过以下方式途径进行安装:

Chrome应用商店:

https://chrome.google.com/webstore/detail/dbjbempljhcmhlfpfacalomonjpalpko

扩展主页:

http://www.pullywood.com/ImageAssistant/

扩展已经提交到猎豹应用商店、360应用商店、百度浏览器应用商店,应该很快能够在里面找到它。

Subscribe
提醒
guest

330 评论
最新
最旧 得票最多
Inline Feedbacks
View all comments
weiguodafu
weiguodafu
1 月 之前

非常感谢你高超的技术和无私奉献

sdsdsd
sdsdsd
1 月 之前

能不能设置一个保存到自定义文件夹的选项。。。

llgs
llgs
3 月 之前

【故障】edge浏览器-保存路径中含有{page.title}标签情况下-无法正常下载

gloryangel
gloryangel
6 月 之前

希望增加右键菜单自定义开关。

打底裤
打底裤
7 月 之前

pinterest保存的图片没标题,最好能用界面的标题命名之,相同详情页的加(1),(2),(3)

Johnfu
Johnfu
10 月 之前

自动向下翻页的功能有时候不稳定,翻不动,但是不知道翻不动的触发原因是什么。
页面:https://www.manhuagui.com/comic/2144/18764.html

有时候,重新安排IA后,会好一段时间,然后用一段时间再出现

xinghuan
xinghuan
11 月 之前

e签宝里面的合同提取不出来啊

123
123
11 月 之前

请问能增加一个导出选中图片的链接的功能么?现在一些网页会在后面加一些限制性的后缀,像长宽、格式啥的,导致下载的图片只是部分或者很难读取,但是只要把这些后缀删了就可以看到原图,大佬能有空更新个“导出选中图片的地址”的功能么么

aigo
aigo
1 年 之前

谷歌浏览器更新之后 不能再创建文件夹来存放图片了 win7的系统 请问这是什么原因?

sumeng
sumeng
1 年 之前

Firefox上的插件好像停留在了1.1.55版本,还是2020年的版本,为什么没有更新啊。

anton
anton
1 年 之前

最近在忙什么嘞~~ 22年冬天起插件好像跟不上时代了哟,提取图片的功能已经不太好用了,跳转google搜图也被禁了好像。祝愿开发者一切平安顺利,腾出功夫帮一帮我等抓瞎中的技术盲。

Fantast
Fantast
1 年 之前

Behance可以抓到10000像素以上的大图,但是需要很久很久的时间,然后会导致多任务抓取的时候被网站限制访问了。所以是不是可以针对某些网站出一些特定的抓取规则呢?微博、pixiv这些热门网站有很多抓图工具,但是Behance或者500px这类网站没有其他更好的工具了。

SSSS
SSSS
1 年 之前

功能需求:
在全部提取的图片中,建议增加可单独“剔除(不包含)”某种尺寸图片的功能,因为一些网站的广告条图片也被提取出来,每次都需要单独删除那些广告条,有点麻烦!

一一一一
一一一一
1 年 之前

请问大佬,我想在钉钉里面的作业流程中下载多项图片,但是因为用插件的话下载下来的都是缩略图,但是我用“多地址提取”功能去提取这些缩略图图片的地址的话,又提取不到,请问这是什么原因?

GNAHZ
GNAHZ
1 年 之前

右键查找图片的其他尺寸不能用了。一直跳到Google

kdls
kdls
1 年 之前

为什么图片不显示原始网页网址了?有时候想引用一下都没辙。

asaki
asaki
1 年 之前

最近chrome自定义输出的图片名字不起作用

111
111
1 年 之前

牛逼啊 很方便

Madman
Madman
1 年 之前

请问如何把京东的avif格式过滤,保存原始不带avif格式图片
就是京东现在自动在图片后面加了avif后缀,如果手工复制链接,删掉.avif格式就会出现原始的.jpg或者.png图片,请问如何不抓取最后的.avif那段

草木灰
草木灰
1 年 之前

作者大大,感谢非常感谢您的作品,我一直以来我主力浏览器是firefox,你的插件的自定义规则部分,只能在chrome下生效。。firefox无法写入自定义规则?作者大大是否有时间考虑给Firefox用户增添下这个功能。。

SGyiji
SGyiji
1 年 之前

如果读取的图片能按照顺序排列就更好了,另外再加个打包下载的功能

Kochiya Sanae
Kochiya Sanae
1 年 之前

大佬,同时下载很多相似图片的时候会只保留最新的那个,有没有什么办法可以关闭去重,去重阈值为0也没有用。

astro
astro
1 年 之前

淘宝和京东商品图片获取不到URL地址???以前的版本好像可以获取到,现在得到的地址都是blob:chrome-extension://这种的,能不能解决这个问题?

99898x
1 年 之前

大佬用你的神器很久了最近喜欢一张图但是这个图是网页切片图,下载下来后都是一张张小碎图,请问有没有办法下载下来后自动合并拼接成一幅完整的大图,感谢 网页地址是这个https://www.artic.edu/artworks/150739/furisode

11 1
11 1
2 年 之前

能够提取视频吗

11 1
11 1
2 年 之前

建议加入打包成压缩包下载,不然会很消耗cpu,很卡

aigo
aigo
2 年 之前

博主 这个插件使用几次就会损坏是为什么

1019735817
1019735817
2 年 之前

博主,有考虑加入打包下载的功能吗?

para
para
2 年 之前

求一个poipiku的图片提取替换规则表达式…
比如说这个页面里的图,https://poipiku.com/90523/6268697.html
点开“すべて表示”之后再开本插件的“氢弹”提取功能,只能得到800宽度的图片(原图基本都超过了1000宽度)本来编程小白想自学一下怎么写规则替换表达式,也问了下别的程序员但他说参照现在已有的规则需要知道$1$2$3这些定义的是什么…求救救

iamlinfei
iamlinfei
2 年 之前

大佬,您的插件非常牛逼,非常感谢. 同时请教个问题:
批量生成提取地址 我写成下面这样http://www.baidu.com/abc/123.html?page=*&hl=zh-Hans ( 见下图)
为什么提示 “”该URL通配符表达式不合法,请输入以http:// 或 https://开头,并包含(*)通配符的表达式。 呢(见下图)

accay
accay
2 年 之前

大佬,能否出个图片切合效果的开关,现在切换照片时的大小缩放效果真的眼晕;还有其他格式下载自动转换png可以改为jpg吗?

Andy
Andy
2 年 之前

新年好,请问对图片鼠标中键不能打开原图了吗?重建chrome前记得是可以的,现在鼠标中键图片打开的是blob:chrome-extension://链接的了。

Last edited 2 年 之前 by Andy
yefan
yefan
2 年 之前

图片选择复制链接的功能怎么变了,这样只能手动找服务器上图片的链接了,,,

rlarum
rlarum
2 年 之前

下载保存时如果有个 UrlDecode 解下码就更完美了,不然下载非英文的都是URL编码过的长文件名。

trackback

[…] 其實Chrome的擴充功能有很多好用的工具,我今天就來分享一個方便又準備的下載圖片功具『圖片助手 ImageAssistant』 […]

TATARA
TATARA
2 年 之前

問下各位有沒有出現尺寸漏斗失效,沒有分辨率選擇,只有個10*10

543.PNG
Stdin
Stdin
2 年 之前

大佬请问保存图像时,文件名中的origin_serial是如何生成的,是否是全局不重复的呢?

cjj
cjj
2 年 之前

blob模式开启后,如果要采用原始文件名,选 {filename} 无效请问能解决吗

huahua
huahua
2 年 之前

请问为什么有些网站在IA里批量下载是“无法下载-没有权限”,但是在网页中右键保存图片是可以下载的?

Yumi
2 年 之前

webp格式如何给位JPG?

blue eyes white dragon
blue eyes white dragon
2 年 之前

最近一段时间,该插件无法在Pixiv下载图片

a2007
a2007
2 年 之前

强烈需求可以下载成链接的路径
比如下载链接comment image.webp
能下载自动创建链接对应的路径/pic/product/20210202122526333.jpg.webp
而不是把不同路径的图片都保存在一个文件夹里

HIMfu
HIMfu
2 年 之前

作者您好,我想问一下在下载图片时,怎么让图片保持它自己的名字而不是我再进行一次重命名,因为有的网站的图片是其站长自己命名好的。现在下载这些图片是按编号排好的命名,有没有可能让图片保持它自己本身的名字呢。

Dane
Dane
2 年 之前

您好,最近好一段时间了,下载总是直接下载到文件夹下,不会和刚开始一样在下载目录下自动建一个文件夹了,试了重装和改动“下载路径“的选项,都不好使,请问还有可能别的地方出问题吗

小和尚
小和尚
2 年 之前

你好,网页有大量图片时,自动下滑速度有些慢,手动直接把滚动条拉到下边图片已经加载出来了,感觉可以增加个自定义滚动速度的功能,不然批量爬图效率就很低了

rainforest
rainforest
2 年 之前

今天用了两次,建立了自动批量下载,结果没一张可以下载,只好在下载列表里,手动一张张重新下载才下成功

xiahuayu
xiahuayu
2 年 之前

blob:https这种开头的图片怎么批量下载

29611286
29611286
2 年 之前

有些图片源地址结束不是以JPG 而是加的.jpg!wd780 像这样的如果替换呢?

prolove
3 年 之前

如何命 名呢?把下划线改为中划线?

jiu
jiu
3 年 之前

大大,谷歌浏览器扩展市场里的插件找不到最新版,目前只有1129版本