您当前的位置: 首页 >  Python

【python】提取pdf文件中的所有图片

Xavier Jiezou 发布时间:2020-11-10 23:38:18 ,浏览量:3

写在前面

一个pdf文件中有很多页,每页有若干张图片,如何将pdf文件中的所有图片提取出来?

安装模块
pip install pymupdf
示例代码
import fitz


def func(doc):
    for i in range(len(doc)):
        imglist = doc.getPageImageList(i)
        for j, img in enumerate(imglist):
            xref = img[0]
            pix = fitz.Pixmap(doc, xref)   # make pixmap from image
            if pix.n - pix.alpha             
关注
打赏
1688896170
查看更多评论
0.0458s