您当前的位置：首页 > Xavier Jiezou Python

【python】提取pdf文件中的所有图片

Xavier Jiezou 发布时间：2020-11-10 23:38:18 ，浏览量：4

写在前面

一个pdf文件中有很多页，每页有若干张图片，如何将pdf文件中的所有图片提取出来？

安装模块

pip install pymupdf

示例代码

import fitz


def func(doc):
    for i in range(len(doc)):
        imglist = doc.getPageImageList(i)
        for j, img in enumerate(imglist):
            xref = img[0]
            pix = fitz.Pixmap(doc, xref)   # make pixmap from image
            if pix.n - pix.alpha


    
        
            
        
        
            
                
                
                    Xavier Jiezou
                    暂无认证
                
            
            
                
                    
                        4浏览
                        0关注
                        358博文
                        0收益
                    

                    
                        0浏览
                        0点赞
                        0打赏
                        0留言
                    
                
            
            
                私信
                关注
            

        
        
            热门博文
            
                【Python】旋转矩阵与旋转向量的相互转换（OpenCV）
记录配置打印机遇到的三个问题
【PyTorch】切记：GeForce RTX 3090 显卡仅支持 CUDA 11 以上的版本！
Human3.6M 数据集介绍及下载
解决DCNv2在Linux上安装失败的问题
【原创工具 | OpenCV-CamCalib】一个基于 OpenCV 的自动化相机数据采集和标定程序
【Windows】局域网内共享文件夹的设置方法
【Python】根据 URL 读取网络图片的两种方式（OpenCV）
【Linux】Ubuntu 20.04 深度学习 GPU 环境配置（CUDA Toolkit 11.7 + cuDNN v8.4.1）
【Qt for Python】控件显示问题（默认不显示没有父控件的控件）







    [ 申请 ]友情链接：
    
        
        优质稳定机场推荐

        绘画宝宝
        配音宝宝
    


    
        
            关于我们
            服务条款
            广告服务
            联系我们
            网站地图
            免责声明
            WAP
        
        技术支持：
            武汉快勤科技有限公司
            XML网站地图 
            备案号：鄂ICP备18027844号-9
            
        
    




    
        立即登录/注册
        
    
    
        
        微信扫码登录