婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁(yè) > 知識(shí)庫(kù) > python提取word文件中的所有圖片

python提取word文件中的所有圖片

熱門標(biāo)簽:沈陽(yáng)防封電銷卡品牌 沈陽(yáng)外呼系統(tǒng)呼叫系統(tǒng) 江西省地圖標(biāo)注 富錦商家地圖標(biāo)注 武漢外呼系統(tǒng)平臺(tái) 外呼系統(tǒng)哪些好辦 沈陽(yáng)人工外呼系統(tǒng)價(jià)格 池州外呼調(diào)研線路 如何申請(qǐng)400電話費(fèi)用

前言

辦公中,偶爾會(huì)碰到一種情況,需要提取word文檔中的圖片,決定寫這樣一款工具自動(dòng)提取圖片。
關(guān)于腳本的使用:
情景1:如果你拿到的是一個(gè)文件夾,所有的word文件都在這個(gè)文件夾的子目錄下,深度為1層,你可以直接使用該腳本
情景2:如果你拿到的是一個(gè)文件夾,打開之后,里面雜亂無(wú)章的充斥著各種文件,你也不確定word文檔都在哪,那么你需要使用Everything來(lái)手動(dòng)提取出所有的word文檔,雖然我也可以讓腳本實(shí)現(xiàn)這個(gè)功能,但是使用腳本需要考慮到有可能存在同名文件,再處理起來(lái)代碼量會(huì)更大,還是用Everything手動(dòng)移動(dòng)文件吧,誰(shuí)讓現(xiàn)在的代碼量已經(jīng)遠(yuǎn)超我預(yù)期了呢?
3:預(yù)處理前面的兩步之后,就可以直接運(yùn)行腳本了
4:腳本注釋很詳細(xì),這里不再贅述
5:目前僅支持docx格式的,主要原因是,如果支持doc的話,需要把doc轉(zhuǎn)為docx,轉(zhuǎn)換略慢,并且,我也用不到。如果你感興趣的話,我再最下面介紹了互轉(zhuǎn)的方法,你可以把這個(gè)函數(shù)加進(jìn)去即可

代碼

import zipfile
import os
import shutil
import hashlib
import send2trash

'''
假設(shè)所有的word文檔存放在某路徑中,這個(gè)路徑中包含各種雜七雜八的玩意
使用Everything,或者"篩選文件.py"把所有的docx文件移動(dòng)到C:\\Users\\asuka\\Desktop\\123
逐個(gè)解壓每個(gè)docx文檔,并提取圖片

強(qiáng)烈建議使用Everything用來(lái)篩選出所有的word文檔,這樣假如有兩個(gè)重名的文檔,可以手動(dòng)處理
如果編寫軟件來(lái)實(shí)現(xiàn)的話,會(huì)麻煩很多
'''


# 一個(gè)用來(lái)解壓文件的函數(shù)
def extract_zip(zip_path):
    os.chdir(os.path.dirname(zip_path))  # 需要進(jìn)入到這個(gè)路徑下,這樣解壓的文件,才在這個(gè)路徑下
    a = zipfile.ZipFile(zip_path)  # 調(diào)用zipfile.ZipFile()函數(shù),創(chuàng)建一個(gè)ZipFile對(duì)象
    a.extractall()
    a.close()
    os.chdir(path)  # 恢復(fù)到之前的路徑


# 用來(lái)獲取所有的圖片
'''
測(cè)試的時(shí)候發(fā)現(xiàn),不同word文件解壓之后,里面的圖片命名格式一致,
導(dǎo)致不能直接移動(dòng)圖片,否則會(huì)造成文件覆蓋,這里需要對(duì)找到的每一個(gè)文件,進(jìn)行重命名
'''


def get_picture(demo_path):
    count = 1  # 用來(lái)個(gè)圖片進(jìn)行重命名
    for current_folder, list_folders, files in os.walk(demo_path):
        for f in files:
            if f.endswith('png') or f.endswith('jpg') or f.endswith('jpeg'):  # 設(shè)置圖片類型是這種
                move_f = current_folder + '\\' + f  # 給出要移動(dòng)的文件的路徑
                new_file_path = path1 + '\\' + str(count) + '.' + f.rpartition('.')[-1]  # 指定新文件的文件路徑,文件名數(shù)字遞增,文件后綴
                shutil.move(move_f, new_file_path)  # 移動(dòng)文件
                count += 1
    print('[-] 總共獲取圖片{}張'.format(count - 1))


# 對(duì)圖片去重
# 計(jì)算每個(gè)圖片的md5值,據(jù)此進(jìn)行去重,去重的文件會(huì)被刪除到回收站中
def only_one(test_path):
    md5_list = []
    count = 0
    for current_folder, list_folders, files in os.walk(test_path):
        for file in files:
            picture_path = current_folder + '\\' + file  # 獲取每個(gè)圖片的路徑
            f = open(picture_path, 'rb')  # 開始計(jì)算每個(gè)圖片的md5值
            md5obj = hashlib.md5()
            md5obj.update(f.read())
            get_hash = md5obj.hexdigest()
            f.close()
            md5_value = str(get_hash).upper()
            # 開始去重
            if md5_value in md5_list:
                send2trash.send2trash(picture_path)  # 如果這個(gè)文件的md5值曾經(jīng)出現(xiàn)過(guò),就刪除這張圖片
                count += 1
                print('[-] 刪除重復(fù)圖片:' + str(file))
            else:
                md5_list.append(md5_value)  # 如果這個(gè)圖片的md5值不存在列表中,就添加進(jìn)列表中
    print('[-] 共刪除重復(fù)圖片:{}張'.format(count))


print('[+] 只有后綴是docx的word文檔才可以提取圖片!!!')
path = input('[+] 請(qǐng)輸入word文檔所在文件夾:')  # 獲取原始的word文檔所在路徑
os.chdir(path)

print("[+] 請(qǐng)輸入一個(gè)路徑,用來(lái)存放所有的圖片")
print("[+] 或者按回車鍵,我將自動(dòng)把圖片整理之后存放在你的桌面")
path1 = input('')  # path1 用來(lái)存放所有的圖片文件
if len(path1):
    pass
else:
    desktop_path = os.path.join(os.path.expanduser("~"), 'Desktop')  # 獲取桌面路徑
    path1 = os.path.join(desktop_path, '所有word文件中的圖片')
    os.makedirs(path1)

files = os.listdir(path)  # 獲取指定文件夾下的所有文件
for file in files:  # 遍歷指定文件夾下的所有文件
    if file.endswith('docx'):  # 加一個(gè)判斷,這樣即使path路徑下有別的類型文件也無(wú)妨
        filename = file.rpartition('.')[0]  # 獲取文件的文件名
        file_path = os.path.join(path, filename)
        os.makedirs(file_path)  # 為獲取到的文件名創(chuàng)建一個(gè)文件夾
        shutil.move(file, file_path)  # 把word文檔移動(dòng)到同名文件夾中
        word_path = os.path.join(file_path, file)  # 獲取此時(shí)word文件的文件路徑
        extract_zip(word_path)  # 不用改后綴,直接解壓docx文件

get_picture(path)
only_one(path1)
print('[-] 現(xiàn)有圖片:{}張'.format(len(os.listdir(path1))))

GIF示例


Everything提取文件的演示(手動(dòng)處理同名word文件,我這里對(duì)同名文件進(jìn)行替換):

附:doc轉(zhuǎn)docx

介紹一下實(shí)現(xiàn)二者互轉(zhuǎn)
需要說(shuō)明的是:
要安裝OFFICE,如果是使用金山WPS的,則還不能應(yīng)用
轉(zhuǎn)換速度略慢,但還能接受
如果想轉(zhuǎn)換為其他格式文件,需要在format文件名內(nèi)修改,并用如下save as 參數(shù)

代碼

關(guān)于第9行、第19行代碼:

第9行doc.SaveAs("{}x".format(fn), 12)
"{}x".format(fn)相當(dāng)于把C:\Users\asuka\Desktop\11\123.doc變成了C:\Users\asuka\Desktop\11\123.docx,首先是指定了路徑和文件名,然后12表示存儲(chǔ)成docx格式的,保證了后綴名和格式是對(duì)應(yīng)的。

第19行doc.SaveAs("{}".format(fn[:-1]), 0)
"{}".format(fn[:-1])相當(dāng)于把C:\Users\asuka\Desktop\11\456.docx變成了C:\Users\asuka\Desktop\11\456.doc,指定了要另外保存的文件,保存的路徑和文件名,然后0表示存儲(chǔ)成doc格式的,保證了后綴名和格式是對(duì)應(yīng)的。

from win32com import client


# 轉(zhuǎn)換doc為docx
def doc2docx(fn):
    word = client.Dispatch("Word.Application")  # 打開word應(yīng)用程序
    # for file in files:
    doc = word.Documents.Open(fn)  # 打開word文件
    doc.SaveAs("{}x".format(fn), 12)  # 另存為后綴為".docx"的文件,其中參數(shù)12或16指docx文件
    doc.Close()  # 關(guān)閉原來(lái)word文件
    word.Quit()


# 轉(zhuǎn)換docx為doc
def docx2doc(fn):
    word = client.Dispatch("Word.Application")  # 打開word應(yīng)用程序
    # for file in files:
    doc = word.Documents.Open(fn)  # 打開word文件
    doc.SaveAs("{}".format(fn[:-1]), 0)  # 另存為后綴為".docx"的文件,其中參數(shù)0指doc
    print(fn[:-1])
    doc.Close()  # 關(guān)閉原來(lái)word文件
    word.Quit()


doc2docx(r'C:\Users\asuka\Desktop\11\123.doc')
docx2doc(r'C:\Users\asuka\Desktop\11\456.docx')

到此這篇關(guān)于python提取word文件中的所有圖片的文章就介紹到這了,更多相關(guān)python提取word圖片內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • 使用Python 統(tǒng)計(jì)文件夾內(nèi)所有pdf頁(yè)數(shù)的小工具
  • 20行Python代碼實(shí)現(xiàn)一款永久免費(fèi)PDF編輯工具的實(shí)現(xiàn)
  • 用python 制作圖片轉(zhuǎn)pdf工具
  • Python開發(fā)的單詞頻率統(tǒng)計(jì)工具wordsworth使用方法
  • Python快速優(yōu)雅的批量修改Word文檔樣式
  • 教你如何利用Python批量翻譯英文Word文檔并保留格式
  • 詳解用Python把PDF轉(zhuǎn)為Word方法總結(jié)
  • 使用python處理一萬(wàn)份word表格簡(jiǎn)歷操作
  • python 三種方法提取pdf中的圖片
  • 只用40行Python代碼就能寫出pdf轉(zhuǎn)word小工具

標(biāo)簽:潛江 株洲 通遼 阿里 銅川 呂梁 黑龍江 常德

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《python提取word文件中的所有圖片》,本文關(guān)鍵詞  python,提取,word,文件,中的,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《python提取word文件中的所有圖片》相關(guān)的同類信息!
  • 本頁(yè)收集關(guān)于python提取word文件中的所有圖片的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av
    99久久免费国产| 国产一区在线观看视频| 美国三级日本三级久久99| 91.xcao| 亚洲日本一区二区三区| 91在线观看成人| 94色蜜桃网一区二区三区| 中文字幕在线不卡视频| 色哟哟在线观看一区二区三区| av在线播放一区二区三区| 亚洲精品国产品国语在线app| 日韩情涩欧美日韩视频| 成人午夜视频网站| 亚洲gay无套男同| 亚洲同性gay激情无套| 欧美一区二区性放荡片| 色综合久久久久| 成人性视频免费网站| ㊣最新国产の精品bt伙计久久| 日韩免费性生活视频播放| 99精品热视频| 国产69精品久久99不卡| 日韩制服丝袜先锋影音| 午夜精品福利一区二区三区av| 日本不卡一二三区黄网| 婷婷丁香激情综合| 亚洲精品国产精华液| 夜夜嗨av一区二区三区网页| 中文字幕一区二区三中文字幕| 欧美a级一区二区| 亚洲国产精品成人综合色在线婷婷| 久久综合色婷婷| 久久综合色8888| 久久你懂得1024| 国产精品美女久久久久久| 久久久精品2019中文字幕之3| 亚洲欧美日韩精品久久久久| 日本欧美韩国一区三区| 亚洲成在线观看| 日韩精品电影在线| 午夜av电影一区| 精品伊人久久久久7777人| 蜜桃免费网站一区二区三区| 秋霞电影一区二区| 亚洲免费av高清| 一区二区三区中文字幕在线观看| 成人黄色在线视频| 国产精品综合二区| 91视频免费看| 在线视频欧美精品| 欧美精品一区视频| 激情亚洲综合在线| 亚洲激情五月婷婷| 9人人澡人人爽人人精品| 欧美大尺度电影在线| 一区二区三区高清不卡| 成人av电影免费观看| 久久久久久久电影| 九九**精品视频免费播放| 欧美一区二区三区影视| 亚洲视频电影在线| 国产精品77777| 日韩午夜电影在线观看| 香蕉加勒比综合久久| 视频在线观看一区二区三区| 麻豆91小视频| 欧美日韩色综合| 91精品国产高清一区二区三区蜜臀| 亚洲综合色婷婷| 一本大道久久精品懂色aⅴ| 在线播放中文字幕一区| 中文字幕电影一区| 免费成人av资源网| 在线看不卡av| 中文字幕成人在线观看| 日韩主播视频在线| 99久久99久久综合| 亚洲人精品午夜| caoporm超碰国产精品| 亚洲激情男女视频| 91亚洲午夜精品久久久久久| 国产精品视频一区二区三区不卡| 成a人片国产精品| 日韩欧美一级在线播放| 亚洲一区二区av电影| av一本久道久久综合久久鬼色| 亚洲图片激情小说| 99久久99久久久精品齐齐| 久久精品视频一区二区| wwww国产精品欧美| 蜜臀久久99精品久久久久宅男 | 欧美日韩综合一区| 麻豆91免费看| 91网页版在线| 亚洲一区二区视频在线| 91精品国产综合久久福利软件| 国产精品第13页| 成人avav影音| 奇米精品一区二区三区在线观看| 色婷婷精品久久二区二区蜜臂av| 欧美国产欧美亚州国产日韩mv天天看完整| 性做久久久久久免费观看欧美| 精品国产91乱码一区二区三区| 日韩午夜激情av| 精品一区精品二区高清| 久久精品亚洲麻豆av一区二区 | 不卡的av在线播放| 日韩一区二区三区三四区视频在线观看 | 奇米精品一区二区三区四区| 欧美经典三级视频一区二区三区| 一区二区三区在线观看国产| 欧美一区二区免费视频| 亚洲大片在线观看| 欧美大黄免费观看| 成人免费观看av| 午夜精品影院在线观看| 精品福利一区二区三区免费视频| 欧美精品v国产精品v日韩精品 | 欧美一区二区三区白人| 婷婷中文字幕综合| 久久久午夜电影| 色综合中文综合网| 粉嫩aⅴ一区二区三区四区| 亚洲精品国产高清久久伦理二区| 精品国产乱码久久久久久图片| 不卡视频在线看| 天天综合天天综合色| 自拍偷拍欧美激情| 欧美一级在线观看| 欧美三级视频在线| 色成人在线视频| 成人精品国产福利| 蜜桃视频一区二区三区| 亚洲免费伊人电影| 国产视频一区二区在线观看| 日韩一卡二卡三卡四卡| 久久蜜桃一区二区| 国产网红主播福利一区二区| 久久久久99精品国产片| 国产精品少妇自拍| 久久久久9999亚洲精品| 日韩女优毛片在线| 精品国产一区二区三区久久影院| 五月天国产精品| 老司机精品视频线观看86| 秋霞国产午夜精品免费视频| 麻豆成人久久精品二区三区小说| 福利一区在线观看| 91久久一区二区| 久久国产剧场电影| 国产精品一区二区久久不卡| 国产一区二区三区四| 亚洲精品高清在线| 亚洲人成精品久久久久久| 国产日韩精品一区二区浪潮av | 久草这里只有精品视频| 日本亚洲三级在线| 老色鬼精品视频在线观看播放| 国产成人在线网站| 99精品久久免费看蜜臀剧情介绍| 欧美日韩午夜在线| 欧美在线观看一二区| 91精品国产欧美一区二区| 久久精品夜色噜噜亚洲aⅴ| 91精品在线免费| 国产精品免费久久久久| 亚洲在线免费播放| 成人中文字幕电影| 欧美三区免费完整视频在线观看| 精品国产3级a| 亚洲综合丝袜美腿| 亚洲精品久久7777| 欧美剧情片在线观看| 国产午夜精品一区二区 | 亚洲国产乱码最新视频| 国产一区高清在线| 久久久亚洲高清| 国产揄拍国内精品对白| 91精品国产一区二区三区香蕉| 亚洲综合自拍偷拍| 欧美色图片你懂的| 午夜精品福利一区二区蜜股av| 国产91丝袜在线18| 国产精品久久久久四虎| 最新不卡av在线| 成人精品国产一区二区4080| 欧美日韩国产一级片| 亚洲乱码国产乱码精品精可以看| 亚洲综合自拍偷拍| 国产精品一区免费在线观看| 精品久久久久久久久久久久包黑料| 一区视频在线播放| 婷婷综合在线观看| 一本大道久久a久久精二百| 欧美国产精品专区| 国产精品一区二区在线播放| 日韩午夜中文字幕| 日本va欧美va瓶| 欧美一级二级三级乱码| 午夜精品久久久久久久|