婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > 使用python處理一萬份word表格簡歷操作

使用python處理一萬份word表格簡歷操作

熱門標簽:鄭州智能外呼系統(tǒng)中心 400電話 申請 條件 南京crm外呼系統(tǒng)排名 汕頭電商外呼系統(tǒng)供應商 賓館能在百度地圖標注嗎 云南地圖標注 北京外呼電銷機器人招商 電銷機器人 金倫通信 crm電銷機器人

前言

有一天朋友A向我抱怨,他的老板要求他把幾百份word填好的word表格簡歷信息整理到excel中,看著他一個個將姓名,年齡……從word表格里復制粘貼到excel里,邊粘貼心里邊暗暗詛咒著自己的boss……但畢竟新手小白,又不能違背老板的意愿說我不干了,愛咋咋地,于是過來向我求助。我說,這事情好辦啊,學學python就能解決啊,簡單容易上手。好了,接下來進入正題。

思路:首先針對每一份word表格進行分析

怎么才能利用python獲取到word表格里面的信息,最初的想法是把word里面的表格轉成網(wǎng)頁格式,畢竟混跡爬蟲淺水區(qū)多年,用正則表達式處理網(wǎng)頁來獲取信息是比較輕松的,于是想到把word轉成網(wǎng)頁格式,這么一想,整個人都瘋了,幾百份文件打開然后轉成網(wǎng)頁,那也有不少勞動量啊。于是在網(wǎng)上搜了許久,發(fā)現(xiàn)docx文件自己本身是壓縮文件,打開壓縮包之后竟然發(fā)現(xiàn)里面有個專門存儲word里面文本的文件。

打開文件找,發(fā)現(xiàn)我們想要的信息全都藏在這個名為document.xml的文件里

于是基本過程就可以確定了

1. 打開docx的壓縮包

2. 獲取word里面的正文信息

3. 利用正則表達式匹配出我們想要的信息

4. 將信息存儲到txt中(txt可以用excel打開)

5. 批量調(diào)用上述過程,完成一萬份簡歷的提取工作

6. (檢查數(shù)據(jù)是否有錯誤或缺失)

0x01 獲取docx信息

利用python的zipfile庫以及re庫來處理docx壓縮包里面的document.xml文件里的信息。

import zipfile
import re
def get_document(filepath):
  z = zipfile.ZipFile(filepath, "r")
  text = z.read("word/document.xml").decode("UTF-8")
  text = re.sub(r".*?>", "", text)#去除xml里的所有標記符
  ###如果多份簡歷在同一個word文件里###
  #table_list = text.split("XX簡歷")[1:]#依據(jù)簡歷標題切分每一份簡歷信息
  #return table_list
  return text

打印text的結果

自此,輸出了簡歷中的所有相關信息

0x02 抓取各字段值

接下來根據(jù)這些相關信息抓取各個字段的值

import re
def get_field_value(text):
  value_list = []
  m = re.findall(r"姓 名(.*?)性  別", table)
  value_list.append(m)
  m = re.findall(r"性  別(.*?)學  歷", table)
  value_list.append(m)
  m = re.findall(r"民 族(.*?)健康狀況", table)
  value_list.append(m)  
  '''
  此處省略其他字段匹配
  '''
  return value_list

這樣就將每個字段匹配到的內(nèi)容以一個列表的形式返回了

0x03 將內(nèi)容寫入到文件

接下來將這個列表里的內(nèi)容寫入到txt中

str1 = ""
for value in value_list:
  str1 = str1 + str(value[0]) + "\t"#每個字段值用制表符\t分隔
str1 = str1 + "\n"
with open("result.txt", "a+") as f:#將內(nèi)容以追加形式寫入到result.txt中
  f.write(str1)

以上是將一個word轉成了txt

只要再對文件夾中的文件進行批量處理就ok了

0x04 批量處理完整代碼

以下附上完整代碼

import re
import zipfile
import os
def get_document(filepath):
  z = zipfile.ZipFile(filepath, "r")
  text = z.read("word/document.xml").decode("UTF-8")
  text = re.sub(r".*?>", "", text)#去除xml里的所有標記符
  ###如果多份簡歷在同一個word文件里###
  table_list = text.split("XX簡歷")[1:]#依據(jù)簡歷標題切分每一份簡歷信息
  return table_list
def get_field_value(text):
  value_list = []
  m = re.findall(r"姓 名(.*?)性  別", table)
  value_list.append(m)
  m = re.findall(r"性  別(.*?)學  歷", table)
  value_list.append(m)
  m = re.findall(r"民 族(.*?)健康狀況", table)
  value_list.append(m)  
  '''
  此處省略其他字段匹配
  '''
  return value_list
cv_list = []
for i in os.listdir(os.getcwd()):
  a = os.path.splitext(os.getcwd() + "\\" + i)#獲取當前目錄下所有文件的文件名
  if a[1] == '.docx':#如果文件后綴
    print(os.getcwd()+"\\"+i)
    cv_list = cv_list + get_document(os.getcwd() + "\\" + i)#每份簡歷信息為一個列表元素
for i in cv_list:
  value_list = get_field_value(i)
  str1 = ""
  for value in value_list:
    str1 = str1 + str(value[0]) + "\t"
  str1 = str1 + "\n"
  with open("result.txt", "a+") as f:
    f.write(str1)

一萬份word表格簡歷信息轉成了txt,然后用excel打開txt即可。

補充:python word表格一些操作

數(shù)據(jù)格式(datas): 列表套列表

aa =[ [1,2,3,4,5],[6,7,8,9],[]…]
import os
import requests
import json
import datetime
from docx import Document
from docx.shared import Inches, Pt, Cm
from docx.oxml.ns import qn
from docx.enum.text import WD_PARAGRAPH_ALIGNMENT
def create_insert_word_table(datas, stday, etday, s):
  """創(chuàng)建word表格以及插入數(shù)據(jù)"""
  doc = Document()
  doc.styles['Normal'].font.name = 'Calibri' # 是用來設置當文字是西文時的字體,
  doc.styles['Normal']._element.rPr.rFonts.set(qn('w:eastAsia'), u'宋體') # 是用來設置當文字是中文時的字體
  # doc.styles['Normal'].font.size = Pt(14) # 設置所有文字字體大小為14
  distance = Inches(0.5)
  sec = doc.sections[0] # sections對應文檔中的“節(jié)”
  sec.left_margin = distance # 以下依次設置左、右、上、下頁面邊距
  sec.right_margin = distance
  sec.top_margin = distance
  sec.bottom_margin = distance
  sec.page_width = Inches(11.7) # 設置頁面寬度
  # sec.page_height = Inches(9) # 設置頁面高度
  # doc.add_heading() # 設置標題,但是不符合我的條件,只能試用下方p.add_run('我是文字')
  p = doc.add_paragraph() # 添加段落
  p.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER # 設置中央對齊
  run = p.add_run('我是文字')
  run.font.size = Pt(22)
  doc.add_paragraph() # 添加空段落
  # 添加表格
  table = doc.add_table(rows=1, cols=10, style='Table Grid')
  table.style.name = 'Table Grid'
  table.style.font.size = Pt(14)
  table.rows[0].height = Cm(20)
  title = table.rows[0].cells
  title[0].text = '姓名'
  title[1].text = '1'
  title[2].text = '2'
  title[3].text = '3'
  title[4].text = '4'
  title[5].text = '5'
  title[6].text = '6 '
  title[7].text = '7'
  title[8].text = '8'
  title[9].text = '9'
  for i in range(len(datas)):
    cels = table.add_row().cells
    for j in range(len(datas[i])):
      # cels[j].text = str(datas[i][j])
      p = cels[j].paragraphs[0]
      p.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER # 設置中央對齊
      p.add_run(str(datas[i][j]))
      ph_format = p.paragraph_format
      # ph_format.space_before = Pt(10) # 設置段前間距
      # ph_format.space_after = Pt(12) # 設置段后間距
      ph_format.line_spacing = Pt(40) # 設置行間距
  doc.save('./files/項目總結.docx')

生成示例

可能出現(xiàn)的錯誤,[Errno 13] Permission denied: ‘./files/項目進展總結.docx'

是因為你打開文件未關閉,操作不了,關閉他就好了

以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方,望不吝賜教。

您可能感興趣的文章:
  • 使用Python 統(tǒng)計文件夾內(nèi)所有pdf頁數(shù)的小工具
  • 20行Python代碼實現(xiàn)一款永久免費PDF編輯工具的實現(xiàn)
  • 用python 制作圖片轉pdf工具
  • Python開發(fā)的單詞頻率統(tǒng)計工具wordsworth使用方法
  • Python快速優(yōu)雅的批量修改Word文檔樣式
  • python提取word文件中的所有圖片
  • 教你如何利用Python批量翻譯英文Word文檔并保留格式
  • 詳解用Python把PDF轉為Word方法總結
  • python 三種方法提取pdf中的圖片
  • 只用40行Python代碼就能寫出pdf轉word小工具

標簽:錫林郭勒盟 梅州 石家莊 懷化 浙江 西寧 文山 昆明

巨人網(wǎng)絡通訊聲明:本文標題《使用python處理一萬份word表格簡歷操作》,本文關鍵詞  使用,python,處理,一萬,份,;如發(fā)現(xiàn)本文內(nèi)容存在版權問題,煩請?zhí)峁┫嚓P信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《使用python處理一萬份word表格簡歷操作》相關的同類信息!
  • 本頁收集關于使用python處理一萬份word表格簡歷操作的相關信息資訊供網(wǎng)民參考!
  • 推薦文章
    婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av
    三级成人在线视频| 欧美日韩免费高清一区色橹橹| 91麻豆国产福利在线观看| 国产高清久久久久| 成人一区二区三区| 在线一区二区三区四区五区 | 欧美精品乱人伦久久久久久| 日韩女优电影在线观看| 26uuu精品一区二区| 亚洲精品一二三| 美女高潮久久久| 99在线视频精品| 国产一区二区h| 91激情五月电影| 日韩欧美国产三级| 亚洲精品日韩一| 国产馆精品极品| 成人福利视频在线| 91精品国产91热久久久做人人| 国产调教视频一区| 午夜电影久久久| 成人免费的视频| 久久久久久久久免费| 91黄色免费版| 中文字幕一区二区三区不卡| 国内精品伊人久久久久av影院| 91福利在线看| 亚洲视频在线一区| 国产精品 日产精品 欧美精品| 天堂av在线一区| 99久久免费国产| 亚洲免费观看高清| 不卡av在线网| 欧美激情自拍偷拍| 国产一区二区三区高清播放| av午夜精品一区二区三区| 中文字幕av一区二区三区高 | 欧美伊人久久久久久久久影院 | 亚洲国产欧美另类丝袜| 高清成人免费视频| 精品国产免费人成电影在线观看四季| 一二三区精品视频| 欧美三级电影在线观看| 日韩毛片高清在线播放| 成人激情文学综合网| 亚洲欧洲日韩综合一区二区| 久久国产日韩欧美精品| 日韩欧美一二三| 国产在线视频精品一区| 色综合久久中文综合久久97| 国产精品美女久久久久久久| 97超碰欧美中文字幕| 国产精品久久久一区麻豆最新章节| 福利一区在线观看| 亚洲桃色在线一区| 色综合久久久久久久久| 午夜久久久久久久久久一区二区| 国产精品久久看| 欧美日韩国产精品自在自线| 欧美xxxxx牲另类人与| 国产中文字幕一区| 亚洲色图欧美在线| 欧美日韩久久一区二区| 久久99精品久久只有精品| 欧美国产精品中文字幕| 欧美亚洲丝袜传媒另类| 久久国产精品99久久人人澡| 在线观看网站黄不卡| 蜜臀av一区二区三区| 国产精品女同一区二区三区| 欧美性猛交xxxxxxxx| 亚洲观看高清完整版在线观看 | 韩国理伦片一区二区三区在线播放| 日韩情涩欧美日韩视频| 国产精品一区二区在线看| 亚洲人成亚洲人成在线观看图片 | 粉嫩aⅴ一区二区三区四区五区| 亚洲欧美色图小说| 欧美va天堂va视频va在线| 激情综合五月天| 亚洲视频一区在线观看| 久久综合99re88久久爱| 91污在线观看| 狠狠色2019综合网| 亚洲成在人线免费| 亚洲视频一二三区| 久久久99精品免费观看不卡| 91精品国产黑色紧身裤美女| 色综合久久99| 成人黄色大片在线观看| 另类综合日韩欧美亚洲| 一二三区精品福利视频| 欧美日韩中文字幕一区| 国产成人综合亚洲网站| 久久国产剧场电影| 亚洲电影一级片| 亚洲欧美日韩系列| 欧美国产欧美亚州国产日韩mv天天看完整| 欧美视频你懂的| 在线视频国产一区| www.欧美日韩国产在线| 麻豆精品一区二区综合av| 欧美一级黄色录像| 欧美日韩高清影院| 欧美午夜寂寞影院| 色综合色综合色综合色综合色综合| 欧美一级一区二区| 日韩三级中文字幕| 欧美一三区三区四区免费在线看| 在线视频综合导航| 国产天堂亚洲国产碰碰| 久久综合五月天婷婷伊人| 欧美电影免费观看高清完整版在线观看| 在线看日韩精品电影| 欧美性猛交xxxxxxxx| 欧美日韩一级片在线观看| 欧美在线视频你懂得| 91在线观看免费视频| 92精品国产成人观看免费 | 国产午夜精品美女毛片视频| 精品国产不卡一区二区三区| 久久综合999| 中文字幕va一区二区三区| 国产精品色哟哟网站| 亚洲无线码一区二区三区| 一区二区三区免费看视频| 一区二区三区四区国产精品| 亚洲综合一区二区三区| 午夜久久电影网| 久久成人综合网| 成人av在线资源网站| 欧美伊人久久大香线蕉综合69| 欧美日韩国产一区二区三区地区| 这里只有精品视频在线观看| 欧美不卡一二三| 国产精品久久久久久久久免费桃花 | 一区二区三区不卡视频在线观看| 国产精品一区二区免费不卡| 国产传媒欧美日韩成人| 久久久久久免费毛片精品| 国内精品嫩模私拍在线| 久久众筹精品私拍模特| 国产成人在线看| 中文字幕亚洲一区二区av在线 | 成人一二三区视频| 国产视频一区不卡| 成a人片国产精品| 亚洲女同女同女同女同女同69| 99精品国产一区二区三区不卡 | xf在线a精品一区二区视频网站| 首页国产丝袜综合| 日韩免费视频一区| 国产精品99久久久久久久女警| 国产人妖乱国产精品人妖| 国产精品一区不卡| 中文字幕在线不卡一区| 色中色一区二区| 亚洲bt欧美bt精品| 国产欧美日韩在线| 一本大道久久a久久综合婷婷| 亚洲一区二区精品久久av| 欧美午夜精品一区二区蜜桃 | 国产欧美日韩在线看| 97国产精品videossex| 亚洲妇女屁股眼交7| 欧美电视剧在线观看完整版| 高清在线不卡av| 亚洲福利一二三区| 2014亚洲片线观看视频免费| 波波电影院一区二区三区| 亚洲男人天堂av网| 精品国产乱码久久久久久免费| 国产丶欧美丶日本不卡视频| 亚洲免费成人av| 久久久久国产精品麻豆| 91福利视频网站| 国产在线播精品第三| 亚洲一区二区欧美激情| 国产夜色精品一区二区av| 在线观看网站黄不卡| 懂色av中文一区二区三区| 天天色 色综合| 中文字幕在线观看一区| 精品国产一二三| 欧美日韩的一区二区| 成人h动漫精品一区二| 麻豆中文一区二区| 亚洲黄色性网站| 国产欧美精品国产国产专区 | 99国产精品久久久久久久久久| 天天亚洲美女在线视频| 国产精品久久久99| 337p粉嫩大胆噜噜噜噜噜91av| 色婷婷av一区二区三区之一色屋| 久久成人久久爱| 亚洲一区二区三区四区在线观看 | 26uuu国产日韩综合| 欧美高清激情brazzers| 欧美午夜一区二区三区| 成人激情图片网|