python 으로 MS Word 를 처리 하 는 실례 설명

3930 단어 python 처리 하 다.MS Word

python 도 구 를 사용 하여 MS Word 파일(docx 와 doc 파일)을 읽 고 쓰 는데 주로 python-docx 패 키 지 를 사용 합 니 다.본 고 는 자주 사용 하 는 조작 을 제시 하고 하나의 사례 를 완성 하여 모두 가 신속하게 착수 하도록 도와 준다.
설치 하 다.
pyhton 에서 docx 파일 을 처리 하려 면 python-docx 패 키 지 를 사용 해 야 합 니 다.pip 도 구 를 이용 하여 쉽게 설치 할 수 있 습 니 다.pip 도 구 는 python 설치 경로 의 Scripts 폴 더 에 있 습 니 다.


pip install python-docx

물론 당신 도 easy 를 선택 할 수 있 습 니 다.설치
파일 내용 쓰기
여기 서 우 리 는 직접 하나의 사례 를 제시 하여 자신의 수요 에 따라 유용 한 내용 을 발췌 한다.


#coding=utf-8
from docx import Document
from docx.shared import Pt
from docx.shared import Inches
from docx.oxml.ns import qn
#    
document = Document()
#         
document.add_heading(u'MS WORD    ',0)
document.add_heading(u'    ',1)
document.add_heading(u'    ',2)
#    
paragraph = document.add_paragraph(u'        ！')
#    
run = paragraph.add_run(u'    、')
run.font.size = Pt(24)
#    
run = paragraph.add_run('Set Font,')
run.font.name = 'Consolas'
#      
run = paragraph.add_run(u'      、')
run.font.name=u'  '
r = run._element
r.rPr.rFonts.set(qn('w:eastAsia'), u'  ')
#    
run = paragraph.add_run(u'  、')
run.italic = True
#    
run = paragraph.add_run(u'  ').bold = True
#    
document.add_paragraph('Intense quote', style='Intense Quote')
#      
document.add_paragraph(
 u'      1', style='List Bullet'
)
document.add_paragraph(
 u'      2', style='List Bullet'
)
#      
document.add_paragraph(
 u'      1', style='List Number'
)
document.add_paragraph(
 u'      2', style='List Number'
)
#    （      image.bmp，            ）
document.add_picture('image.bmp', width=Inches(1.25))
#    
table = document.add_table(rows=1, cols=3)
hdr_cells = table.rows[0].cells
hdr_cells[0].text = 'Name'
hdr_cells[1].text = 'Id'
hdr_cells[2].text = 'Desc'
#   3     
for i in xrange(3):
 row_cells = table.add_row().cells
 row_cells[0].text = 'test'+str(i)
 row_cells[1].text = str(i)
 row_cells[2].text = 'desc'+str(i)
#    
document.add_page_break()
#    
document.save(u'  .docx')

이 세그먼트 코드 가 생 성 된 문서 스타일 은 다음 과 같 습 니 다.

주:표 에 경계선 을 설정 하 는 방법 을 찾 지 못 한 문제 가 있 습 니 다.아시 면 가르쳐 주세요.
파일 내용 읽 기


#coding=utf-8
from docx import Document
#    
document = Document(u'  .docx')
#      
l = [ paragraph.text.encode('gb2312') for paragraph in document.paragraphs];
#       ，               
for i in l:
 print i
#      ，     
tables = [table for table in document.tables];
for table in tables:
 for row in table.rows:
  for cell in row.cells:
   print cell.text.encode('gb2312'),'\t',
  print
 print '
'

우 리 는 여전히 방금 우리 가 만 든 파일 을 사용 하고 있 습 니 다.출력 결 과 는?

메모:여기 서 우 리 는 gb 2312 인 코딩 방식 으로 읽 습 니 다.주로 중국어 의 읽 기와 쓰기 가 정확 하도록 보장 합 니 다.일반적인 상황 에서 사용 하 는 utf-8 인 코딩 방식.또한,python-docx 는 주로 docx 파일 을 처리 합 니 다.doc 파일 을 불 러 올 때 문제 가 발생 할 수 있 습 니 다.만약 대량의 doc 파일 이 있다 면 먼저 doc 파일 을 docx 파일 로 대량으로 변환 하 는 것 을 권장 합 니 다.예 를 들 어 도 구 를 이용 하 는 것 입 니 다doc2doc
이상 의 이 python 으로 MS Word 를 처리 하 는 실례 설명 은 바로 편집장 이 여러분 에 게 공유 한 모든 내용 입 니 다.여러분 에 게 참고 가 되 고 저희 도 많이 응원 해 주시 기 바 랍 니 다.

이 내용에 흥미가 있습니까?

현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:

로마 숫자를 정수로 또는 그 반대로 변환

그 중 하나는 로마 숫자를 정수로 변환하는 함수를 만드는 것이었고 두 번째는 그 반대를 수행하는 함수를 만드는 것이었습니다. 문자만 포함합니다'I', 'V', 'X', 'L', 'C', 'D', 'M' ; 문자열이 ...

텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.

CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.

Python 에서 PDF 파일 내용 을 분석 하고 읽 는 방법

python 대량 처리 dat 파일 및 과학적 계산 방법 에 대한 상세 한 설명

좋은 웹페이지 즐겨찾기

개발자 우수 사이트 수집

개발자가 알아야 할 필수 사이트 100선 추천 우리는 당신을 위해 100개의 자주 사용하는 개발자 학습 사이트를 정리했습니다