python 으로 MS Word 를 처리 하 는 실례 설명

python 도 구 를 사용 하여 MS Word 파일(docx 와 doc 파일)을 읽 고 쓰 는데 주로 python-docx 패 키 지 를 사용 합 니 다.본 고 는 자주 사용 하 는 조작 을 제시 하고 하나의 사례 를 완성 하여 모두 가 신속하게 착수 하도록 도와 준다.
설치 하 다.
pyhton 에서 docx 파일 을 처리 하려 면 python-docx 패 키 지 를 사용 해 야 합 니 다.pip 도 구 를 이용 하여 쉽게 설치 할 수 있 습 니 다.pip 도 구 는 python 설치 경로 의 Scripts 폴 더 에 있 습 니 다.

pip install python-docx
물론 당신 도 easy 를 선택 할 수 있 습 니 다.설치
파일 내용 쓰기
여기 서 우 리 는 직접 하나의 사례 를 제시 하여 자신의 수요 에 따라 유용 한 내용 을 발췌 한다.

#coding=utf-8
from docx import Document
from docx.shared import Pt
from docx.shared import Inches
from docx.oxml.ns import qn
#    
document = Document()
#         
document.add_heading(u'MS WORD    ',0)
document.add_heading(u'    ',1)
document.add_heading(u'    ',2)
#    
paragraph = document.add_paragraph(u'        !')
#    
run = paragraph.add_run(u'    、')
run.font.size = Pt(24)
#    
run = paragraph.add_run('Set Font,')
run.font.name = 'Consolas'
#      
run = paragraph.add_run(u'      、')
run.font.name=u'  '
r = run._element
r.rPr.rFonts.set(qn('w:eastAsia'), u'  ')
#    
run = paragraph.add_run(u'  、')
run.italic = True
#    
run = paragraph.add_run(u'  ').bold = True
#    
document.add_paragraph('Intense quote', style='Intense Quote')
#      
document.add_paragraph(
 u'      1', style='List Bullet'
)
document.add_paragraph(
 u'      2', style='List Bullet'
)
#      
document.add_paragraph(
 u'      1', style='List Number'
)
document.add_paragraph(
 u'      2', style='List Number'
)
#    (      image.bmp,            )
document.add_picture('image.bmp', width=Inches(1.25))
#    
table = document.add_table(rows=1, cols=3)
hdr_cells = table.rows[0].cells
hdr_cells[0].text = 'Name'
hdr_cells[1].text = 'Id'
hdr_cells[2].text = 'Desc'
#   3     
for i in xrange(3):
 row_cells = table.add_row().cells
 row_cells[0].text = 'test'+str(i)
 row_cells[1].text = str(i)
 row_cells[2].text = 'desc'+str(i)
#    
document.add_page_break()
#    
document.save(u'  .docx')
이 세그먼트 코드 가 생 성 된 문서 스타일 은 다음 과 같 습 니 다.

주:표 에 경계선 을 설정 하 는 방법 을 찾 지 못 한 문제 가 있 습 니 다.아시 면 가르쳐 주세요.
파일 내용 읽 기

#coding=utf-8
from docx import Document
#    
document = Document(u'  .docx')
#      
l = [ paragraph.text.encode('gb2312') for paragraph in document.paragraphs];
#       ,               
for i in l:
 print i
#      ,     
tables = [table for table in document.tables];
for table in tables:
 for row in table.rows:
  for cell in row.cells:
   print cell.text.encode('gb2312'),'\t',
  print
 print '
'
우 리 는 여전히 방금 우리 가 만 든 파일 을 사용 하고 있 습 니 다.출력 결 과 는?

메모:여기 서 우 리 는 gb 2312 인 코딩 방식 으로 읽 습 니 다.주로 중국어 의 읽 기와 쓰기 가 정확 하도록 보장 합 니 다.일반적인 상황 에서 사용 하 는 utf-8 인 코딩 방식.또한,python-docx 는 주로 docx 파일 을 처리 합 니 다.doc 파일 을 불 러 올 때 문제 가 발생 할 수 있 습 니 다.만약 대량의 doc 파일 이 있다 면 먼저 doc 파일 을 docx 파일 로 대량으로 변환 하 는 것 을 권장 합 니 다.예 를 들 어 도 구 를 이용 하 는 것 입 니 다doc2doc
이상 의 이 python 으로 MS Word 를 처리 하 는 실례 설명 은 바로 편집장 이 여러분 에 게 공유 한 모든 내용 입 니 다.여러분 에 게 참고 가 되 고 저희 도 많이 응원 해 주시 기 바 랍 니 다.

좋은 웹페이지 즐겨찾기