python 으로 MS Word 를 처리 하 는 실례 설명
설치 하 다.
pyhton 에서 docx 파일 을 처리 하려 면 python-docx 패 키 지 를 사용 해 야 합 니 다.pip 도 구 를 이용 하여 쉽게 설치 할 수 있 습 니 다.pip 도 구 는 python 설치 경로 의 Scripts 폴 더 에 있 습 니 다.
pip install python-docx
물론 당신 도 easy 를 선택 할 수 있 습 니 다.설치파일 내용 쓰기
여기 서 우 리 는 직접 하나의 사례 를 제시 하여 자신의 수요 에 따라 유용 한 내용 을 발췌 한다.
#coding=utf-8
from docx import Document
from docx.shared import Pt
from docx.shared import Inches
from docx.oxml.ns import qn
#
document = Document()
#
document.add_heading(u'MS WORD ',0)
document.add_heading(u' ',1)
document.add_heading(u' ',2)
#
paragraph = document.add_paragraph(u' !')
#
run = paragraph.add_run(u' 、')
run.font.size = Pt(24)
#
run = paragraph.add_run('Set Font,')
run.font.name = 'Consolas'
#
run = paragraph.add_run(u' 、')
run.font.name=u' '
r = run._element
r.rPr.rFonts.set(qn('w:eastAsia'), u' ')
#
run = paragraph.add_run(u' 、')
run.italic = True
#
run = paragraph.add_run(u' ').bold = True
#
document.add_paragraph('Intense quote', style='Intense Quote')
#
document.add_paragraph(
u' 1', style='List Bullet'
)
document.add_paragraph(
u' 2', style='List Bullet'
)
#
document.add_paragraph(
u' 1', style='List Number'
)
document.add_paragraph(
u' 2', style='List Number'
)
# ( image.bmp, )
document.add_picture('image.bmp', width=Inches(1.25))
#
table = document.add_table(rows=1, cols=3)
hdr_cells = table.rows[0].cells
hdr_cells[0].text = 'Name'
hdr_cells[1].text = 'Id'
hdr_cells[2].text = 'Desc'
# 3
for i in xrange(3):
row_cells = table.add_row().cells
row_cells[0].text = 'test'+str(i)
row_cells[1].text = str(i)
row_cells[2].text = 'desc'+str(i)
#
document.add_page_break()
#
document.save(u' .docx')
이 세그먼트 코드 가 생 성 된 문서 스타일 은 다음 과 같 습 니 다.주:표 에 경계선 을 설정 하 는 방법 을 찾 지 못 한 문제 가 있 습 니 다.아시 면 가르쳐 주세요.
파일 내용 읽 기
#coding=utf-8
from docx import Document
#
document = Document(u' .docx')
#
l = [ paragraph.text.encode('gb2312') for paragraph in document.paragraphs];
# ,
for i in l:
print i
# ,
tables = [table for table in document.tables];
for table in tables:
for row in table.rows:
for cell in row.cells:
print cell.text.encode('gb2312'),'\t',
print
print '
'
우 리 는 여전히 방금 우리 가 만 든 파일 을 사용 하고 있 습 니 다.출력 결 과 는?메모:여기 서 우 리 는 gb 2312 인 코딩 방식 으로 읽 습 니 다.주로 중국어 의 읽 기와 쓰기 가 정확 하도록 보장 합 니 다.일반적인 상황 에서 사용 하 는 utf-8 인 코딩 방식.또한,python-docx 는 주로 docx 파일 을 처리 합 니 다.doc 파일 을 불 러 올 때 문제 가 발생 할 수 있 습 니 다.만약 대량의 doc 파일 이 있다 면 먼저 doc 파일 을 docx 파일 로 대량으로 변환 하 는 것 을 권장 합 니 다.예 를 들 어 도 구 를 이용 하 는 것 입 니 다doc2doc
이상 의 이 python 으로 MS Word 를 처리 하 는 실례 설명 은 바로 편집장 이 여러분 에 게 공유 한 모든 내용 입 니 다.여러분 에 게 참고 가 되 고 저희 도 많이 응원 해 주시 기 바 랍 니 다.
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
로마 숫자를 정수로 또는 그 반대로 변환그 중 하나는 로마 숫자를 정수로 변환하는 함수를 만드는 것이었고 두 번째는 그 반대를 수행하는 함수를 만드는 것이었습니다. 문자만 포함합니다'I', 'V', 'X', 'L', 'C', 'D', 'M' ; 문자열이 ...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.