1 단계 파충류(3)
import requests
url="https://en.wikipedia.org/wiki/Steve_Jobs"
res=requests.get(url)
print(res.status_code)
with open('a.html', 'w', encoding='utf-8') as f:
f.write(res.text)
웹 페이지를 저장합니다. 윈도우즈와python 인코딩 때문에 오픈할 때 encoding='utf-8'
한 소절 더:
import requests
import re
from lxml import etree
with open("a.html","r",encoding="utf-8") as f:
c=f.read()
tree=etree.HTML(c)
table_element=tree.xpath("//table[@class='infobox biography vcard']")
table_row=tree.xpath("//table[@class='infobox biography vcard'][1]/tbody/tr")
pattern_attrib=re.compile("<.>")
# print(table_element)
# infobox biography vcard
for row in table_row:
try:
thead=row.xpath("th")[0]
title=etree.tostring(thead).decode("utf-8")
title=pattern_attrib.sub(" ",title)
desc=row.xpath("td")[0]
desc=etree.tostring(desc).decode("utf-8")
desc=pattern_attrib.sub(" ",desc)
print(title+":"+desc)
print("=========")
except Exception as err:
print(err)
# pass
content=tree.xpath("//div[@id='mw-content-text'][1]//*[self::h2 or self::p]")
for line in content:
print(line.text)
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
python은 어떻게 파충류의 효율을 향상시킬 것인가단일 스레드 + 멀티태스킹 비동기 협동 협정 함수(특수 함수)를 정의할 때 async 수식을 사용합니다. 함수 호출 후 내부 문장은 즉시 실행되지 않고 협동 대상으로 되돌아옵니다. 퀘스트 대상 작업 대상 = 고급 협...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.