중국 은 대학 순위 에서 오 르 는 것 이 가장 좋다.
7457 단어 파 이 썬 파충류
기능 설명
입력: 대학 순위 URL 링크
출력: 대학 순위 정보의 스크린 출력 (순위, 대학 이름, 총 점)
기술 노선: requests, bs4
정방 향 파충류: 입력 URL 만 기어 오 르 고 확장 기어 오 르 지 않 습 니 다.
프로그램의 구조 설계
STEP 1: 인터넷 에서 대학 순위 웹 페이지 내용 getHTMLText () 가 져 오기
STEP 2: 웹 페이지 내용 의 정 보 를 적당 한 데이터 구조 fillUnivList () 로 추출
STEP 3: 데이터 구 조 를 이용 하여 결 과 를 보 여주 고 출력 합 니 다 printUnivLIst ()
코드 작성
import requests
from bs4 import BeautifulSoup
import bs4
def getHTMLText(url):
try:
r = requests.get(url,timeout = 30)
r.raise_for_status()
r.encoding = r.apparent_encoding
return r.text
except:
return ""
def fillUnivList(ulist,html):
soup = BeautifulSoup(html,'html.parser')
for tr in soup.find('tbody').children:
if isinstance(tr,bs4.element.Tag):
tds = tr('td')
ulist.append([tds[0].string,tds[1].string,tds[3].string])
def printUnivLIst(ulist,num):
tplt = "{0:^10}\t{1:{3}^10}\t{2:^10}"
print(tplt.format(' ',' ',' ',chr(12288))) #
for i in range(num):
u = ulist[i]
print(tplt.format(u[0],u[1],u[2],chr(12288)))
def main():
uinfo = []
url = 'http://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html'
html = getHTMLText(url)
fillUnivList(uinfo,html)
printUnivLIst(uinfo,20) # 20
main()
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
Python 파충류 (1) - 데이터 세척 및 추출re 모듈 의 사용 추출, 일치, 교체 추출: findall () 일치: match () 교체: sub () 예: Xpath 의 기본 문법 표현 식 묘사 하 다. 루트 노드 선택 또는 하위 임의의 노드, 위치 고려 ...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.