중국 은 대학 순위 에서 오 르 는 것 이 가장 좋다.

7457 단어 파 이 썬 파충류
중국 대학 순위 정향 파충류 사례 소개
기능 설명
입력: 대학 순위 URL 링크
출력: 대학 순위 정보의 스크린 출력 (순위, 대학 이름, 총 점)
기술 노선: requests, bs4
정방 향 파충류: 입력 URL 만 기어 오 르 고 확장 기어 오 르 지 않 습 니 다.
프로그램의 구조 설계
STEP 1: 인터넷 에서 대학 순위 웹 페이지 내용 getHTMLText () 가 져 오기
STEP 2: 웹 페이지 내용 의 정 보 를 적당 한 데이터 구조 fillUnivList () 로 추출
STEP 3: 데이터 구 조 를 이용 하여 결 과 를 보 여주 고 출력 합 니 다 printUnivLIst ()
코드 작성
import requests
from bs4 import BeautifulSoup
import bs4

def getHTMLText(url):
    try:
        r = requests.get(url,timeout = 30)
        r.raise_for_status()
        r.encoding = r.apparent_encoding
        return r.text
    except:
        return ""

def fillUnivList(ulist,html):
    soup = BeautifulSoup(html,'html.parser')
    for tr in soup.find('tbody').children:
        if isinstance(tr,bs4.element.Tag):
            tds = tr('td')
            ulist.append([tds[0].string,tds[1].string,tds[3].string])

def printUnivLIst(ulist,num):
    tplt = "{0:^10}\t{1:{3}^10}\t{2:^10}"
    print(tplt.format('  ','  ','  ',chr(12288)))  #       
    for i in range(num):
        u = ulist[i]
        print(tplt.format(u[0],u[1],u[2],chr(12288)))

def main():
    uinfo = []
    url = 'http://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html'
    html = getHTMLText(url)
    fillUnivList(uinfo,html)
    printUnivLIst(uinfo,20)  # 20   

main()


좋은 웹페이지 즐겨찾기