Python 으로 웹 페이지 를 다운로드 하여 로 컬 HTML 파일 인 스 턴 스 로 저장 합 니 다.

웹 페이지 를 로 컬 HTML 파일 로 저장 하려 면 Python 을 사용 할 수 있 습 니 다.url lib 라 이브 러 리 가 필요 합 니 다.
예 를 들 어 우 리 는 산동대학 교 뉴스 망 의 한 페이지 를 다운로드 해 야 한다.이 페이지 는 다음 과 같다.

구현 코드 는 다음 과 같 습 니 다:

import urllib.request

def getHtml(url):
 html = urllib.request.urlopen(url).read()
 return html

def saveHtml(file_name, file_content):
 #   windows        ,   /
 with open(file_name.replace('/', '_') + ".html", "wb") as f:
  #     bytes   str,     
  f.write(file_content)

aurl = "http://www.view.sdu.edu.cn/info/1003/75240.htm"
html = getHtml(aurl)
saveHtml("sduview", html)

print("    ")
해당 디 렉 터 리 를 열 면 이 페이지 가 다운로드 되 어 저장 되 었 음 을 볼 수 있 습 니 다.

우 리 는 브 라 우 저 로 이 웹 페이지 파일 을 다음 과 같이 엽 니 다.

우 리 는 단지 웹 페이지 의 주요 소스 코드 를 다운로드 하 였 을 뿐,그 중의 많은 그림 과 같은 파일 은 모두 여기에 없다.따라서 이 방법 은 문자 내용 추출 에 만 적용 된다.
파 이 썬 으로 웹 페이지 를 다운로드 하여 로 컬 로 저 장 된 HTML 파일 인 스 턴 스 는 편집장 이 여러분 에 게 공유 한 모든 내용 입 니 다.참고 가 되 고 많은 응원 부탁드립니다.

좋은 웹페이지 즐겨찾기