python 3 에서 인 코딩 하여 웹 페이지 를 가 져 오 는 실례 방법

python 을 배 운 후에 예전 에 우리 가 자주 사용 하 는 방법 도 다른 방향 으로 python 의 지식 으로 해결 할 수 있 습 니 다.조작 이 나 오 면 많은 팬 들 을 얻 을 수 있 을 것 이 라 고 믿는다.우리 가 프로 그래 밍 을 배우 기 전에 그런 큰 신 을 보 는 것 은 모두 바라 볼 수 있 지만 다가 갈 수 없다.오늘 우 리 는 이전에 간단하게 웹 페이지 를 가 져 오 는 이러한 조작 을 python 의 인 코딩 으로 해결 할 것 입 니 다.여러분 은 두 가지 차이 점 을 스스로 체험 할 수 있 습 니 다.
1. encoding 과 apparentencoding

import scrapy
url="https://www.xxx.net/html/gndy/dyzz/index.html"
re=requests.get(url)
#     Content-Type charset ,      charset  ,         ISO-8859-1
print(re.encoding)
#apparent_encoding           
print(re.apparent_encoding)
2.처리 방안
직접 r.encoding='xxx'로

re.encoding='utf-8'
3.requests 의 text()와 content()는 어떤 차이 가 있 습 니까?
re.text 는 처 리 된 유 니 코드 형 데 이 터 를 되 돌려 줍 니 다.
re.content 를 사용 하여 bytes 형의 원본 데 이 터 를 되 돌려 줍 니 다.
4.파충류 가 받 은 HTML 과 브 라 우 저의 원본 코드 가 일치 하지 않 음
원본 코드 다운로드 로 비교

import requests
url = 'https://www.xxx.net/html/gndy/dyzz/index.html'
r = requests.get(url)
r.encoding = r.apparent_encoding
html = r.text
with open('test.html','w',encoding='utf8') as f:
f.write(html)
 
python 3 에서 웹 페이지 를 가 져 오 는 인 스 턴 스 방법 에 관 한 이 글 은 여기까지 소개 되 었 습 니 다.더 많은 python 3 에서 인 코딩 으로 웹 페이지 내용 을 가 져 오 는 방법 에 대해 서 는 예전 의 글 을 검색 하거나 아래 의 관련 글 을 계속 찾 아 보 세 요.앞으로 많은 지원 을 바 랍 니 다!

좋은 웹페이지 즐겨찾기