python 3 에서 인 코딩 하여 웹 페이지 를 가 져 오 는 실례 방법

python 을 배 운 후에 예전 에 우리 가 자주 사용 하 는 방법 도 다른 방향 으로 python 의 지식 으로 해결 할 수 있 습 니 다.조작 이 나 오 면 많은 팬 들 을 얻 을 수 있 을 것 이 라 고 믿는다.우리 가 프로 그래 밍 을 배우 기 전에 그런 큰 신 을 보 는 것 은 모두 바라 볼 수 있 지만 다가 갈 수 없다.오늘 우 리 는 이전에 간단하게 웹 페이지 를 가 져 오 는 이러한 조작 을 python 의 인 코딩 으로 해결 할 것 입 니 다.여러분 은 두 가지 차이 점 을 스스로 체험 할 수 있 습 니 다.
1. encoding 과 apparentencoding


import scrapy
url="https://www.xxx.net/html/gndy/dyzz/index.html"
re=requests.get(url)
#     Content-Type charset ，      charset  ，         ISO-8859-1
print(re.encoding)
#apparent_encoding           
print(re.apparent_encoding)

2.처리 방안
직접 r.encoding='xxx'로


re.encoding='utf-8'

3.requests 의 text()와 content()는 어떤 차이 가 있 습 니까?
re.text 는 처 리 된 유 니 코드 형 데 이 터 를 되 돌려 줍 니 다.
re.content 를 사용 하여 bytes 형의 원본 데 이 터 를 되 돌려 줍 니 다.
4.파충류 가 받 은 HTML 과 브 라 우 저의 원본 코드 가 일치 하지 않 음
원본 코드 다운로드 로 비교


import requests
url = 'https://www.xxx.net/html/gndy/dyzz/index.html'
r = requests.get(url)
r.encoding = r.apparent_encoding
html = r.text
with open('test.html','w',encoding='utf8') as f:
f.write(html)

python 3 에서 웹 페이지 를 가 져 오 는 인 스 턴 스 방법 에 관 한 이 글 은 여기까지 소개 되 었 습 니 다.더 많은 python 3 에서 인 코딩 으로 웹 페이지 내용 을 가 져 오 는 방법 에 대해 서 는 예전 의 글 을 검색 하거나 아래 의 관련 글 을 계속 찾 아 보 세 요.앞으로 많은 지원 을 바 랍 니 다!

이 내용에 흥미가 있습니까?

현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:

Jupyter 공식 DockerHub에 대한 메모

에 기재되어 있다. base-notebook minimal-notebook scipy-notebook tensorflow-notebook datascience-notebook pyspark-notebook all-s...

텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.

CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.

좋은 웹페이지 즐겨찾기

개발자 우수 사이트 수집

개발자가 알아야 할 필수 사이트 100선 추천 우리는 당신을 위해 100개의 자주 사용하는 개발자 학습 사이트를 정리했습니다