python 웹 페이지 인 코딩 방식 구현 코드 가 져 오기

python 웹 페이지 인 코딩 방식 구현 코드 가 져 오기

<span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);">
  </span><span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);">
python  ,              chardet ,     ,    python2.7   ,        。
       chardet-2.3.0.tar.gz     ,             chardet    python     
python27/lib/site-packages/ ,    。</span> 
 그리고 import chardet.
다음은 Url 연결 을 검사 하고 웹 페이지 url 의 인 코딩 방식 을 되 돌려 주 는 자동화 검 측 함 수 를 썼 습 니 다.

import chardet #      
import urllib 
 
url="http://www.jd.com" 
 
 
def automatic_detect(url): 
  content=urllib.urlopen(url).read() 
  result=chardet.detect(content) 
 
  encoding=result['encoding'] 
 
  return encoding 
 
urls=['http://www.baidu.com','http://www.163.com','http://dangdang.com'] 
for url in urls: 
  print url,automatic_detect(url) 

위 에 서 는 chardet 류 의 detect 방법 을 사용 하여 사전 을 되 돌려 주 고 인 코딩 방식 encoding 을 꺼 냈 다.
읽 어 주 셔 서 감사합니다. 여러분 에 게 도움 이 되 기 를 바 랍 니 다.본 사이트 에 대한 여러분 의 지지 에 감 사 드 립 니 다!

좋은 웹페이지 즐겨찾기