Python 문서의 UTF-8 인코딩 파일 읽기 문제

573 단어 python 기반
codecs 모듈을 참조하여 처음 3바이트가 BOM인지 확인합니다.UTF8.예인 경우\xef\xbb\xbf 바이트 제거
import codecs
def download_ipurl(self,destpath):
    try:
        f = open(destpath,'r')
        iter_f = iter(f)
        lines = 0
        for ipurl in iter_f:
            lines = lines + 1
            if ipurl[0:3] == codecs.BOM_UTF8:    
                self.newipurls.add((ipurl.rstrip('\r
')).lstrip('\xef\xbb\xbf')) #print self.newipurls #log IP url #print lines finally: if f: f.close()

좋은 웹페이지 즐겨찾기