python 유 니 코드 문자열 앞 u 제거 방법

1173 단어 pythonunicodeu
다음 과 같은 유 니 코드 문자열 을 만 날 때 가 있 습 니 다.

u'\xe4\xbd\xa0\xe5\xa5\xbd'
이것 은 분명히 정확 한 유 니 코드 문자열 이 아 닙 니 다.아마도 어느 곳 에서 코드 를 잘못 돌 렸 을 것 입 니 다.
정확 한 유 니 코드 문자열 을 얻 으 려 면 먼저 이 문자열 을 비 유 니 코드 문자열 로 바 꾼 다음 디 코딩 을 해 야 합 니 다.일반적인 방법 으로 encode 를 진행 하면 안 됩 니 다.정확 한 유 니 코드 문자열 이 아니 기 때 문 입 니 다.

In [1]: u'\xe4\xbd\xa0\xe5\xa5\xbd'.encode('utf8')
Out[1]: '\xc3\xa4\xc2\xbd\xc2\xa0\xc3\xa5\xc2\xa5\xc2\xbd'

In [2]: print u'\xe4\xbd\xa0\xe5\xa5\xbd'.encode('utf8')
     
             \xe4\xbd\xa0\xe5\xa5\xbd  ?

python           ( raw_unicode_escape )        :

In [4]: u'\xe4\xbd\xa0\xe5\xa5\xbd'.encode('raw_unicode_escape')
Out[4]: '\xe4\xbd\xa0\xe5\xa5\xbd'

In [5]: u'\xe4\xbd\xa0\xe5\xa5\xbd'.encode('raw_unicode_escape').decode('utf8')
Out[5]: u'\u4f60\u597d'

In [7]: print u'\u4f60\u597d'
  
이상 의 python 에서 유 니 코드 문자열 을 제거 하 는 앞의 u 방법 은 바로 작은 편집 이 여러분 에 게 공유 하 는 모든 내용 입 니 다.여러분 께 참고 가 되 고 저 희 를 많이 사랑 해 주 셨 으 면 좋 겠 습 니 다.

좋은 웹페이지 즐겨찾기