문자 인 코딩 노트 (ASCII, Unicode, UTF - 8)

826 단어 기타

  • 이 글 은 매우 명확 하 게 해석 되 었 습 니 다. 메모 참조:
  • 문자 인 코딩 노트: ASCII, 유 니 코드, UTF - 8 http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html
  • UTF - 8 유 니 코드 전환
  • //len  UTF-8     ,           1     
    unsigned int ToUnicode(const string& str,
                           const int len) {
      switch (len) {
        case 1:
          return str[0] & 0x7F;
        case 2:
          return ((str[0] & 0x1F) << 6) + ((str[1] & 0x3F));                                                                                                                                                          
        case 3:
          return ((str[0] & 0x1F) << 12) +
                 ((str[1] & 0x3F) << 6) +
                 (str[2] & 0x3F);
        default:
          return 0;
      }
    }

    좋은 웹페이지 즐겨찾기