java에서 유니코드와 중국어가 서로 변환되는 간단한 실현

다음과 같습니다.


package test.com.gjob.services;
  import java.util.Properties;
   public class Test { 
      public static void main(String[] args) { 
      String s = " "; 
      String tt = gbEncoding(s); 
  //    String tt1 = " ， ";
      System.out.println(decodeUnicode("\\u7b80\\u4ecb")); 
  //    System.out.println(decodeUnicode(tt1)); 
      System.out.println(HTMLDecoder.decode(" "));
      String s1 = "\u7b80\u4ecb";
      System.out.println(s.indexOf("\\"));
     } 
     public static String gbEncoding(final String gbString) { 
     char[] utfBytes = gbString.toCharArray(); 
        String unicodeBytes = ""; 
        for (int byteIndex = 0; byteIndex < utfBytes.length; byteIndex++) { 
           String hexB = Integer.toHexString(utfBytes[byteIndex]); 
            if (hexB.length() <= 2) { 
              hexB = "00" + hexB; 
           } 
            unicodeBytes = unicodeBytes + "\\u" + hexB; 
          } 
          System.out.println("unicodeBytes is: " + unicodeBytes); 
          return unicodeBytes; 
       } 
      
       public static String decodeUnicode(final String dataStr) { 
        int start = 0; 
         int end = 0; 
         final StringBuffer buffer = new StringBuffer(); 
         while (start > -1) { 
           end = dataStr.indexOf("\\u", start + 2); 
           String charStr = ""; 
           if (end == -1) { 
             charStr = dataStr.substring(start + 2, dataStr.length()); 
           } else { 
             charStr = dataStr.substring(start + 2, end); 
           } 
           char letter = (char) Integer.parseInt(charStr, 16); // 16 parse 。 
          buffer.append(new Character(letter).toString()); 
          start = end; 
         } 
         return buffer.toString(); 
       } 
     }


public static String decodeUnicode(String theString) {  
 
   char aChar;  
 
   int len = theString.length();  
 
   StringBuffer outBuffer = new StringBuffer(len);  
 
   for (int x = 0; x < len;) {  
 
   aChar = theString.charAt(x++);  
 
   if (aChar == '\\') {  
 
    aChar = theString.charAt(x++);  
 
    if (aChar == 'u') {  
 
    // Read the xxxx  
 
    int value = 0;  
 
    for (int i = 0; i < 4; i++) {  
 
     aChar = theString.charAt(x++);  
 
     switch (aChar) {  
 
     case '0':  
 
     case '1':  
 
     case '2':  
 
     case '3':  
 
    case '4':  
 
     case '5':  
 
     case '6':  
      case '7':  
      case '8':  
      case '9':  
      value = (value << 4) + aChar - '0';  
      break;  
      case 'a':  
      case 'b':  
      case 'c':  
      case 'd':  
      case 'e':  
      case 'f':  
      value = (value << 4) + 10 + aChar - 'a';  
      break;  
      case 'A':  
      case 'B':  
      case 'C':  
      case 'D':  
      case 'E':  
      case 'F':  
      value = (value << 4) + 10 + aChar - 'A';  
      break;  
      default:  
      throw new IllegalArgumentException(  
       "Malformed  \\uxxxx  encoding.");  
      }  
 
     }  
     outBuffer.append((char) value);  
     } else {  
     if (aChar == 't')  
      aChar = '\t';  
     else if (aChar == 'r')  
      aChar = '\r';  
 
     else if (aChar == 'n')  
 
      aChar = '
';  
 
     else if (aChar == 'f')  
 
      aChar = '\f';  
 
     outBuffer.append(aChar);  
 
     }  
 
    } else  
 
    outBuffer.append(aChar);  
 
    }  
 
    return outBuffer.toString();  
 
   }

이상의 이 자바에서 유니코드와 중국어가 서로 전환되는 간단한 실현은 바로 편집자가 여러분에게 공유한 모든 내용입니다. 여러분께 참고가 되고 저희를 많이 사랑해 주시기 바랍니다.

이 내용에 흥미가 있습니까?

현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:

38. Java의 Leetcode 솔루션

텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.

CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.

좋은 웹페이지 즐겨찾기

개발자 우수 사이트 수집

개발자가 알아야 할 필수 사이트 100선 추천 우리는 당신을 위해 100개의 자주 사용하는 개발자 학습 사이트를 정리했습니다