java 고급 프로그래밍 고급 텍스트 처리 (1)

2518 단어
1 문자 인코딩에 대한 이해
1 문자 인코딩 (1): - 문자 0, a 나 1... 등 - 컴퓨터는 0과 1로만 표시 - ASCII 코드 - 미국 정보 교환 표준 코드, 컴퓨터 기초 확인 - 1바이트(1Byte=8bits)로 a-z, A-Z, 0-9와 자주 사용하는 기호 - 영어와 서구어 2문자 인코딩 표시에 사용(2): - ASCII 인코딩은 1byte, 8bits 최대 256바이트 - ASCII로 다른 곳에 적응할 수 없음.예를 들어 한자의 수량은 수십만 - 확장 코드: - ISO8859 서유럽어 - GB2132, GBK, GB18030, ASII+ 중국어 - Big5 ASII+ 번체 중국어 - shiftJIS ASCII + 일본어 - 유니코드 인코딩
  unicode              
          :
       GB2132:1980   ,7445   ,      ,    ,     682   
       GBK: 1995   ,  21886      
       GB18030:70244      
    Unicode(   ):
       -    ,           
         :
       UTF-8   ASCII ,  (1-4       ),       
       UTF-16    2-4        
       UTF-32  32 bits      

2 자바의 문자 인코딩과 파일의 입력 출력
//      GBK
 charset c =  charset .defaulteCharset();
 //          
SortedMap sm = Charset.availableCharsets();
 Set keyset = sm.keySet();
System.out.println("java        ");
for (String s: keyset){
    System.out.println(s);
}

java 국제화 프로그래밍
1java는 처음으로 국제화 언어를 지원하는 프로그래밍 언어로 설계되었다.util.언어를 로드하는 데 사용되는 ResourceBundle국가 언어의 패키지 자바.util.local 정의 언어 2 새 메시지zh.properties 중요 알림: 이 설정 파일에서 한자를 ASII 코드로 바꾸거나 읽을 때 바꾸십시오!
public class ByteCode2 {

    public static void main(String[] args) {
        //              
        Locale loc = Locale.getDefault();
        System.out.println(loc);
        //            
        ResourceBundle bundle = ResourceBundle.getBundle("message_zh");

        System.out.println("           "+bundle.getString("hello"));
    }
}

java 고급 문자열 처리
1 정규 표현식은 2의 다른 문자열을 나타내는 작업 - 집합과 문자열의 상호작용 - 문자열의 의미 - 변수 이름 포맷 - 문자열에서 입력 흐름까지 정규 표현식을 배우는 곳을 추천합니다.https://github.com/ziishaned/learn-regex
public class ByteCode3 {
    private static final String REGX = "\\bdog\\b";
    private static final String INPUT = "dog dog ddog";
    public static void main(String[] args) {
        Pattern pattern = Pattern.compile(REGX);

        Matcher matcher = pattern.matcher(INPUT);

        int count = 0;

        while (matcher.find()){
            count++;
            System.out.println(count);
        }

    }
}

바꾸기:
    string str = "abC";(     )
      Pattern p = Pattern.compile(str);
      Matcher m = p.matcher("       ,  "abC");
      while(m.find){
           m.replaceAll("abC",“123”);  //      abc     123
         }

좋은 웹페이지 즐겨찾기