Java 정규 추출 중괄호의 컨텐트 작업 예

본고는 자바 정규 추출 중괄호의 내용 조작을 실례로 기술한다.다음과 같이 여러분에게 참고할 수 있도록 공유합니다.
일찍이 업무 중에 문제가 하나 생겼다. 문자열의 모든 중괄호 안의 내용을 추출해야 한다는 것이다. 인터넷에서 찾아보니 정규 표현식으로 중괄호 안의 내용을 추출할 수 있다는 것을 발견했다. 구체적으로 다음과 같다.

import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class ExtractMessage {
  public static void main(String[] args) {
    String msg = "PerformanceManager[ 1 ]Product[ 2 ]<[ 3 ]79~";
    List<String> list = extractMessageByRegular(msg);
    for (int i = 0; i < list.size(); i++) {
      System.out.println(i+"-->"+list.get(i));
    }
  }
  /**
   *  
   * @param msg
   * @return
   */
  public static List<String> extractMessageByRegular(String msg){
    List<String> list=new ArrayList<String>();
    Pattern p = Pattern.compile("(\\[[^\\]]*\\])");
    Matcher m = p.matcher(msg);
    while(m.find()){
      list.add(m.group().substring(1, m.group().length()-1));
    }
    return list;
  }
}

출력 결과는 다음과 같습니다.
0 -> 첫 번째 중괄호
1--> 두 번째 중괄호
2--> 세 번째 중괄호
이렇게 하면 코드의 작업을 빨리 완성했지만 나중에 중괄호에 중괄호가 포함되면 정규 표현식이 역할을 잃게 된다는 것을 알게 되었다. 나는 어쩔 수 없이 스스로 방법을 강구하여 해결해야 했다. 연구를 통해 마침내 해결 방법을 찾았고 구체적으로 다음과 같이 실현했다.

package com.perry.test;
import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class ExtractMessage {
  public static void main(String[] args) {
    String msg = "PerformanceManager[ 1 ]Product[ 2 [ ]]<[ 3 ]79~";
    List<String> list = extractMessage(msg);
    for (int i = 0; i < list.size(); i++) {
      System.out.println(i+"-->"+list.get(i));
    }
  }
  /**
   *  , 
   * @param msg
   * @return
   */
  public static List<String> extractMessage(String msg) {
    List<String> list = new ArrayList<String>();
    int start = 0;
    int startFlag = 0;
    int endFlag = 0;
    for (int i = 0; i < msg.length(); i++) {
      if (msg.charAt(i) == '[') {
        startFlag++;
        if (startFlag == endFlag + 1) {
          start = i;
        }
      } else if (msg.charAt(i) == ']') {
        endFlag++;
        if (endFlag == startFlag) {
          list.add(msg.substring(start + 1, i));
        }
      }
    }
    return list;
  }
}

출력 결과는 다음과 같습니다.
0 -> 첫 번째 중괄호
1--> 두 번째 중괄호 [중괄호에 중괄호 포함]
2--> 세 번째 중괄호
주요한 사고방식은 문자열을 훑어보고 중괄호의 시작과 끝 위치를 표기 계수로 하는 것이다. 중괄호의 시작 위치에 대응하는 끝 위치라면 시작 위치와 끝 위치의 계수는 일치한다. 이렇게 캡처하는 것은 완전한 중괄호의 내용이다.
PS: 여기에 매우 편리한 정규 표현식 도구 2가지를 더 제공하여 참고하여 사용할 수 있습니다.
JavaScript 정규 표현식 온라인 테스트 도구:
http://tools.jb51.net/regex/javascript
정규 표현식 온라인 생성 도구:
http://tools.jb51.net/regex/create_reg
자바 알고리즘에 관심이 있는 더 많은 독자들은 본 사이트의 주제를 볼 수 있습니다.《 Java 정규 표현식 기술 》、《 Java 데이터 구조 및 알고리즘 튜토리얼 》、《 Java 운영 DOM 노드 기술 요약 》및
본고에서 기술한 것이 여러분의 자바 프로그램 설계에 도움이 되기를 바랍니다.

좋은 웹페이지 즐겨찾기