이것으로 알았다! 최단 매치

2376 단어 루비정규식

소개



정규 표현으로 최단 매치라고 하는 것이 있지만, 몇개의 샘플로 동작을 보면서, 어떤 사용법을 하는지를 확인해 보자.

내용


str = "ああああ「あ」い「うう」ええ「おおお」かかか"이러한 문자열 중에서, 괄호로 둘러싸인 부분만 추출하고 싶은(즉, 「아」 「우우」 「오오오」의 3개소를 추출하고 싶은) 경우, 최단 매치를 이용하게 됩니다.

그 전에 간단한 움직임에서 확인해 보자.

+는, 1 문자 이상으로 매치 하기 때문에, 이 예에서는 매치 하지 않습니다.
str = "ああああ「」"
puts str.scan(/「.+」/)
=>マッチしない

*는 0문자 이상으로 매치하기 때문에 이 예에서는 매치합니다.
str = "ああああ「」"
puts str.scan(/「.*」/)
=>「」

다음의 경우는 어떨까

그 문자가 1 문자이기 때문에 매치합니다.
str = "ああああ「あ」"
puts str.scan(/「.+」/)
=>「あ」

이쪽도, 그 문자가 0문자 있으므로 매치합니다. 결과적으로 동일합니다.
str = "ああああ「あ」"
puts str.scan(/「.*」/)
=>「あ」

조금, 주제에 들어갑니다.

이 예라고 하면, 최초로 출현한, 「와, 최종에 출현한,」로 둘러싸인 부분에서 매치해 버립니다. 하고 싶은 것은 이것이 아닙니다.
str = "ああああ「あ」い「うう」ええ「おおお」かかか"
puts str.scan(/「.+」/)
=>「あ」い「うう」ええ「おおお」

그렇다면 어떻게해야합니까?

? 를 추가하면 최단 매치를 해줍니다.
str = "ああああ「あ」い「うう」ええ「おおお」かかか"
puts str.scan(/「.+?」/)
=>「あ」「うう」「おおお」

축하합니다.

이렇게하면 어떻게됩니까?

+ 대신에, *로 해도 결과적으로는 같습니다만・・・
str = "ああああ「あ」い「うう」ええ「おおお」かかか"
puts str.scan(/「.*?」/)
=>「あ」「うう」「おおお」

「」를 매치시키고 싶은지, 시키고 싶지 않은가에서, +와 *를 구분하는 것이 됩니다.

「」를 매치시키고 싶지 않은 경우는, 1 문자 이상으로 매치하는, +를 사용합니다.
str = "ああああ「あ」い「うう」ええ「おおお」かかか「」"
puts str.scan(/「.+?」/)
=>「あ」「うう」「おおお」

「」를 매치시키고 싶은 경우는, 0문자 이상으로 매치하는, *를 사용합니다.
str = "ああああ「あ」い「うう」ええ「おおお」かかか「」"
puts str.scan(/「.*?」/)
=>「あ」「うう」「おおお」「」

C'est fini

좋은 웹페이지 즐겨찾기