이것으로 알았다! 최단 매치
소개
정규 표현으로 최단 매치라고 하는 것이 있지만, 몇개의 샘플로 동작을 보면서, 어떤 사용법을 하는지를 확인해 보자.
내용
str = "ああああ「あ」い「うう」ええ「おおお」かかか"
이러한 문자열 중에서, 괄호로 둘러싸인 부분만 추출하고 싶은(즉, 「아」 「우우」 「오오오」의 3개소를 추출하고 싶은) 경우, 최단 매치를 이용하게 됩니다.
그 전에 간단한 움직임에서 확인해 보자.
+는, 1 문자 이상으로 매치 하기 때문에, 이 예에서는 매치 하지 않습니다.
str = "ああああ「」"
puts str.scan(/「.+」/)
=>マッチしない
*는 0문자 이상으로 매치하기 때문에 이 예에서는 매치합니다.
str = "ああああ「」"
puts str.scan(/「.*」/)
=>「」
다음의 경우는 어떨까
그 문자가 1 문자이기 때문에 매치합니다.
str = "ああああ「あ」"
puts str.scan(/「.+」/)
=>「あ」
이쪽도, 그 문자가 0문자 있으므로 매치합니다. 결과적으로 동일합니다.
str = "ああああ「あ」"
puts str.scan(/「.*」/)
=>「あ」
조금, 주제에 들어갑니다.
이 예라고 하면, 최초로 출현한, 「와, 최종에 출현한,」로 둘러싸인 부분에서 매치해 버립니다. 하고 싶은 것은 이것이 아닙니다.
str = "ああああ「あ」い「うう」ええ「おおお」かかか"
puts str.scan(/「.+」/)
=>「あ」い「うう」ええ「おおお」
그렇다면 어떻게해야합니까?
? 를 추가하면 최단 매치를 해줍니다.
str = "ああああ「あ」い「うう」ええ「おおお」かかか"
puts str.scan(/「.+?」/)
=>「あ」「うう」「おおお」
축하합니다.
이렇게하면 어떻게됩니까?
+ 대신에, *로 해도 결과적으로는 같습니다만・・・
str = "ああああ「あ」い「うう」ええ「おおお」かかか"
puts str.scan(/「.*?」/)
=>「あ」「うう」「おおお」
「」를 매치시키고 싶은지, 시키고 싶지 않은가에서, +와 *를 구분하는 것이 됩니다.
「」를 매치시키고 싶지 않은 경우는, 1 문자 이상으로 매치하는, +를 사용합니다.
str = "ああああ「あ」い「うう」ええ「おおお」かかか「」"
puts str.scan(/「.+?」/)
=>「あ」「うう」「おおお」
「」를 매치시키고 싶은 경우는, 0문자 이상으로 매치하는, *를 사용합니다.
str = "ああああ「あ」い「うう」ええ「おおお」かかか「」"
puts str.scan(/「.*?」/)
=>「あ」「うう」「おおお」「」
C'est fini
Reference
이 문제에 관하여(이것으로 알았다! 최단 매치), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/pyon_kiti_jp/items/15d35e7e70d09e6e9b60
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
str = "ああああ「あ」い「うう」ええ「おおお」かかか"
이러한 문자열 중에서, 괄호로 둘러싸인 부분만 추출하고 싶은(즉, 「아」 「우우」 「오오오」의 3개소를 추출하고 싶은) 경우, 최단 매치를 이용하게 됩니다.그 전에 간단한 움직임에서 확인해 보자.
+는, 1 문자 이상으로 매치 하기 때문에, 이 예에서는 매치 하지 않습니다.
str = "ああああ「」"
puts str.scan(/「.+」/)
=>マッチしない
*는 0문자 이상으로 매치하기 때문에 이 예에서는 매치합니다.
str = "ああああ「」"
puts str.scan(/「.*」/)
=>「」
다음의 경우는 어떨까
그 문자가 1 문자이기 때문에 매치합니다.
str = "ああああ「あ」"
puts str.scan(/「.+」/)
=>「あ」
이쪽도, 그 문자가 0문자 있으므로 매치합니다. 결과적으로 동일합니다.
str = "ああああ「あ」"
puts str.scan(/「.*」/)
=>「あ」
조금, 주제에 들어갑니다.
이 예라고 하면, 최초로 출현한, 「와, 최종에 출현한,」로 둘러싸인 부분에서 매치해 버립니다. 하고 싶은 것은 이것이 아닙니다.
str = "ああああ「あ」い「うう」ええ「おおお」かかか"
puts str.scan(/「.+」/)
=>「あ」い「うう」ええ「おおお」
그렇다면 어떻게해야합니까?
? 를 추가하면 최단 매치를 해줍니다.
str = "ああああ「あ」い「うう」ええ「おおお」かかか"
puts str.scan(/「.+?」/)
=>「あ」「うう」「おおお」
축하합니다.
이렇게하면 어떻게됩니까?
+ 대신에, *로 해도 결과적으로는 같습니다만・・・
str = "ああああ「あ」い「うう」ええ「おおお」かかか"
puts str.scan(/「.*?」/)
=>「あ」「うう」「おおお」
「」를 매치시키고 싶은지, 시키고 싶지 않은가에서, +와 *를 구분하는 것이 됩니다.
「」를 매치시키고 싶지 않은 경우는, 1 문자 이상으로 매치하는, +를 사용합니다.
str = "ああああ「あ」い「うう」ええ「おおお」かかか「」"
puts str.scan(/「.+?」/)
=>「あ」「うう」「おおお」
「」를 매치시키고 싶은 경우는, 0문자 이상으로 매치하는, *를 사용합니다.
str = "ああああ「あ」い「うう」ええ「おおお」かかか「」"
puts str.scan(/「.*?」/)
=>「あ」「うう」「おおお」「」
C'est fini
Reference
이 문제에 관하여(이것으로 알았다! 최단 매치), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/pyon_kiti_jp/items/15d35e7e70d09e6e9b60텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)