UiPath 정규식 빌더를 사용하여 정보를 추출하는 방법

개요



UiPath의 기능 「정규 표현 빌더」를 사용해, 원하는 정보를 추출하는 방법을 정리했습니다.

일의 시작



사내 멤버의 질문으로 시작되었습니다.
「취득한 텍스트로부터 메일 주소만을 잘 꺼내는 방법은 없을까?」
나 「확실히 정규 표현을 만들기 쉽게 하는 액티비티가 있었다고 생각하기 때문에 조사해 보겠네요!」

어떤 활동?


  • 정규 표현식을 사용하여 해당 문자열의 유무를 결정하는 '문자열 일치 확인'활동
  • 정규 표현식을 사용하여 해당 문자열을 추출하는 '일치하는 문자열 검색'활동

  • 를 설정하는 경우에 「정규 표현 빌더」라고 불리는 정규 표현을 구축, 검증할 수 있는 화면이 표시됩니다


    샘플 로봇을 만들어 보았습니다.



    GitHub 에 샘플을 올렸습니다.


    정규식 빌더 사용법



    이번에는 프리셋에서 지정한 '메일 주소'라는 정규 표현식을 사용했지만, 그 밖에도 '행두', '줄 끝', 'URL', '미국식 날짜' 등 다양한 프리셋 외에도 스스로 정규식을 만들 수도 있습니다.
    또, 테스트용 텍스트를 입력하는 것으로, 정규 표현이 제대로 의도한 캐릭터 라인을 인식, 취득 할 수 있을지 확인도 할 수 있습니다.
    자세한 내용은 공식 가이드 (RegEx Builder 마법사)을 참조하십시오.

    각 액티비티를 사용하는 데 조심하십시오.



    '문자열 일치 확인' 활동 주의사항



    확인 결과는 Boolean 형식으로 출력됩니다.



    출력하는 변수의 형태는 Boolean형이므로, 체크시에 몇개의 해당 캐릭터 라인이 포함되어 있는지까지는 확인할 수 없습니다
    ※확인하고 싶은 경우는 「일치하는 문자열을 취득」액티비티에서 취득한 값으로 판별(취득한 값.Length) 하는 것이 좋을까…

    "일치하는 문자열 가져오기" 액티비티



    출력되는 변수의 형태는 IEnumerable<Match>형



    별로 익숙하지 않은 형태입니다만, 정규 표현으로 합치한 결과가 배열로서 보관 유지됩니다.
    출력 변수 이름을 저장하는 상자에서 Ctrl+K를 눌러 자동으로 적절한 유형의 변수를 즉시 생성할 수 있으므로,
    그 방법으로 대응하는 것이 좋다고 생각합니다
    또한 배열이므로 반복 (컬렉션의 각 요소) 활동을 사용하여 반복 처리를 할 수 있습니다.
    ※ 속성에서 TypeArgument를 System.Text.RegularExpressions.Match로 변경하는 것을 잊지 마세요!


    마지막으로



    추천 정규 표현에 대해 배울 수있는 사이트가 있으면 알려주세요 ...

    좋은 웹페이지 즐겨찾기