Automation Anywhere의 Before-After를 사용하여 웹 페이지 데이터 추출

공부를 해 보았으므로 비망록으로 남겨두려고 생각합니다.

예를 들어, 대상 웹 페이지에 다음과 같은 테이블이 있다고 가정합니다.


이름
나이
성별


다나카
20
남자

스즈키
22
남자

다카하시
24
여자


Automation Anywhere의 Before-After 명령에서
추출 대상 문자열에서 Before로 설정된 문자열과 After로 설정된 문자열을 찾습니다.
그 사이에 있는 문자열을 얻을 수 있습니다.

· Before-After 명령 설정 화면




  • Source String
  • 추출하고 싶은 문자열 (이번이면 테이블의 소스 코드)

  • Before
  • 추출 조건의 시작 문자

  • After
  • 추출 조건의 끝 문자

  • Assign The Output To Varidate
  • 추출한 결과를 대입하는 변수


  • 추출하려는 테이블의 소스가 다음과 같다고 가정합니다.
    <tr class="rankingTabledata">
    <td class="txtcenter">田中</td>
    <td class="txtleft">20</td>
    <td class="txtleft"></td>
    </tr>
    <tr class="rankingTabledata">
    <td class="txtcenter">鈴木</td>
    <td class="txtleft">22</td>
    <td class="txtleft"></td>
    </tr>
    <tr class="rankingTabledata">
    <td class="txtcenter">高橋</td>
    <td class="txtleft">24</td>
    <td class="txtleft"></td>
    </tr>
    

    이름
    Before<td class="txtcenter">After</td">
    나이
    Before<td class="txtleft>After</td">
    성별
    Before<td class="txtleft>After</td">
    로 설정하여 추출할 수 있습니다.
  • Occurrence
  • 여기서 지정한 회수분 추출 조건 문자가 발견된 개소로부터 캐릭터 라인 추출을 실시하기 위한 설정치가 됩니다.


  • 예를 들어, 이름을 추출할 때
    Occurrence를 1로 설정하면 "다나카"가
    Occurrence를 2로 설정하면 "스즈키"가 추출됩니다.

    음, 여기서 한 가지 문제가 있습니다.
    연령과 성별의 클래스명이 같기 때문에 이대로는, 잘 생각한 대로의 값을 취할 수 없습니다.

    그래서 Occurrence를 잘 사용합니다.
    연령 추출 시에는 1을.
    성별 추출시 2.
    이렇게 하면, 1회째에 매치한 개소와 2회째에 매치한 개소로부터 각각 가져올 수 있습니다.

    Occurrence에 루프 카운터를 사용하여 계속 데이터 취득도 가능합니다.
    다만 이번 케이스라면 연령과 성별의 카운터는 따로 관리하지 않으면 안 되는 점에 주의입니다.

    좋은 웹페이지 즐겨찾기