HTML 태그 와 정규 일치
document.body.innerHTML.match(/]*?>[^>]*?/gim)
/ / A 라벨 을 다른 것 으로 바 꾸 면 됩 니 다.
/ / 다음 단 계 는 관련 속성 추출 을 고려 합 니 다.
document.body.innerHTML.match(/]*?href=\"(.*?)\"[^>]*?>[^>]*?/gim)
그러나 주의해 야 할 것 은 JS 의 match 가 g 식별 자 를 사용 한 경우 결과 가 다 를 수 있다 는 점 이다 (W3C 에서 따 옴).
설명 하 다.
match () 방법 은 문자열 stringObject 를 검색 하여 regexp 와 일치 하 는 텍스트 를 하나 이상 찾 습 니 다.이 방법의 행 위 는 어느 정도 regexp 에 표지 g 가 있 는 지 여부 에 달 려 있다.
regexp 에 플래그 g 가 없 으 면 match () 방법 은 stringObject 에서 한 번 만 일치 할 수 있 습 니 다.일치 하 는 텍스트 를 찾 지 못 하면 match () 는 null 로 돌아 갑 니 다.그렇지 않 으 면 찾 은 일치 하 는 텍스트 와 관련 된 정 보 를 저장 하 는 배열 로 돌아 갑 니 다.이 배열 의 0 번 째 요 소 는 일치 하 는 텍스트 를 저장 하고 나머지 요 소 는 정규 표현 식 의 하위 표현 식 과 일치 하 는 텍스트 를 저장 합 니 다.이러한 일반적인 배열 요 소 를 제외 하고 돌아 오 는 배열 에는 두 개의 대상 속성 이 포함 되 어 있다.index 속성 성명 은 문자열 Object 에 있 는 텍스트 의 시작 문자 와 일치 하 는 위치 입 니 다. input 속성 성명 은 stringObject 에 대한 참조 입 니 다.
regexp 에 플래그 g 가 있 으 면 match () 방법 은 전역 검색 을 실행 하고 stringObject 의 모든 짝 짓 기 문자열 을 찾 습 니 다.일치 하 는 하위 문자열 을 찾 지 못 하면 null 로 돌아 갑 니 다.하나 이상 의 짝 짓 기 문자열 을 찾 으 면 배열 로 돌아 갑 니 다.그러나 전역 적 으로 일치 하 는 배열 의 내용 은 전자 와 크게 다 릅 니 다. 배열 요소 에는 stringObject 의 모든 일치 하 는 하위 문자열 이 저장 되 어 있 고 index 속성 이나 input 속성 도 없습니다.
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
Java에서 정규 표현식으로 html 태그 제거자바에서 정규 표현식은 html의 라벨을 제거하는데 주요 목적은 더욱 정확한 내용을 표시하는 것이다. 예를 들어 얼마 전에 블로그에서 글을 발표하는 것과 같은 기능을 했다. 편집기에서 내용을 입력하면 스타일 라벨도 ...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.