Expressões Regulares III - âncoras, limites de palavras e caracteres de palavras

앙코라스



"Âncora"é o nome que damos para os caracteres^ e$ . ^ significa o início da linha e $ significa o fim da linha.
다음 정규식을 사용하십시오.
^[Tt]este
e aplicá-la ao seguinte texto

Teste unitário é um tipo de teste que visa testar
apenas uma unidade de código, como um fluxo determinado de
uma função.


A regex vai dar match apenas no primeiro Teste porque ele está no início da linha, Representativeado pelo ^ . A mesma coisa acontece com$ .

정규식nunca$응용 프로그램 없음 텍스트

Lembre-se, nunca diga nunca


vai dar match somente no segundo nunca .

리미트 드 팔라브라스


Limites de palavras é o nome que damos ao caracter especial \b . Ele serve para darmos match no início ou no final de uma palavra.

정규식\bvelaplicado sobre o textoO vel da noiva é invisívelvai dar match apenas na palavravel , porque\b dá o match no limite da palavra.

Em contrapartida, o caracter \B vai dar match em posições que \b não dá match.
\Bvelaplicado sobre o textoO vel da noiva é invisível일치 번호 vel de invisível .

Mas como a engine sabe que a palavra acabou? Como ela 결정 o final da palavraanti-herói ? \b 일치하지 않는 \w não dá. \w 에 chamado 드 word character . Ele dá는 "caracteres de palavras", então as letras do alfabeto, algarismos e underline(_)과 일치합니다. Algumas는 Python을 수행하는 엔진인 Padrão에서 Unicode를 지원하는 정규식을 구현합니다. Nas que não suportam, o ó de herói não será reconhecido como \w se não for colocada uma flag, que na maioria dos flavor é u . Falaremos sobre flags mais pra frente.
아니오, nenhuma engine de regex dá match no hífen(- ). Então se você quiser que a sua engine dê match em anti-herói , você precisará da seguinte regex
/[\w-]+/u
Assim você engloba tanto todos os caracteres Representatives por \w e o hífen.
Notem que eu coloquei duas barras (/ ), uma no começo e uma no final da regex. Esses são os separadores e indicam quando a regex começa e termina. Esses separadores não foram incluídos porque não eram necessários para a explicação, mas por conta da flag u, foi preciso incluí-los. Novamente, falaremos sobre flags mais pra frente.

결론



Nessa parte foi a primeira vez que eu falei de flavor de regex. É importante falar sobre isso porque o que a gente chama de regex é na verdade uma especificação. Cada linguagem ou plataforma implementa de uma maneira diferente essa especificação, então agora é a primeira vez que digo uma das regras da regex, que eu mesmo formulei.

Regra 3: regex에서 엔진을 사용할 수 없음

Até a proxima.

좋은 웹페이지 즐겨찾기