10 RegEx Tester för JavaScript, Python, PHP, Golang, Ruby, etc.

Regex-uttryck kan vara jobbigt. Nåväl, ibland!

Låt oss lära oss om reguljära uttryck och deras mönster. Vi kommer att undersöka sådana mönster som verkar som en krystad soppa av karaktärer. Vi kommer att se vad varje karaktär i ett reguljärt uttryck betyder.

Efter att ha läst den här artikeln kommer du att kunna skapa dina reguljära uttryck och använda dem som du vill. I slutändan kommer vi också att lista några av RegEx-testverktygen online så att du baserat på krav kan skapa ditt RegEx och testa det med dessa verktyg.

Introduktion

Reguljära uttryck eller som det är allmänt känt – RegEx är vilken sekvens av tecken som helst som kan användas som ett mönster för att söka efter tecken eller strängar.

Till exempel – för att avgöra om en sträng eller en fras innehåller ordet ”äpple” kan vi använda det vanliga uttrycket ”/apple” för att söka i strängen. Som ett annat exempel kan vi använda ”/[0-9]” för att kontrollera om en given sträng innehåller ett tal mellan 0 och 9.

Reguljära uttryck och deras användning

Reguljära uttryck används i stor utsträckning för en mängd olika syften i moderna webbrelaterade verksamheter. Validering av webbformulär, webbsökmotorer, lexikalanalysatorer i IDE, textredigerare och dokumentredigerare är några exempel där reguljära uttryck ofta används.

Vi har alla använt ”CTRL + F” många gånger för att söka i ett dokument eller en kodbit för att hitta ett visst ord eller en fras eller ett uttryck. Denna operation kan pekas ut som ett mycket vanligt exempel på användningen av reguljära uttryck.

Innan vi går vidare, låt oss ta en titt på ett mycket vanligt reguljärt uttryck.

Kan du gissa 🤔 RegEX nedan vad den används till?

^([a-zA-Z0-9_-.]+)@([a-zA-Z0-9_-.]+).([a-zA-Z]{2,5})$

Oroa dig inte om du inte kan gissa det. Jag är säker på att du skulle kunna gissa i slutet av den här artikeln.

Låt oss först börja med A, B, C i RegEx.

Polletter

Till att börja med, låt oss titta på de olika symbolerna i Regex som visas ovan.

^([a-zA-Z0-9_-.]+)@([a-zA-Z0-9_-.]+).([a-zA-Z]{2,5})$

Om vi ​​tittar på det regex som ges ovan kan vi se att det består av många symboler eller tecken eller tokens. Låt oss ta reda på vad de betyder:

Tecken

Menande

^

Denna token anger början på en sträng.

(…)

Detta betecknar en grupp där allt som ges inom (…) fångas.

[…]

De [] omsluter tecken som alla kan matchas. Till exempel – [abc] kommer att matcha antingen a eller b eller c.

az

Uppsättningen av små bokstäver från a till z. Vi måste komma ihåg att Regex är skiftlägeskänsligt.

AZ

Uppsättningen av versaler från A till Ö.

0-9

Siffrorna från 0 till 9.

_

Detta kommer att matcha tecknet _.

Detta är flyktkaraktären.

.

Detta matchar tecknet ”.” bokstavligen. Detta används eftersom symbolen ”.” i regex är en token i sig som matchar vilken karaktär som helst

+

Detta är en kvantifierare. Detta matchar ett eller flera tecken som det används med. Till exempel betyder a+ en eller flera förekomster av tecknet a.

Detta kommer att matcha tecknet ”-”.

@

Detta kommer att matcha tecknet ”@”.

{}

Detta är en annan kvantifierare. Det används för att beteckna antalet förekomster av ett tecken. Till exempel betyder a{3} exakt 3 a:n.

$

Detta anger slutet på en sträng.

Bryt ner det givna Regex-mönstret

Nu, beväpnad med denna preliminära kunskap om tokens, låt oss försöka avkoda ovanstående reguljära uttryck:

  • ^([a-zA-Z0-9_-.]+) betyder att vi letar efter en sträng som börjar med minst en eller flera versaler eller gemener alfanumeriska tecken, understreck, bindestreck eller punkter. Till exempel kommer allt som liknar user_name.01 att matcha mönstret. Vi måste komma ihåg att här behöver du inte inkludera alla symboler, bara en karaktär [a-zA-Z0-9_-.] ska göra.
  • @-tecknet matchar en enda förekomst av @. Lägger till det tidigare exemplet, något liknande [email protected] kommer passa.
  • ([a-zA-Z0-9_-.]+) liknar den första punkten. Det betyder också att vi letar efter en sträng som innehåller minst ett eller flera alfanumeriska tecken, understreck, bindestreck eller punkter. Lägg till exemplet, [email protected] kommer att passa här.
  • Som du kanske redan har gissat antyder vi ett e-postmönster. Gå vidare, . matchar singeln ”.” karaktär. Om vi ​​fortsätter med det pågående exemplet, något som [email protected]
  • ([a-zA-Z]{2,5})$ detta betyder att strängen ska sluta med 2 till 5 bokstäver, antingen versaler eller gemener. Om vi ​​lägger till .com i föregående exempel kan vi få [email protected]som är det vanliga mönstret för en e-poststräng.

Genom att kombinera allt ovan kan vi se att vi söker efter en e-post-id-sträng. Nu kan vi använda detta uttryck för att validera vilket e-post-ID som helst. Om vårt test-e-post-ID matchar detta mönster kan vi säga att det är ett giltigt e-post-ID.

PS – Detta är ett mönster för de vanligaste e-post-ID:n på webben.

Typer av tokens

Många tokens kan användas i olika kombinationer inom ett Regex för att beskriva en mängd olika uttryck. Nedan ska vi ta en titt på de olika typerna av tokens som används i reguljära uttryck. Dessutom kommer vi också att titta på de vanligaste tokens i varje kategori.

Grundläggande tokens

Låt oss börja med de grundläggande tokens. Dessa tokens används med nästan alla reguljära uttryck. Därför måste vi lära oss om dem först.

Tecken

Menande

r

Detta matchar vagnreturtecknet.