Como Usar?
O maestro converte a linguagem natural do usuário em comandos
de busca REGEX para utilização em bancos de dados como o PostgreSQL.
Ele cria uma expressão regular a partir da entrada do usuário,
visando identificar padrões específicos em um texto.
Exemplo:
Entrada: "Número & (Telefone, Celular)"
Saída: "^((?=.*(NUMERO))((?=.*(TELEFONE))|(?=.*(CELULAR))))"
PostgreSQL:
Exemplos de uso do REGEX:Exemplo-1: O texto corresponde ao REGEX, diferenciando maiúsculas de minúsculas.
select *
from [TABELA]
where [COLUNA] ~ '[REGEX]'
Exemplo-2: O texto corresponde ao REGEX, sem distinção entre maiúsculas e minúsculas.
select *
from [TABELA]
where [COLUNA] ~* '[REGEX]'
Exemplo-3: O texto não corresponde ao REGEX, diferenciando maiúsculas de minúsculas.
select *
from [TABELA]
where [COLUNA] !~ '[REGEX]'
Exemplo-4: O texto não corresponde ao REGEX, sem distinção entre maiúsculas e minúsculas.
select *
from [TABELA]
where [COLUNA] !~* '[REGEX]'
Operadores:
Os operadores lógicos suportados pelo Maestro são o "E" e o "OU".
Operador "E":
Para usar o operador "E" no Maestro,
apenas precisa separar os termos de busca usando o &(E comercial).
Exemplo: Queremos buscar documentos que possuam a palavra
"telefone" E "celular" no texto.
Entrada: "Telefone & Celular"
Saída: "^((?=.*(TELEFONE))(?=.*(CELULAR)))"
Operador "OU":
Para usar o operador "OU" no Maestro,
apenas precisa separar os termos de busca usando vírgula(,).
Exemplo: Queremos buscar documentos que possuam a palavra
"telefone" OU "celular" no texto.
Entrada: "Telefone, Celular"
Saída: "^((?=.*(TELEFONE))|(?=.*(CELULAR)))"
Curingas:
Os curingas suportados pelo Maestro são o "%" e o "_".
Curinga "%":
O curinga de porcentagem(%) representa zero, um ou vários caracteres.
Porém diferente do operador "LIKE" do PostgreSQL, as expressões regulares não
precisam indicar que podem vir um ou mais caracteres antes ou depois do termo
buscado. O principal uso desse curinga se dá quando queremos indicar que podem
ter zero, um ou vários caracteres no meio do termo buscado.
Exemplo: Queremos buscar documentos que possuam o nome "Rafael",
mas não sabemos se no documeto tá escrito "Raphael" ou "Rafael" no texto.
Entrada: "Ra%ael"
Saída: "^((?=.*(RA.*AEL)))"
Curinga "_":
O curinga de sublinhado(_) representa zero ou um caractere.
O principal uso desse curinga se dá quando queremos indicar que pode
ter ou não um caractere no meio do termo buscado.
Exemplo: Queremos buscar documentos que possuam o
número de telefone 9898-5454, mas não sabemos se no documento está escrito com
ou sem hífen.
Entrada: "9898_5454"
Saída: "^((?=.*(9898.?5454)))"
Sigla:
O maestro reserva os caracteres "{}" para indicar que o termo não pode
está entre caracteres de letras e números. O principal uso desse recurso se
dá quando queremos encontrar uma sigla no documento.
Exemplo: Queremos buscar documentos que possuam
a sigla "PA" de Pará, mas não queremos retornar documentos que contenham termos
como "Papel", "Pato", "Parque" e "Pastel", sem que o documentos tenha a sigla
"PA" presente no corpo do documento.
Entrada: "{PA}"
Saída: "^((?=.*(\bPA\b)))"
Agrupadores:
O maestro reserva os caracteres "()" para definir a ordem de precedência
das operações em uma expressão lógica. Eles ajudam a agrupar partes específicas
da expressão para garantir que essas partes sejam avaliadas juntas antes das
outras. Isso é especialmente útil quando você tem uma expressão complexa com
múltiplos operadores lógicos, como "E" e "OU".
Exemplo: Queremos buscar documentos que possuam
o termo "Número" e "Telefone" ou "Celular", ou seja, queremos encontrar
tanto "Número de Telefone" quanto "Número de Celular", mas não queremos apenas
"Número". Para isso podemos fonercer duas entradas que retornam os mesmos documentos.
Entrada-1: "(Número & Telefone), (Número & Celular)"
Saída-1: "^(((?=.*(NUMERO))(?=.*(TELEFONE)))|((?=.*(NUMERO))(?=.*(CELULAR))))"
Entrada-2: "Número & (Telefone, Celular)"
Saída-2: "^((?=.*(NUMERO))((?=.*(TELEFONE))|(?=.*(CELULAR))))"