RFPS09

Como Usar?

O maestro converte a linguagem natural do usuário em comandos de busca REGEX para utilização em bancos de dados como o PostgreSQL. Ele cria uma expressão regular a partir da entrada do usuário, visando identificar padrões específicos em um texto.
Exemplo:
Entrada: "Número & (Telefone, Celular)"
Saída: "^((?=.*(NUMERO))((?=.*(TELEFONE))|(?=.*(CELULAR))))"

PostgreSQL:

Exemplos de uso do REGEX:
  Exemplo-1: O texto corresponde ao REGEX, diferenciando maiúsculas de minúsculas.
SQL
select *
from [TABELA]
where [COLUNA] ~ '[REGEX]'

  Exemplo-2: O texto corresponde ao REGEX, sem distinção entre maiúsculas e minúsculas.
SQL
select *
from [TABELA]
where [COLUNA] ~* '[REGEX]'

  Exemplo-3: O texto não corresponde ao REGEX, diferenciando maiúsculas de minúsculas.
SQL
select *
from [TABELA]
where [COLUNA] !~ '[REGEX]'

  Exemplo-4: O texto não corresponde ao REGEX, sem distinção entre maiúsculas e minúsculas.
SQL
select *
from [TABELA]
where [COLUNA] !~* '[REGEX]'

Operadores:

 Os operadores lógicos suportados pelo Maestro são o "E" e o "OU".
Operador "E":
  Para usar o operador "E" no Maestro, apenas precisa separar os termos de busca usando o &(E comercial).
  Exemplo: Queremos buscar documentos que possuam a palavra "telefone" E "celular" no texto.
   Entrada: "Telefone & Celular"
   Saída: "^((?=.*(TELEFONE))(?=.*(CELULAR)))"
Operador "OU":
  Para usar o operador "OU" no Maestro, apenas precisa separar os termos de busca usando vírgula(,).
  Exemplo: Queremos buscar documentos que possuam a palavra "telefone" OU "celular" no texto.
   Entrada: "Telefone, Celular"
   Saída: "^((?=.*(TELEFONE))|(?=.*(CELULAR)))"

Curingas:

 Os curingas suportados pelo Maestro são o "%" e o "_".
Curinga "%":
  O curinga de porcentagem(%) representa zero, um ou vários caracteres. Porém diferente do operador "LIKE" do PostgreSQL, as expressões regulares não precisam indicar que podem vir um ou mais caracteres antes ou depois do termo buscado. O principal uso desse curinga se dá quando queremos indicar que podem ter zero, um ou vários caracteres no meio do termo buscado.
  Exemplo: Queremos buscar documentos que possuam o nome "Rafael", mas não sabemos se no documeto tá escrito "Raphael" ou "Rafael" no texto.
   Entrada: "Ra%ael"
   Saída: "^((?=.*(RA.*AEL)))"
Curinga "_":
  O curinga de sublinhado(_) representa zero ou um caractere. O principal uso desse curinga se dá quando queremos indicar que pode ter ou não um caractere no meio do termo buscado.
  Exemplo: Queremos buscar documentos que possuam o número de telefone 9898-5454, mas não sabemos se no documento está escrito com ou sem hífen.
   Entrada: "9898_5454"
   Saída: "^((?=.*(9898.?5454)))"

Sigla:

 O maestro reserva os caracteres "{}" para indicar que o termo não pode está entre caracteres de letras e números. O principal uso desse recurso se dá quando queremos encontrar uma sigla no documento.
Exemplo: Queremos buscar documentos que possuam a sigla "PA" de Pará, mas não queremos retornar documentos que contenham termos como "Papel", "Pato", "Parque" e "Pastel", sem que o documentos tenha a sigla "PA" presente no corpo do documento.
  Entrada: "{PA}"
  Saída: "^((?=.*(\bPA\b)))"

Agrupadores:

 O maestro reserva os caracteres "()" para definir a ordem de precedência das operações em uma expressão lógica. Eles ajudam a agrupar partes específicas da expressão para garantir que essas partes sejam avaliadas juntas antes das outras. Isso é especialmente útil quando você tem uma expressão complexa com múltiplos operadores lógicos, como "E" e "OU".
Exemplo: Queremos buscar documentos que possuam o termo "Número" e "Telefone" ou "Celular", ou seja, queremos encontrar tanto "Número de Telefone" quanto "Número de Celular", mas não queremos apenas "Número". Para isso podemos fonercer duas entradas que retornam os mesmos documentos.
  Entrada-1: "(Número & Telefone), (Número & Celular)"
  Saída-1: "^(((?=.*(NUMERO))(?=.*(TELEFONE)))|((?=.*(NUMERO))(?=.*(CELULAR))))"

  Entrada-2: "Número & (Telefone, Celular)"
  Saída-2: "^((?=.*(NUMERO))((?=.*(TELEFONE))|(?=.*(CELULAR))))"