Preferências de cookies
Usamos cookies para análises. Política de Privacidade Você pode aceitar ou recusar rastreamento não essencial.
Guia prático sobre "Receitas Regex para limpeza de dados CRM e CSV": etapas principais, erros comuns e implementação com Testador Regex.
Vá para a ferramenta
Teste expressões regulares com destaque de partidas ao vivo e grupos de captura.
Dados de CRM sujos custam dinheiro real: emails devolvidos, contatos duplicados, junções de mala direta erradas. Aqui estão 5 padrões de regex testados em batalha que limpam os problemas mais comuns. Teste cada um deles no Testador de Regex antes de executar em dados de produção.
Remova tudo, exceto dígitos e o caractere + líder:
Padrão: [^\d+]
Substituição: (vazio)
Flags: gEntrada: (555) 123-4567 → Saída: 5551234567
Entrada: +1-800-555-0199 → Saída: +18005550199
Em seguida, formate programaticamente:
const digits = phone.replace(/[^\d+]/g, '');
// Formate US: +1 (XXX) XXX-XXXXCapture emails obviamente inválidos antes que eles entrem no seu CRM:
Padrão: ^[^\s@]+@[^\s@]+\.[^\s@]+$Combina: [email protected], [email protected]
Rejeita: user @example, @missing.com, no-at-sign.com
Este é um filtro prático, não compatível com RFC 5322. Para produção, combine com a verificação de registros MX.
Exportações de CSV e copiar-colar frequentemente introduzem espaços em branco extras:
Padrão: \s{2,}
Substituição: (espaço simples)
Flags: gEntrada: John Smith Jr → Saída: John Smith Jr
Também remova espaços em branco líderes e finais com ^\s+|\s+$ (flags: gm para multilinha).
Puxe domínios de empresa de uma lista de URLs de sites:
Padrão: https?:\/\/([^\/]+)
Grupo de captura 1 = domínioEntrada: https://www.acme-corp.com/about → Grupo 1: www.acme-corp.com
Para remover www.:
Padrão: https?:\/\/(?:www\.)?([^\/]+)Parsers de CSV às vezes deixam aspas e espaços perdidos:
Padrão: ^[\s"]+|[\s"]+$
Substituição: (vazio)
Flags: g (aplicar por campo)Entrada: " Acme Corp " → Saída: Acme Corp
Para aspas duplas escapadas dentro de campos:
Padrão: ""
Substituição: "import re
def clean_crm_row(row: dict) -> dict:
if 'phone' in row:
row['phone'] = re.sub(r'[^\d+]', '', row['phone'])
if 'email' in row:
row['email'] = row['email'].strip().lower()
if 'company' in row:
row['company'] = re.sub(r'\s{2,}', ' ', row['company']).strip()
return rowCole cada padrão no Testador de Regex com dados de amostra para verificar correspondências e capturas antes de aplicar em escala.
Este artigo é revisado pela equipe editorial da Tools Hub para garantir precisão, utilidade prática e consistência com os fluxos atuais do produto.
Última revisão:
Guia prático sobre "Assistente Regex AI para fluxos de trabalho de limpeza de dados de CRM": etapas principais, erros comuns e implementação com Testador Regex.
Guia prático sobre "Fluxo de trabalho de depuração Regex com AI Assistant e amostras de teste": etapas principais, erros comuns e implementação com Testador Regex.
Guia prático sobre "Manual de limpeza de dados Regex para importações de CRM e CSV": etapas principais, erros comuns e implementação com AI para Construir Regex.
Guia prático sobre "Links profundos do telegrama com texto pré-preenchido": etapas principais, erros comuns e implementação com Links de Mensageiro.