Preferencias de cookies
Usamos cookies para analítica. Política de privacidad Puedes aceptar o rechazar el seguimiento no esencial.
Guía práctica sobre «Recetas Regex para limpieza de datos CRM y CSV»: pasos clave, errores comunes e implementación con Probador de expresiones regulares.
Ir a la herramienta
Pruebe expresiones regulares con grupos de captura y resaltado de coincidencias en vivo.
Los datos sucios del CRM cuestan dinero real: correos electrónicos rechazados, contactos duplicados, fusiones de correo defectuosas. Aquí tienes 5 patrones de regex probados en combate que limpian los problemas más comunes. Prueba cada uno en el Regex Tester antes de ejecutarlos en datos de producción.
Elimina todo excepto los dígitos y el + inicial:
Patrón: [^\d+]
Reemplazo: (vacío)
Banderas: gEntrada: (555) 123-4567 → Salida: 5551234567
Entrada: +1-800-555-0199 → Salida: +18005550199
Luego formatea programáticamente:
const digits = phone.replace(/[^\d+]/g, '');
// Formato US: +1 (XXX) XXX-XXXXCaptura correos electrónicos obviamente inválidos antes de que ingresen a tu CRM:
Patrón: ^[^\s@]+@[^\s@]+\.[^\s@]+$Coincide con: [email protected], [email protected]
Rechaza: user @example, @missing.com, no-at-sign.com
Este es un filtro práctico, no conforme a RFC 5322. Para producción, combínalo con la búsqueda de registros MX.
Las exportaciones CSV y el copiar-pegar a menudo introducen espacios adicionales:
Patrón: \s{2,}
Reemplazo: (un espacio)
Banderas: gEntrada: John Smith Jr → Salida: John Smith Jr
También recorta los espacios en blanco al principio y al final con ^\s+|\s+$ (banderas: gm para múltiples líneas).
Extrae los dominios de empresa de una lista de URLs de sitios web:
Patrón: https?:\/\/([^\/]+)
Grupo de captura 1 = dominioEntrada: https://www.acme-corp.com/about → Grupo 1: www.acme-corp.com
Para eliminar www.:
Patrón: https?:\/\/(?:www\.)?([^\/]+)Los analizadores CSV a veces dejan comillas y espacios aislados:
Patrón: ^[\s"]+|[\s"]+$
Reemplazo: (vacío)
Banderas: g (aplicar por campo)Entrada: " Acme Corp " → Salida: Acme Corp
Para comillas dobles escapadas dentro de campos:
Patrón: ""
Reemplazo: "import re
def clean_crm_row(row: dict) -> dict:
if 'phone' in row:
row['phone'] = re.sub(r'[^\d+]', '', row['phone'])
if 'email' in row:
row['email'] = row['email'].strip().lower()
if 'company' in row:
row['company'] = re.sub(r'\s{2,}', ' ', row['company']).strip()
return rowPega cada patrón en el Regex Tester con datos de muestra para verificar las coincidencias y capturas antes de aplicarlos a gran escala.
Este artículo es revisado por el equipo editorial de Tools Hub para validar precisión, relevancia práctica y consistencia con los flujos actuales del producto.
Última revisión:
Guía práctica sobre «Asistente Regex AI para flujos de trabajo de limpieza de datos de CRM»: pasos clave, errores comunes e implementación con Probador de expresiones regulares.
Guía práctica sobre «Flujo de trabajo de depuración de expresiones regulares con asistente de IA y muestras de prueba»: pasos clave, errores comunes e implementación con Probador de expresiones regulares.
Guía práctica sobre «Guía de limpieza de datos de Regex para importaciones de CRM y CSV»: pasos clave, errores comunes e implementación con AI para Construir Regex.
Guía práctica sobre «Enlaces profundos de Telegram con texto precargado»: pasos clave, errores comunes e implementación con Links de Mensajería.