Préférences de cookies
Nous utilisons des cookies pour l'analyse. Politique de confidentialité Vous pouvez accepter ou refuser le suivi non essentiel.
Guide pratique sur « Recettes Regex pour le nettoyage des données CRM et CSV »: étapes clés, erreurs fréquentes et mise en œuvre avec Testeur d'expressions régulières.
Aller à l'outil
Testez les expressions régulières avec la mise en évidence des correspondances en direct et capturez des groupes.
Les données CRM sales coûtent de l'argent réel : e-mails rebondis, contacts en double, fusions de courrier incorrectes. Voici 5 modèles regex éprouvés qui nettoient les problèmes les plus courants. Testez chaque modèle dans le testeur Regex avant de l'exécuter sur des données de production.
Supprimez tout sauf les chiffres et le + initial :
Modèle : [^\d+]
Remplacement : (vide)
Drapeaux : gEntrée : (555) 123-4567 → Sortie : 5551234567
Entrée : +1-800-555-0199 → Sortie : +18005550199
Puis formatez de manière programmatique :
const digits = phone.replace(/[^\d+]/g, '');
// Format US : +1 (XXX) XXX-XXXXInterceptez les e-mails évidemment invalides avant qu'ils n'entrent dans votre CRM :
Modèle : ^[^\s@]+@[^\s@]+\.[^\s@]+$Correspondances : [email protected], [email protected]
Rejets : user @example, @missing.com, no-at-sign.com
Ceci est un filtre pratique, non conforme à RFC 5322. Pour la production, associez-le à une recherche de enregistrement MX.
Les exportations CSV et la copie-collage introduisent souvent des espaces supplémentaires :
Modèle : \s{2,}
Remplacement : (espace simple)
Drapeaux : gEntrée : John Smith Jr → Sortie : John Smith Jr
Également, supprimez les espaces au début et à la fin avec ^\s+|\s+$ (drapeaux : gm pour multiligne).
Extrayez les domaines de société à partir d'une liste d'URL de site Web :
Modèle : https?:\/\/([^\/]+)
Groupe de capture 1 = domaineEntrée : https://www.acme-corp.com/about → Groupe 1 : www.acme-corp.com
Pour supprimer www. :
Modèle : https?:\/\/(?:www\.)?([^\/]+)Les parseurs CSV laissent parfois des guillemets et des espaces errants :
Modèle : ^[\s"]+|[\s"]+$
Remplacement : (vide)
Drapeaux : g (appliquer par champ)Entrée : " Acme Corp " → Sortie : Acme Corp
Pour les doubles guillemets échappés à l'intérieur des champs :
Modèle : ""
Remplacement : "import re
def clean_crm_row(row: dict) -> dict:
if 'phone' in row:
row['phone'] = re.sub(r'[^\d+]', '', row['phone'])
if 'email' in row:
row['email'] = row['email'].strip().lower()
if 'company' in row:
row['company'] = re.sub(r'\s{2,}', ' ', row['company']).strip()
return rowCollez chaque modèle dans le testeur Regex avec des données d'échantillon pour vérifier les correspondances et les captures avant de les appliquer à grande échelle.
Cet article est relu par l’équipe éditoriale de Tools Hub pour garantir l’exactitude, la valeur pratique et la cohérence avec les workflows produit actuels.
Dernière vérification:
Guide pratique sur « Regex AI Assistant pour les flux de travail de nettoyage des données CRM »: étapes clés, erreurs fréquentes et mise en œuvre avec Testeur d'expressions régulières.
Guide pratique sur « Flux de travail de débogage Regex avec AI Assistant et échantillons de test »: étapes clés, erreurs fréquentes et mise en œuvre avec Testeur d'expressions régulières.
Guide pratique sur « Playbook de nettoyage des données Regex pour les importations CRM et CSV »: étapes clés, erreurs fréquentes et mise en œuvre avec AI Constructeur Regex.
Guide pratique sur « Liens profonds de télégramme avec texte pré-rempli »: étapes clés, erreurs fréquentes et mise en œuvre avec Liens Messagerie.