Налаштування cookie
Ми використовуємо cookie для аналітики. Політика конфіденційності Ви можете прийняти або відхилити необов'язкове відстеження.
Практичний гайд на тему «Рецепти регулярних виразів для очищення даних CRM і CSV»: ключові кроки, типові помилки та впровадження через Regex Тестер.
Перейти до інструменту
Тестування регулярних виразів з підсвічуванням збігів.
Брудні дані CRM коштують справжніх грошей: відправлені електронні листи повертаються, контакти дублюються, зливаються дані. Тут наведено 5 перевірених шаблонів regex, які усувають найпоширеніші проблеми. Перевірте кожен із них у Regex Tester перед застосуванням до робочих даних.
Видаліть усе, крім цифр та провідного +:
Шаблон: [^\d+]
Заміна: (порожньо)
Прапори: gВхідні дані: (555) 123-4567 → Вихідні дані: 5551234567
Вхідні дані: +1-800-555-0199 → Вихідні дані: +18005550199
Потім відформатуйте програмно:
const digits = phone.replace(/[^\d+]/g, '');
// Формат США: +1 (XXX) XXX-XXXXПерехопіть очевидно недійсні електронні адреси до того, як вони потраплять до вашої CRM:
Шаблон: ^[^\s@]+@[^\s@]+\.[^\s@]+$Збіги: [email protected], [email protected]
Відхилення: user @example, @missing.com, no-at-sign.com
Це практичний фільтр, а не відповідний RFC 5322. Для виробництва використовуйте його разом із перевіркою записів MX.
Експорти CSV та копіювання часто вводять додаткові пробіли:
Шаблон: \s{2,}
Заміна: (один пробіл)
Прапори: gВхідні дані: John Smith Jr → Вихідні дані: John Smith Jr
Також обріжте провідні та кінцеві пробіли за допомогою ^\s+|\s+$ (прапори: gm для багаторядкового формату).
Витягніть домени компаній зі списку URL-адрес веб-сайтів:
Шаблон: https?:\/\/([^\/]+)
Група захоплення 1 = доменВхідні дані: https://www.acme-corp.com/about → Група 1: www.acme-corp.com
Щоб видалити www.:
Шаблон: https?:\/\/(?:www\.)?([^\/]+)Парсери CSV іноді залишають зайві лапки та пробіли:
Шаблон: ^[\s"]+|[\s"]+$
Заміна: (порожньо)
Прапори: g (застосувати до кожного поля)Вхідні дані: " Acme Corp " → Вихідні дані: Acme Corp
Для втечених подвійних лапок всередині полів:
Шаблон: ""
Заміна: "import re
def clean_crm_row(row: dict) -> dict:
if 'phone' in row:
row['phone'] = re.sub(r'[^\d+]', '', row['phone'])
if 'email' in row:
row['email'] = row['email'].strip().lower()
if 'company' in row:
row['company'] = re.sub(r'\s{2,}', ' ', row['company']).strip()
return rowВставте кожен шаблон у Regex Tester із зразковими даними, щоб перевірити збіги та захоплення перед застосуванням у великих масштабах.
Цю статтю перевіряє редакція Tools Hub на точність фактів, практичну цінність і відповідність актуальним продуктовим сценаріям.
Остання перевірка:
Практичний гайд на тему «Regex AI Assistant для робочих процесів очищення даних CRM»: ключові кроки, типові помилки та впровадження через Regex Тестер.
Практичний гайд на тему «Робочий процес налагодження регулярних виразів із AI Assistant і тестовими зразками»: ключові кроки, типові помилки та впровадження через Regex Тестер.
Практичний гайд на тему «Посібник з очищення даних регулярних виразів для імпорту CRM та CSV»: ключові кроки, типові помилки та впровадження через AI генератор Regex.
Практичний гайд на тему «Глибинні посилання Telegram із попередньо заповненим текстом»: ключові кроки, типові помилки та впровадження через Посилання Месенджерів.