Настройки cookie
Мы используем cookie для аналитики. Политика конфиденциальности Вы можете принять или отклонить необязательный трекинг.
Практический гайд по теме «Рецепты регулярных выражений для очистки данных CRM и CSV»: ключевые шаги, типичные ошибки и внедрение через Тестер регулярных выражений.
Перейти к инструменту
Тестирование регулярных выражений с подсветкой совпадений и группами захвата.
Грязные данные в CRM стоят реальных денег: отказы email-рассылок, дубликаты контактов, испорченные слияния. Вот 5 проверенных regex-паттернов для решения самых частых проблем. Проверяйте каждый в Regex Tester перед применением к боевым данным.
Убрать всё, кроме цифр и ведущего +:
Паттерн: [^\d+]
Замена: (пусто)
Флаги: gВход: (555) 123-4567 → Выход: 5551234567
Вход: +7-999-123-45-67 → Выход: +79991234567
Затем форматируйте программно:
const digits = phone.replace(/[^\d+]/g, '');
// Формат RU: +7 (XXX) XXX-XX-XXОтсеять очевидно невалидные адреса до попадания в CRM:
Паттерн: ^[^\s@]+@[^\s@]+\.[^\s@]+$Совпадает: [email protected], [email protected]
Отклоняет: user @example, @missing.com, no-at-sign.com
Это практичный фильтр, а не полное соответствие RFC 5322. Для продакшена дополните проверкой MX-записей.
Экспорт CSV и копирование часто добавляют лишние пробелы:
Паттерн: \s{2,}
Замена: (один пробел)
Флаги: gВход: Иванов Пётр Сергеевич → Выход: Иванов Пётр Сергеевич
Также убирайте пробелы по краям: ^\s+|\s+$ (флаги: gm для многострочного режима).
Вытащить домен компании из списка URL:
Паттерн: https?:\/\/([^\/]+)
Группа захвата 1 = доменВход: https://www.acme-corp.com/about → Группа 1: www.acme-corp.com
Чтобы убрать www.:
Паттерн: https?:\/\/(?:www\.)?([^\/]+)CSV-парсеры иногда оставляют лишние кавычки и пробелы:
Паттерн: ^[\s"]+|[\s"]+$
Замена: (пусто)
Флаги: g (применять к каждому полю)Вход: " Acme Corp " → Выход: Acme Corp
Для экранированных двойных кавычек внутри полей:
Паттерн: ""
Замена: "import re
def clean_crm_row(row: dict) -> dict:
if 'phone' in row:
row['phone'] = re.sub(r'[^\d+]', '', row['phone'])
if 'email' in row:
row['email'] = row['email'].strip().lower()
if 'company' in row:
row['company'] = re.sub(r'\s{2,}', ' ', row['company']).strip()
return rowВставьте каждый паттерн в Regex Tester с тестовыми данными, чтобы убедиться в корректности совпадений и захватов перед применением к реальной базе.
Материал проверен редакцией Tools Hub на точность формулировок, практическую применимость и соответствие актуальным сценариям использования инструментов.
Проверено:
Практический гайд по теме «Regex AI Assistant для рабочих процессов очистки данных CRM»: ключевые шаги, типичные ошибки и внедрение через Тестер регулярных выражений.
Практический гайд по теме «Рабочий процесс отладки регулярных выражений с помощью AI Assistant и тестовых примеров»: ключевые шаги, типичные ошибки и внедрение через Тестер регулярных выражений.
Практический гайд по теме «Пособие по очистке данных Regex для импорта CRM и CSV»: ключевые шаги, типичные ошибки и внедрение через AI-конструктор регулярных выражений.
Практический гайд по теме «Глубокие ссылки Telegram с предварительно заполненным текстом»: ключевые шаги, типичные ошибки и внедрение через Генератор ссылок мессенджеров.