Что такое регулярные выражения (регулярки, regexp)
По просьбе подписчиков в этом видео совсем немного затронем регулярки. Напишем несколько показательных примеров и подумаем о необходимости их понимания.
Плюсы регулярных выражений:
1) Python очень быстро и эффективно работает с регулярками, быстрее многих других ЯП, в том числе компилируемых
2) могут помочь там, где иначе пришлось бы предпринять много лишних действий (разбить текст, вырезать знаки препинания и т.п.)
3) при определенных условиях могут быть короткими и читаемыми
Минусы:
синтаксис! Он не связан с языком программирования, не всегда понятен, для сложных шаблонов может быть большая строка, состоящая из набора разных символов, что не добавляет оптимизма.
Где регулярки выигрывают - там где большой текст или сложный шаблон для поиска. Понятно что фразу из 3 слов проще и быстрее обработать методами строки, но по мере роста объемов текста и сложности шаблона регулярки выходят на первый план и по скорости и по краткости.
Совет из практики: если регулярка(само выражение) большая, то вынесите ее в константы с понятным именем и напишите коммент с примером ее работы.
Каждому питонисту советую прочесть документацию библиотеку re чисто для ознакомления, чтобы было представление о том, что там есть. Тем, кто парсит сайты и работает с текстами -регулярки нужно просто знать!
Официальная документация:
Отличнейший онлайн - инструмент тестирования/изучения регулярок
Книга Яна Гойвертса «Регулярные выражения. Сборник рецептов. 2-е издание» - читать!
Присоединяйтесь к помощи каналу, будет интересно)
✔️Бусти
Будь первым везде и всегда, включай уведомления о новых выпусках 🔔
#Python #PythonRussian #PyCharm #regexp
45 views
1982
646
2 months ago 00:03:32 1
SAMITOV - Мира (Премьера/2024)
2 months ago 01:31:41 1
ВАДИМ САМОЙЛОВ о судьбе «Агаты Кристи», культуре протеста, патриотизме и поиске истины