Поясню свой вопрос.
К примеру есть некий (мой собственный) формальный механизм описания двоичных файловых форматов.
К примеру для картинок (JPEG) это:
FF D8 FF E0 * 4A 46 49 46 00
Описывает заголовок и некий футер который финализирует последовательность.
Имея это описание я могу из произвольных ресурсов (pdf документ или образ диска)
извлекать картинки.
Пытаюсь придумать возможные limitations для regexp которые не дают возможность
это делать для не-текстовых данных. Кроме нуля '\0' ничего пока не придумал.
Вроде как получается можно и регулярки использовать.