GNU Расширения регулярных выражений.

Список спец-символов.

\a
Звонок. (ASCII 7).
\f
form feed (ASCII 12).
\n
новая строка (ASCII 10).
\r
возврат каретки (ASCII 13).
\t
Горизонтальная табуляция (ASCII 9).
\v
Вертикальная табуляция (ASCII 11).
\cX
`CONTROL-X', X - любой символ.
\dXXX
Символ, с десятичным кодом XXX.
\oXXX
Восьмеричное представление символа.
\xXX
Шестнадцатеричное представление.
\b
backspace (в регулярных выражениях эта комбинация трактуется как "граница слова", см.ниже.)
\w

Совпадает с буквой или цифрой(а так-же с '_'). Для корректной работы с русскими буквами необходимо правильно настроить локаль. (в info sed от Mandriva написано какие именно переменные нужно установить, а в моём info - не написано, но - работает, хотя наверное грохнется, если скажем запустить sed как задачу crond. Этот вопрос видимо требует изучения отдельно для каждого дистрибутива).

Из-за упомянутой выше особенности UTF-8, символ «\w» прекрасно работает, если системные переменные указывают локаль UTF-8, и входной поток так-же в UTF-8. Однако при запуске задачи из crond (если не явно указано иного), включена локаль LC_ALL=C, и метасимвол «\w» совпадает только с латинскими буквами (ну и конечно с цифрами и «_»).

\W
Инверсия \w.
\b
Совпадает с границей слова, т.е. с местом между буквой и не-буквой.(\w\W, \W\w, ^\w, и \w$). Например:
$ echo 'Данная версия sed поддерживает последовательность'| sed 's/\b/|/g'
|Данная| |версия| |sed| |поддерживает| |последовательность|
Как видите, локаль я настроил правильно :-)
\B
Инверсия «\b».
\`
Совпадает только с началом буфера, отличие от «^» проявляется только если в буфере встречаются «\n», тогда «^» совпадает с каждым местом сразу после каждого «\n» и с началом буфера, а «\`» только с началом буфера.

Замечание

Конечно «^» совпадает с началом каждой строки только в многострочном режиме (модификатор m).
\'
Совпадает только с концом буфера(в отличие от «$», который совпадает не только с концом буфера, но и с любым местом сразу перед «\n»)
\<
Левая граница слова, совпадает с «\W\w» или с «^\w».
\>
Правая граница слова, совпадает с «\w\W» или с «\w$».

Вы можете обсудить этот документ на форуме. Текст предоставляется по лицензии GNU Free Documentation License (Перевод лицензии GFDL).

Вы можете пожертвовать небольшую сумму яндекс-денег на счёт 41001666004238 для оплаты хостинга, интернета, и прочего. Это конечно добровольно, однако это намного улучшит данный документ (у меня будет больше времени для его улучшения). На самом деле, проект часто находится на грани закрытия, ибо никаких денег никогда не приносил, и приносить не будет. Вы можете мне помочь. Спасибо.