这里面只有相对比较常用的,并不全。
常用元字符
元字符:具有固定含义的特殊符号。
. |
匹配除换行符以外的字符 |
\w |
匹配字母或数字或下划线 |
\s |
匹配任意的空白符(空格、回车等) |
\d |
匹配数字 |
\n |
匹配一个换行符 |
\t |
匹配一个制表符 |
^ |
匹配字符串的开始 |
$ |
匹配字符串的结尾 |
\W |
匹配非字母或数字或下划线 |
\D |
匹配非数字 |
\S |
匹配非空白符 |
a|b |
匹配字符a或字符b |
() |
匹配括号内的表达式,也表示一个组 |
[...] |
匹配字符组内的字符 |
[^...] |
匹配除了字符组中字符的所有字符 |
量词
控制前面元字符出现的字数。
* |
重复零次或更多次 |
+ |
重复一次或更多次 |
? |
重复零次或一次 |
{n} |
重复n次 |
{n,} |
重复n次或更多次 |
{n,m} |
重复n到m次 |
贪婪匹配和惰性匹配
写爬虫用到的最多的两个匹配,写验证用得少
.* |
贪婪匹配(简单理解为 尽可能多的匹配) |
.*? |
惰性匹配(简单理解为 尽可能少的匹配) |
作者言~
看B站上的爬虫课程时候,感觉有一节正则讲的挺通俗易懂的。