正则表达式语法大全python—java正则表达式语法大全

使用Python验证常见50个正则表达式

正则表达式（Regular Expression）通常被用来检索、替换那些符合某个模式(规则)的文本。

此处的Regular即是规则、规律的意思，Regular Expression即“描述某种规则的表达式”之意。

本文收集了一些常见的正则表达式用法，方便大家查询取用，并在最后附了详细的正则表达式语法手册。

案例包括：「邮箱、身份证号、手机号码、固定电话、域名、IP地址、日期、邮编、密码、中文字符、数字、字符串」

我用的是python来实现正则，并使用Jupyter Notebook编写代码。

Python通过re模块支持正则表达式，re 模块使 Python 语言拥有全部的正则表达式功能。

这里要注意两个函数的使用：

re.compile用于编译正则表达式，生成一个正则表达式（ Pattern ）对象;

.findall用于在字符串中找到正则表达式所匹配的所有子串，并返回一个列表，如果没有找到匹配的，则返回空列表。

包含大小写字母，下划线，阿拉伯数字，点号，中划线

表达式：

[a-zA-Z0-9_-]+@[a-zA-Z0-9_-]+(?:\\.[a-zA-Z0-9_-]+)

案例：

xxxxxx yyyy MM dd 375 0 十八位

地区： [1-9]\\d{5}
年的前两位： (18|19|([23]\\d)) 1800-2399
年的后两位： \\d{2}
月份： ((0[1-9])|(10|11|12))
天数： (([0-2][1-9])|10|20|30|31) 闰年不能禁止29+
三位顺序码： \\d{3}
两位顺序码： \\d{2}
校验码： [0-9Xx]

表达式：

[1-9]\\d{5}(18|19|([23]\\d))\\d{2}((0[1-9])|(10|11|12))(([0-2][1-9])|10|20|30|31)\\d{3}[0-9Xx]

案例：

手机号都为11位，且以1开头，第二位一般为3、5、6、7、8、9 ，剩下八位任意数字例如：13987692110、15610098778

表达式：

1(3|4|5|6|7|8|9)\\d{9}

案例：

区号3~4位，号码7~8位

例如：0511-1234567、021-87654321

表达式：

\\d{3}-\\d{8}|\\d{4}-\\d{7}

案例：

包含http:\\\\或https:\\\\

表达式：

(?:(?:http:\\/\\/)|(?:https:\\/\\/))?(?:[\\w](?:[\\w\\-]{0,61}[\\w])?\\.)+[a-zA-Z]{2,6}(?:\\/)

案例：

IP地址的长度为32位(共有2^32个IP地址)，分为4段，每段8位，用十进制数字表示每段数字范围为0～255，段与段之间用句点隔开　

表达式：

((?:(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d)\\.){3}(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d))

案例：

常见日期格式：yyyyMMdd、yyyy-MM-dd、yyyy/MM/dd、yyyy.MM.dd

表达式：

\\d{4}(?:-|\\/|.)\\d{1,2}(?:-|\\/|.)\\d{1,2}

案例：

我国的邮政编码采用四级六位数编码结构前两位数字表示省（直辖市、自治区）第三位数字表示邮区；第四位数字表示县（市）最后两位数字表示投递局（所）

表达式：

[1-9]\\d{5}(?!\\d)

案例：

密码(以字母开头，长度在6~18之间，只能包含字母、数字和下划线)

表达式：

[a-zA-Z]\\w{5,17}

强密码(以字母开头，必须包含大小写字母和数字的组合，不能使用特殊字符，长度在8-10之间)

表达式：

[a-zA-Z](?=.*\\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}

表达式：

[\\u4e00-\\u9fa5]

案例：

验证数字：^[0-9]*$
验证n位的数字：^\\d{n}$
验证至少n位数字：^\\d{n,}$
验证m-n位的数字：^\\d{m,n}$
验证零和非零开头的数字：^(0|[1-9][0-9]*)$
验证有两位小数的正实数：^[0-9]+(.[0-9]{2})?$
验证有1-3位小数的正实数：^[0-9]+(.[0-9]{1,3})?$
验证非零的正整数：^\\+?[1-9][0-9]*$
验证非零的负整数：^\\-[1-9][0-9]*$
验证非负整数（正整数 + 0） ^\\d+$
验证非正整数（负整数 + 0） ^((-\\d+)|(0+))$
整数：^-?\\d+$
非负浮点数（正浮点数 + 0）：^\\d+(\\.\\d+)?$
正浮点数 ^(([0-9]+\\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\\.[0-9]+)|([0-9]*[1-9][0-9]*))$
非正浮点数（负浮点数 + 0） ^((-\\d+(\\.\\d+)?)|(0+(\\.0+)?))$
负浮点数 ^(-(([0-9]+\\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\\.[0-9]+)|([0-9]*[1-9][0-9]*)))$
浮点数 ^(-?\\d+)(\\.\\d+)?$

英文和数字：^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$
长度为3-20的所有字符：^.{3,20}$
由26个英文字母组成的字符串：^[A-Za-z]+$
由26个大写英文字母组成的字符串：^[A-Z]+$
由26个小写英文字母组成的字符串：^[a-z]+$
由数字和26个英文字母组成的字符串：^[A-Za-z0-9]+$
由数字、26个英文字母或者下划线组成的字符串：^\\w+$ 或 ^\\w{3,20}$
中文、英文、数字包括下划线：^[\\u4E00-\\u9FA5A-Za-z0-9_]+$
中文、英文、数字但不包括下划线等符号：^[\\u4E00-\\u9FA5A-Za-z0-9]+$ 或 ^[\\u4E00-\\u9FA5A-Za-z0-9]{2,20}$
可以输入含有^%&\’,;=?$\\”等字符：`[^%&\’,;=?$\\x22]+`
禁止输入含有~的字符：[^~\\x22]+

在python中使用正则表达式及9个核心匹配函数用法示例

正则表达式的功能：

对字符有规律的查询和排除。
使用正则表达式时，都使用原生字符串表达，即用r 或 R 开头。

功能：获取正则表达式对象

语法：compile( pattern , flags = 0 )

属性：

pattern：正则表达式
groupindex ：捕获组：（调用组）形成字典
groups：多个子组
flags可选：标志位：

I / IGNORECASE：忽略大小写
A / ASCII：对\\w,\\W,\\b,\\B,\\d,\\D,\\s,\\S,只进行ASCII匹配（python3.x版本)。
M / MULTILINE：将^ 和 $用于整个字符串开始和结尾的每一行（默认情况下，仅适用于整个字符串的开始和结尾处）。
S / DOTALL：使用 . 字符时匹配所有字符，包括换行符。
X / VERBOSE：忽略模式字符串中未转义的空格和注释。

示例：

功能：通过正则表达式匹配字符串，以列表返回，没有返回：[ ]

语法：. findall ( string , pos , endpos )

string：目标字符串
pos：目标字符串匹配的开始位置
endpos：目标字符串匹配的结束位置

子组：如果正则表达式有子组，则只显示子组

示例：

功能：使用正则表达式匹配目标内容，返回迭代 match 对象

语法：. finditer ( pattern , string ,flags = 0 )

pattern：模式字符串，由正则表达式转换而来
string：要匹配的字符串
flags：可选：标志位

示例：

功能：

匹配字符串开头，匹配返回 match 对象，否则 None
通常使用try处理异常

语法：. match ( pattern , string [ , flags ] )

pattern : 模式字符串，由正则表达式转换而来
string : 要匹配的字符串
flags : 可选：标志位，用于控制匹配方式：

I / IGNORECASE

功能：不区分大小写。

示例：

M / MULTILINE

功能：行开头和结尾,将^ 和 $用于整个字符串开始和结尾的每一行（默认情况下，仅适用于整个字符串的开始和结尾处）。

示例：

S / DOTALL

功能：使用 . 字符时匹配所有字符，包括换行符。

示例：

X / VERBOSE

功能：忽略正则表达式中的注释和空格。

示例：

A / ASCII

对\\w,\\W,\\b,\\B,\\d,\\D,\\s,\\S,只进行ASCII匹配（python3.x版本)。
多个标志使用：re.I | re.X | re.S | re.M

示例：

功能：匹配一个字符串，返回mathc对象，否则None,只能匹配一处

语法：. search ( pattern , string )

pattern ：模式字符串，由正则表达式转换而来

string：目标字符串

示例：

拓展:match对象属性

功能：完全匹配

语法：. fullmatch ( pattern ,strint )

pattern ：模式字符串，由正则表达式转换而来

string：目标字符串

示例：

功能：根据正则表达式切割目标字符串

语法：. split( string )

string：目标字符串

示例：

功能：替换正则表达式匹配到的内容

语法：. sub( replaceStr , string ,max )

replaceStr：要替换的内容

string：目标字符串

max：最多替换几处

示例：

功能：替换正则表达匹配的内容，及替换个数

语法：. subn ( repl , string , count )

repl ：要替换的内容

string：目标字符串

count：最多替换几处

示例：

中文字符：[\\u4e00-\\u9fa5]
双字节字符：[^\\x00-\\xff]
邮箱地址：\\w[-\\w.+]*@([A-Za-z0-9][-A-Za-z0-9]+\\.)+[A-Za-z]{2,14}
网络地址：^((https|http|ftp|rtsp|mms)?:\\/\\/)[^\\s]+
国内手机：0?(13|14|15|17|18|19)[0-9]{9}
国内座机：[0-9-()（）]{7,18}
负浮点数：-([1-9]\\d*.\\d*|0.\\d*[1-9]\\d*)
正浮点数：[1-9]\\d*.\\d*|0.\\d*[1-9]\\d*
腾讯QQ：[1-9]([0-9]{5,11})
IP地址：(25[0-5]|2[0-4]\\d|[0-1]\\d{2}|[1-9]?\\d)\\.(25[0-5]|2[0-4]\\d|[0-1]\\d{2}|[1-9]?\\d)\\.(25[0-5]|2[0-4]\\d|[0-1]\\d{2}|[1-9]?\\d)\\.(25[0-5]|2[0-4]\\d|[0-1]\\d{2}|[1-9]?\\d)
身份证号：\\d{17}[\\d|x]|\\d{15}
日期格式：\\d{4}(\\-|\\/|.)\\d{1,2}\\1\\d{1,2}
用户名称：[A-Za-z0-9_\\-\\u4e00-\\u9fa5]+

在python中使用正则表达式及9个核心匹配函数用法示例

本文作者及来源:Renderbus瑞云渲染农场https://www.renderbus.com

文章为作者独立观点不代本网立场，未经允许不得转载。

继续阅读本文相关话题

TAG

全部

行业动态

C4D教程

C4D百科

正则表达式语法大全python—java正则表达式语法大全收藏 0

2025-03-13 12:37 作者：中望小编来源：互联网点击：0

使用Python验证常见50个正则表达式

在python中使用正则表达式及9个核心匹配函数用法示例

继续阅读本文相关话题

C4D百科

3Dmax和C4D有什么区别？

上一篇

中望小编

C4D百科

正则表达式语法规则简单总结正则表达式的语法

中望小编

C4D百科

正则表达式转义字符【正则表达式转义字符是】

中望小编

C4D百科

正则表达式通俗理解【正则表达式示例】

中望小编

C4D百科

正割余割函数图像、正割余割函数图像与性质

中望小编

C4D百科

正割余割余切关系大全—六个三角函数基本关系

正则表达式语法大全python—java正则表达式语法大全 收藏 0

2025-03-13 12:37 作者： 中望小编 来源：互联网 点击：0

使用Python验证常见50个正则表达式

在python中使用正则表达式及9个核心匹配函数用法示例

继续阅读本文相关话题

C4D百科

3Dmax和C4D有什么区别？

上一篇

中望小编

中望小编

中望小编

中望小编

中望小编

正则表达式语法大全python—java正则表达式语法大全收藏 0

2025-03-13 12:37 作者：中望小编来源：互联网点击：0