深入理解:JavaScript 正则表达式语法详解
最近在做字符串处理时,你是否也遇到过需要复杂的匹配和替换的场景?这时,强大的正则表达式就派上用场了。今天,我们一起来深入了解一下 JavaScript 中的正则表达式,并提供一份速查表,让你的开发工作更加高效。
什么是正则表达式?
正则表达式(Regular Expression,简称 RegExp)是一种强大的文本模式匹配工具。它使用特定的语法来描述字符串的模式,可以用来查找、替换或验证文本。在 JavaScript 中,正则表达式是一个内置对象,提供了丰富的方法来操作字符串。
速查表解析
下面我们来详细解析一下这份 JavaScript 正则表达式速查表,它主要分为以下几个部分:
1. 基本语法 (Regular Expression Basics)
- . (点号): 匹配除换行符以外的任意单个字符。
- a: 匹配字符 \”a\”。
- ab: 匹配字符串 \”ab\”。
- a|b: 匹配字符 \”a\” 或 \”b\”。
- a*: 匹配 0 个或多个 \”a\”。
- \\ (反斜杠): 转义特殊字符,使其失去特殊含义。
2. 量词 (Regular Expression Quantifiers)
- *: 匹配前面的字符 0 次或多次。
- +: 匹配前面的字符 1 次或多次。
- ?: 匹配前面的字符 0 次或 1 次。
- [2]: 匹配前面的字符正好 2 次。
- {2, 5}: 匹配前面的字符 2 到 5 次。
- {2,}: 匹配前面的字符 2 次或多次。
3. 字符类 (Regular Expression Character Classes)
- [a-d]: 匹配 \”a\”, \”b\”, \”c\”, \”d\” 中的任意一个字符。
- [^a-d]: 匹配除 \”a\”, \”b\”, \”c\”, \”d\” 以外的任意一个字符。
- [\\b]: 匹配退格符。
- \\d: 匹配一个数字字符,等同于 [0-9]。
- \\D: 匹配一个非数字字符,等同于 [^0-9]。
- \\s: 匹配一个空白字符,如空格、制表符等。
- \\S: 匹配一个非空白字符。
- \\w: 匹配一个单词字符,包括字母、数字和下划线,等同于 [a-zA-Z0-9_]。
- \\W: 匹配一个非单词字符,等同于 [^a-zA-Z0-9_]。
4. 特殊字符 (Regular Expression Special Characters)
- \\n: 匹配换行符。
- \\r: 匹配回车符。
- \\t: 匹配制表符。
- \\0: 匹配空字符。
- \\XXX: 匹配八进制字符 XXX。
- \\xYY: 匹配十六进制字符 YY。
- \\uYYYY: 匹配 Unicode 字符 YYYY。
- \\cY: 匹配控制字符 Y。
5. 分组 (Regular Expression Groups)
- ( … ): 捕获分组,可以被后续引用。
- (?: … ): 非捕获分组,用于组合模式,但不进行捕获。
- \\Y: 匹配第 Y 个捕获分组的内容。
6. 标志 (Regular Expression Flags)
- g (global): 全局匹配,找到所有匹配项,而不是在找到第一个后停止。
- i (ignoreCase): 忽略大小写匹配。
- m (multiline): 使 ^ 和 $ 匹配每一行的开始和结束,而不是整个字符串的开始和结束。
7. 替换 (Regular Expression Replacement)
- $: 插入 $ 符号。
- : 插入整个匹配到的字符串。
- : 插入匹配字符串前面的部分。
- #39;: 插入匹配字符串后面的部分。
- $Y: 插入第 Y 个捕获分组的内容。
8. 断言 (Regular Expression Assertions)
- ^: 匹配字符串的开头,在多行模式下匹配行首。
- $: 匹配字符串的结尾,在多行模式下匹配行尾。
- \\b: 匹配单词边界。
- \\B: 匹配非单词边界。
- (?=…): 正向肯定预查,匹配后面紧跟着 … 的位置,但不包含 …。
- (?!…): 负向肯定预查,匹配后面不紧跟着 …的位置,但不包含 …。
实战案例
假设我们需要验证一个字符串是否为合法的电子邮件地址,我们可以使用以下正则表达式:
这段代码使用了多个正则表达式语法,例如字符类 [a-zA-Z0-9._%+-]、量词 + 和 *、特殊字符 \\. 以及断言 ^ 和 $.
总结
正则表达式是字符串处理的强大工具,掌握它能够极大提高开发效率。通过本文的速查表,你可以快速了解 JavaScript 正则表达式的各种语法,并将其应用于实际项目中。正则表达式的灵活性和功能性,使得它在文本匹配、数据验证、日志分析等领域都有着广泛的应用。希望通过今天的学习,大家能够更加自如地运用正则表达式来解决实际问题。
思考问题
- 如何使用正则表达式匹配包含特定字符的所有行?
- 如何使用正则表达式替换字符串中的多个重复字符为一个字符?
- 在实际项目中,你遇到了哪些需要使用正则表达式解决的问题?
希望今天的分享对你有所帮助,欢迎大家在评论区留言交流!
JavaScript全解析——正则表达式
●正则也叫正则表达式,又名 “规则表达式”●正则是JS中的数据类型, 是一个复杂数据类型●由我们自己来书写 “规则”,专门用来检测 字符串 是否符合 “规则” 使用的●我们使用一些特殊的字符或者符号定义一个 “规则公式”,然后用我们定义好的 “规则公式” 去检测字符串是不是合格
●上面的变量 reg 就是定制好的规则●检测 str1 这个字符串的时候,符合规则●检测 str2 这个字符串的时候,不符合规则
创建一个正则表达式●想制定 “规则”,必须要按照人家要求的方式来制定●把一些字母和符号写在 // 中间的东西,叫做正则表达式,比如 /abcdefg/●创建正则表达式有两个方式 字面量 和 构造函数创建
字面量创建
●这个正则表达式就可以去检测字符串了●这个正则表达式的意义是字符串中的必须要包含\’abcdefg\’这个片段
构造函数创建
●使用构造函数方式创建的和字面量创建的,得到的结果一样
两种创建方式的区别●语法不一样●书写标识符的时候○字面量方式直接书写在正则的后面○内置构造函数, 以第二个参数的方式传递●拼接字符串○字面量方式不接受拼接字符串○内置构造函数方式, 可以拼接字符串●基本元字符书写○字面量方式的时候, 直接书写 \\s\\d\\w○内置构造函数书写的时候, 需要书写 \\s\\d\\w
正则表达式的方法
●正则提供了一些方法给我们使用●用来检测和捕获字符串中的内容的test()方法——匹配●作用:test方法是用来检测字符串是否符合我们正则的标准●语法: 正则.test(字符串)●返回值: boolean○如果该字符串符合正则的规则, 那么就是 true○如果该字符串不符合正则的规则, 那么就是 false
exec()方法——捕获
●作用:exec方法是把字符串中满足条件的内容捕获出来●语法: 正则.exec(字符串)●返回值: 把字符串中符合正则要求的第一项以及一些其他信息,以数组的形式返回○原始字符串中没有符合正则要求的字符串片段■null○原始字符串中有符合正则要求的片段■正则没有 () 也没有 全局标识符g●返回值是一个数组●索引 0 是从字符串中捕获出来的满足正则条件的第一个内容●注意: 不管捕获多少次, 每次都是从原始字符串的索引 0 开始检索■正则有全局标识符 g●返回值是一个数组●索引 0 是从字符串中捕获出来的满足正则条件的第一个内容●注意: 第二次捕获是从第一次的结束位置开始向后查询, 直到最后捕获不到为止, 再下一次的时候, 又从字符串的 索引0 开始检索■有 ()●返回的是一个数组●索引 0 是从字符串中捕获出来的满足正则条件的第一个内容●从索引 1 开始, 依次是每一个小括号的单独内容●注意: 按照小括号的开始标志, 来数是第几个小括号
●扩展: () 有两个意义○一个整体○单独捕获○如果你想只使用一个意义, 整体的所用, 不想在捕获的时候单独捕获出来○你可以写成 (?:)表示匹配但不捕获
正则表达式里面的符号
●知道了怎么创建一个正则表达式以后,我们就来详细的说一下正则表达式里面涉及到的一些符号了元字符基本元字符●. : 匹配非换行的任意字符 表示字符串中至少要有一个非换行的内容●\\ : 转译符号,把有意义的 符号 转换成没有意义的 字符,把没有意义的 字符 转换成有意义的 符号●\\s : 匹配空白字符(空格/缩进/制表符/…)表示字符串中至少包含一位 空白 内容●\\S : 匹配非空白字符●\\d : 匹配数字 表示字符串中至少包含一位 数字(0-9)●\\D : 匹配非数字 表示字符串中至少包含一位 非数字 内容●\\w : 匹配数字字母下划线 表示 一位 数字(0-9)字母(a-zA-Z)下划线(_) 中的任意一个●\\W : 匹配非数字字母下划线 表示 一位 非数字字母下划线 中的任意一个●有了元字符我们就可以简单的制定一些规则了
限定符注意: 一个限定符只能修饰符号前面的一个内容的出现次数●* : 前一个内容重复至少 0 次,也就是可以出现 0 ~ 正无穷 次●+ : 前一个内容重复至少 1 次,也就是可以出现 1 ~ 正无穷 次●? : 前一个内容重复 0 或者 1 次,也就是可以出现 0 ~ 1 次●{n} : 前一个内容重复 n 次,也就是必须出现 n 次●{n,} : 前一个内容至少出现 n 次,也就是出现 n ~ 正无穷 次●{n,m} : 前一个内容至少出现 n 次至多出现 m 次,也就是出现 n ~ m 次●限定符是配合元字符使用的
边界符●^ : 表示开头●$ : 表示结尾●边界符是限定字符串的开始和结束的
特殊符号●() : 限定一组元素●[] : 字符集合,表示写在 [] 里面的任意一个都行●[^] : 反字符集合,表示写在 [^] 里面之外的任意一个都行●- : 范围,比如 a-z 表示从字母 a 到字母 z 都可以●| : 或,正则里面的或 a|b 表示字母 a 或者 b 都可以●现在我们就可以把若干符号组合在一起使用了
标识符(修饰符)●书写在正则表达式的外面, 专门用来修饰整个正则表达式的符号●i :ignore的简写 表示忽略大小写○这个 i 是写在正则的最后面的○/\\w/i○就是在正则匹配的时候不去区分大小写●g : global的简写 表示全局匹配○这个 g 是写在正则的最后面的○/\\w/g○就是全局匹配字母数字下划线
字符串和正则合用的方法
●字符串中有一些方法也是可以和正则一起使用的search●作用:search 是查找字符串中是否有满足正则条件的内容●语法:○字符串.search(正则)○字符串.search(字符串片段)●返回值 : 有的话返回开始索引,没有返回 -1
match
●作用:match 找到字符串中符合正则条件的内容返回●语法:○字符串.match(正则)○字符串.match(字符串片段)●返回值 :○没有标示符 g 的时候,是和 exec 方法一样○有标示符 g 的时候,是返回一个数组,里面是匹配到的每一项
replace
●作用:replace 是将字符串中满足正则条件的字符串替换掉●语法:○字符串.replace(\’换下字符\’, \’换上字符\’)○字符串.replace(正则表达式, \’换上字符\’)●返回值 : 替换后的字符串○当你的第一个参数传递字符串的时候, 只能替换一个○当你的第一个参数传递正则表达式的时候, 只能替换一个○但是如果你的正则表达式有全局标识符 g, 那么有多少替换多少
案例——密码强度校验
案例——表单验证
正则预查(扩展)正向预查●正向肯定预查:(?=)●正向否定预查:(?!)负向预查●负向肯定预查:(?<=)●负向否定预查:(?<!)
重温js——正则表达式
正则表达式是一种规则,在语法上各个语言都是一样的,有点是通用性很高,缺点是在平常开发中使用的频率并不是很高,主要使用的范围在用于判断字符串里面的规则。
语法和定义变量一样,有两种:字面量模式 和 构造函数模式。
- global : 是否开启了全家匹配
- ignoreCase: 是否忽略大小写,和上面是一样的都是只读
- multiline: 是否是多行匹配(只读)
- source: 当前匹配的规则资源。(只读)
- lastIndex: 匹配的最后位置,这个对于全局匹配是很有用的。不开启全家匹配是不会有影响的,这个参数不是只读的。
- test方法: 测试某个字符串是否满足规则
正则表达的匹配模式是贪婪模式,尽量匹配多一点。如果不想使用贪婪模式,在量词后面加上? ,就不会是贪婪模式
- exec方法: 执行正则匹配,输出匹配的结果。
在正则中用小括号包裹的部分,称之为捕获组。
捕获组还可以命名,命名的方式是在小括号里面的前面添加一个 ?<名字>,这种称为具名捕获组。
由于捕获组是会影响效率,有好多时候我们只是需要把括号里面当作一个整体。其实我们是不想要捕获的,使用的方式是 ?:
在正则表达式中,使用某个捕获组, \\捕获组编号(捕获的编号可以是名字或者是数字)
检查某个字符串后面的字符是否满足某个规则,该规则不成为捕获的结果。语法是 ?=
检查某个字符串后面的字符是否不满足某个规则,该规则不成为捕获的结果。语法是 ?!
详情查看https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Guide/Regular_Expressions#%E4%BD%BF%E7%94%A8%E7%89%B9%E6%AE%8A%E5%AD%97%E7%AC%A6
本文作者及来源:Renderbus瑞云渲染农场https://www.renderbus.com
文章为作者独立观点不代本网立场,未经允许不得转载。