详解JMeter正则表达式(1)
1.概览
JMeter中包含范本匹配软件Apache Jakarta ORO 。在Jakarta网站上有一些关于它的文档,例如a summary of the pattern matching characters :
http://jakarta.apache.org/oro/api/org/apache/oro/text/regex/package-summary.html 。
另外,还有关于该软件老版本的文档OROMatcher User's guide ,也许会有一些帮助。URL地址: http://www.savarese.org/oro/docs/OROMatcher/index.html 。
JMeter的范本匹配与Perl语言的范本匹配类似。一个安装完整的Perl会包含很多关于正则表达式的文档(搜寻perlrequick、perlretut、perlre、perlreref)。
我们有必要分清楚包含(Contains)和匹配(Matches)的差异,它们用于响应断言测试元件:
包含(Contains)意味着正则表达式至少部分匹配目标,例如,'alphabet' 包含 'ph.b.',因为正则表达式匹配其子字符串'phabe'。
匹配(Matches)意味着正则表达式完全匹配目标。例如,'alphabet'匹配'al.*t'。
在这一情况下,它等同于使用^ 和$封装正则表达式,即'^al.*t$'。但是事情并不总是这样。例如,正则表达式'alp|.lp.*'包含于'alphabet',但并不匹配'alphabet'。
原因在于当范本匹配器在'alphabet'中找到序列'alp'后,就会停止尝试其他组合,而且'alp'不同于'alphabet',它不包含'habet'。
不同于Perl,没必要将正则表达式用//封装。
2.实例
1)提取单个字符串
假设测试人员期望匹配Web页面的如下部分:name="file" value="readme.txt">并提取readme.txt。
一个符合要求的正则表达式:
- name="file" value="(.+?)"> 。
上面用到的特殊字符包括如下几个。
( 和 ):封装了待返回的匹配字符串。
.:匹配任何字符。
+:一次或多次。
?:不要太贪婪,在找到第一个匹配项后停止。
如果没有?,在找到第一个">后,会继续寻找,直到最后一个">,这么做很可能不是测试人员期望的。
尽管上面的表达式可以达到目的,但是使用如下表达式更有效率:name="file" value="([^"]+)">,其中[^"]-意味着匹配任何东西(除了")。在这种情况下,匹配引擎在找到第一个右侧"后,就会停止搜索。而 上面例子中的匹配引擎会去寻找">。
2)提取多个字符串
假设测试人员期望匹配Web页面的如下部分:name="file" value="readme.txt">,并提取file.name和readme.txt。
一个符合要求的正则表达式:
- name = "([^" ]+)" value = "([^" ]+)"
这会创建两个组合,并可用于JMeter正则表达式模板,形如$1$ 和$2$。
JMeter正则表达式提取器会将组合的值放在指定变量中。
详解JMeter正则表达式(2)
例如,
引用名称:MYREF。
正则表达式:name="(.+?)" value="(.+?)"。
模板:$1$$2$。
不要用/ /封装正则表达式。
如下变量的值将会被设定。
MYREF: file.namereadme.txt。
MYREF_g0: name="file.name" value="readme.txt"。
MYREF_g1: file.name。
MYREF_g2: readme.txt。
这些变量后续可以在JMeter测试计划中引用,形如${MYREF}、${MYREF_g1}等。
3.关键字
正则表达式使用特定字符作为关键字,这些字符对正则表达式引擎有特殊意义。在字符串中使用这些字符必须进行转义(使用反斜杠"\"),目的是将它们当成原始字符,而非正则表达式的关键字。下面是关键字和它们的含义。
( ):组合。
[ ]:字符集合。
{ }:重复。
+ ?:重复。
.:任意匹配字符。
\:转义字符。
| -:选择符。
^ $:字符串或行的起始和结尾。
注意,ORO不支持\Q和\E关键字。
4.修改器(Modifier)
理论上修改器可以被放置在正则表达式的任何地方,并被放置的位置开始向后生效。(ORO存在一个BUG,修改器不能放在正则表达式的末尾。尽管修改器在这里不生效)。
单行(?s)和多行(?m)修改器通常都被放在正则表达式的开头。
忽略(?i)修改器可以被用来仅仅影响正则表达式的某一部分,例如:
- Match ExAct case or (?i)ArBiTrARY(?-i) case
由于单行和多行修改器的设置不同,范本匹配的表现也略有不同。请注意,单行和多行操作符之间没有任何关联;它们可以被单独指定。
1)单行模式
单行模式只影响关键字符"."。默认情况下,"."可以匹配任何字符(除了换行)。在单行模式下,"."还匹配换行。
2)多行模式
多行模式只影响关键字符"^"和"$"。默认情况下,"^"和"$"仅仅匹配字符串的开始和结尾。而在多行模式下,"^"和"$"匹配每一行的开始和结尾。