1楼:匿名用户
\w可以匹配到汉字,其他语言的文字也行,包括但不限于英语,法语,俄语,日语==
python正则表达式中\w居然能匹配汉字,请问是怎么一回事???
2楼:匿名用户
\w匹配的是能组成单词的字符,在python3 中re默认支持的是unicode字符集,当然也支持汉字
如果要让\w仅支持英文,加个re.a标志
print(re.findall(r"\w",s,re.a))这样就不会匹配汉字了
易语言正则表达式问题。 为什么易语言正则表达式 [\w]+ 能匹配大多数汉字
3楼:深秋桔叶
[\w\w]+用这个
4楼:匿名用户
注意字母w的大小写,经测试asd阿桑地方成功。
5楼:匿名用户
这个就不知道了,我用正则工具测过,都可以匹配上的,可能是易语言的一个bug
你可以[\u4e00-\u9fa5]来匹配中文,换一种方式也许就行了
正则表达式中\w+ 和[\w]+ 有区别么?
6楼:檸蜜紅茶
你理解错了吧...
w前面加了反斜杠,是\w,与[a-za-z0-9_]等价也就是包含下划线以下的所有字母和数字
而后面的加号,则是匹配紧跟其前面那个字符的 一次或多次中括号表示匹配其中任意字符
所以,你说的[\w./]+就是一或多次匹配 任何数字,字母,下划线,斜杠,还有英文的句号(一个点)
所以,那个表达式可以匹配****forta.***p.s.正确来说,[\w./]+这个式子里的那个点,应该加个反斜杠
7楼:匿名用户
以我的理解,没有。
不, 内的字符可以以任意次序出现。
后有了+,内的字符可以取任意多个。于是内的字符可以以任意次序出现任意多次,直到遇到第一个非内的字符。
如[ab]+ 既可以匹配aaabbb又可以匹配bbbaaa babaaaba等,不是一定要a....b....的次序。
8楼:匿名用户
[\w./]+
是匹配\w 或 . 或 / 这三者之一的字符,也就是说在中括号里的点,不是任意字符的意思,就是匹配它自己,在中括号里,点可以不用加反斜杠
正则表达式:.和\w有区别吗 ?
9楼:匿名用户
\w匹配任意的非单词字符(包括字母、数字、下划线和汉字)。
.表示任意一个字符除了换行符
正则表达式 只能输入字母数字汉字
10楼:夜晚或白天
/^[a-za-z0-9\u4e00-\u9fa5]+$/
其实[a-za-z0-9]可以用\w来代替,只是\w还可以匹配一个下划线,如果必须要求只有数字和字母那还是用[a-za-z0-9]这个好了
11楼:匿名用户
[\u4e00-\u9fa5] //匹配中文字符^[1-9]\d*$ //匹配正整数^[a-za-z]+$ //匹配由26个英文字母组成的字符串^[a-z]+$ //匹配由26个英文字母的大写组成的字符串
^[a-z]+$ //匹配由26个英文字母的小写组成的字符串
^[a-za-z0-9]+$ //匹配由数字和26个英文字母组成的字符串
12楼:
[a-za-z0-9\u4e00-\u9fa5]
java正则表达式求解:\\d \\w \\w分别代表什么呢?
13楼:匿名用户
\w匹配字母或数字或下划线
或汉字,\d表示匹配数字
\w和\w的区别
\w :匹配包括下划线的任何单词字符,等价于 [a-z a-z 0-9_]
\w :匹配任何非单词字符,等价于 [^a-z a-z 0-9_]前面之所以加上了两个\因为是字符中使用第一个\代表转义哈
14楼:
\\d 代表匹配数字
\\w 代表匹配一个词
这类东西,在官方文档里有,你去看pattern的帮助文档就好了
15楼:匿名用户
\\d表示非数字
\\w表示非单词
\\w表示单词
正则表达式如何匹配汉字?
16楼:匿名用户
去掉 ^ 和 $ 试试 [\u4e00-\u9fa5]
\u数字,在perl、pcre中要改为:
[\x-\x]
17楼:匿名用户
按.***的标准,\w本来就是可以匹配:汉字,字母,数字,下划线。的所以一般\w可以满足需求了。
如果需要排除字母数字的话,可以这样:
(?![a-za-z0-9_])\w
>_>这样写估计效率不高
所以一般来说还是直接匹配指定的unicode码\unnnn unicode**中十六进制**为nnnn的字符汉字(字符) [\u4e00-\u9fa5]中文及全角标点符号(字符) [\u3000-\u301e\ufe10-\ufe19\ufe30-\ufe44\ufe50-\ufe6b\uff01-\uffee]
匹配带汉字用户名的正则表达式
18楼:匿名用户
var reg = /^[\u4e00-\u9fff\w]$/;
19楼:匿名用户
c#:^[a-za-z0-9_\u4e00-\u9fa5]$