正则表达式怎么匹配单个汉字,如何用正则表达式匹配汉字

1楼：匿名用户

([\u4e00-\u9fa5])+

这样会把匹配结果放到匹配集的第一个子集中去,你就可以获取到了

2楼：梦里寻你我他

[\u4e00-\u9fa5]

如何用正则表达式匹配汉字

3楼：匿名用户

var str = '你好地世界世界';

假如想用正则表达式的方式找出str中'地'的下标;

var re=/\地/;

console.log(str.search(re));

控制台打印出 2.

(这就是其中一个方法,直接在想匹配的汉字前面加\),比如 /\地/

4楼：li小八

一般情况下可以这样匹配中文，如图：<img src="https://pic4.

zhimg.***/50/edcbd2faf1a916675cec852bd886e599_hd.jpg" data-rawwidth="827" data-rawheight="600" class="origin_image zh-lightbox-thumb" width="827" data-original="https:

//pic4.zhimg.***/edcbd2faf1a916675cec852bd886e599_r.

jpg">

先用靓汤或正则找到这个节点，再用上面的字符组匹配。

假设这个节点只有一个，用法如下：

import reimport requests as reqfrom bs4 import beautifulsoupurl = '***'html = req.get(url).textbs = beautifulsoup(html)span = bs.

find_all('span', 'pro-title')'''span = re.findall('[^<]+', html)s = span[0]m = re.findall('[\u4e00-\u9fa5]+', s)'''s = str(span)m = re.

findall('[\u4e00-\u9fa5]+', s)print(m)

5楼：匿名用户

[\u4e00-\u9fa5\\s]+ 多个汉字，包括空格

[\u4e00-\u9fa5]+ 多个汉字，不包括空格

[\u4e00-\u9fa5] 一个汉字

请问易语言中，怎样用正则表达式匹配一个汉字啊？

6楼：匿名用户

若“以内”包含0位数字：/\d/

若“以内”至少是1位：/\d/

——————

只是为判断字符串能否转的话，个人认为直接判断itoa(atoi(s))是否和与去掉了原来的s两头不影响数值的0的结果相同即可。意思就是先转成整数试试，然后再把这整数转回字符串，与原来的串比较，当然也要考虑少数你认可的特殊情况。

正则表达式如何只匹配一个中文字符

7楼：匿名用户

汉字的表示和正则表达式引擎相关，不同引擎的写法不同，下面的写法适用于java引擎，或者一切以unicode来表示字符的引擎。

1、基本规格——针对汉字的一般集合（cp936，约等于gbk，共计20000多汉字）

[\u3007\u4e00-\u9fcb\ue815-\ue864]

2、扩充规格——针对多一些的汉字（支持cjk exta，共计接近30000汉字）

[\u3007\u3400-\u4db5\u4e00-\u9fcb\ue815-\ue864]

3、豪华规格——针对更多的汉字（支持cjk extb、c、......，共计76000多汉字）

([\u3007\u3400-\u4db5\u4e00-\u9fcb\ue815-\ue864]|[\ud840-\ud87f][\udc00-\udfff])

如下关于汉字在unicode中的区间，亦可供参考

正则表达如何匹配指定的某几个汉字。

8楼：貌似風輕

作|最直接的方式

)(操作|学习)这个可以匹配：如何操作、如何学习、怎么操作、怎么学习、怎么样操作、怎么样学习

附一段java测试**：

importjava.util.regex.pattern;

publicclasstest}

匹配带汉字用户名的正则表达式

9楼：匿名用户

var reg = /^[\u4e00-\u9fff\w]$/;

10楼：匿名用户

c#：^[a-za-z0-9_\u4e00-\u9fa5]$

一个正则表达式的问题：怎样用正则表示：一个汉字或一个单词

11楼：匿名用户

[u4e00-u9fa5]不匹配汉字

[\u4e00-\u9fa5]这个匹配汉字\w 不同的语言含义不同，通用的解释是表示单词字符。

javascript 只能包含英文数字和下划线而在c#中还包含汉字，韩文等

12楼：匿名用户

没错，正则表达式里不能随便加空格的。如果加的话需要给正则加参数extended，这个参数在不同的语言里有不同的写法

13楼：匿名用户

貌似你补充的也是错的数字可以输入，字符也可以输入

c++正则表达式如何匹配汉字

14楼：绯弹亚丝娜

按.***的标准，\w本来就是可以匹配：汉字，字母，数字，下划线。的所以一般\w可以满足需求了。

如果需要排除字母数字的话，可以这样：

(?![a-za-z0-9_])\w

>_>这样写估计效率不高

所以一般来说还是直接匹配指定的unicode码\unnnn unicode**中十六进制**为nnnn的字符汉字(字符) [\u4e00-\u9fa5]中文及全角标点符号(字符) [\u3000-\u301e\ufe10-\ufe19\ufe30-\ufe44\ufe50-\ufe6b\uff01-\uffee]

正则表达式怎么匹配单个汉字,如何用正则表达式匹配汉字

正则表达式w可以匹配汉字吗,python正则表达式中\w居然能匹配汉字，请问是怎么一回事？？？

易语言里面如何用正则表达式匹配任意多行文本

易语言里怎么用正则表达式匹配不知道几位数的数字

正则表达式怎么匹配单个汉字,如何用正则表达式匹配汉字

正则表达式w可以匹配汉字吗,python正则表达式中\w居然能匹配汉字，请问是怎么一回事？？？

易语言里面如何用正则表达式匹配任意多行文本

易语言里怎么用正则表达式匹配不知道几位数的数字

相关阅读