正则表达式 []内外的区别-摩杜云开发者社区

正则表达式 []内外的区别

X5zJxoD00Cah 2023年11月02日 52 0

回车符换行符中文字符

正则表达式 []内外的区别

my_ser = pd.Series(['1我是1\r2', '2\n\r2我是\s\r我是2', '3\s\n3\n\s3'])
# 如果元素中出现转义符或中文,则删除转义符或中文并分割,结果如下
my_result = pd.Series([['1', '1'], ['2', '2'], ['3', '3']])
# 我的解决思路是:
pattern = r'[\s]+|[\n]+|[\r]+|[\u4e00-\u9fa5]+'
my_ser.apply(lambda x: re.split(pattern, x))
# 为什么\s无法被消除

pattern = r'[\s\n\r\u4e00-\u9fa5]+'
my_ser.apply(lambda x: re.split(pattern, x))

正则表达式 []内外的区别_回车符

r'[\s]+|[\n]+|[\r]+|[\u4e00-\u9fa5]+' 与 r'[\s\n\r\u4e00-\u9fa5]+' 之间的区别在于前者会将空白字符（包括空格、制表符、换行符等）以及中文字符都单独匹配并删除，而后者只会匹配连续的空白字符、换行符、回车符和中文字符，并将它们一起删除。

具体来说：

r'[\s]+|[\n]+|[\r]+|[\u4e00-\u9fa5]+' 中的 [\s]+ 匹配一个或多个连续的空白字符，[\n]+ 匹配一个或多个连续的换行符，[\r]+ 匹配一个或多个连续的回车符，[\u4e00-\u9fa5]+' 匹配一个或多个连续的中文字符。这意味着它会将这些字符分别删除。
r'[\s\n\r\u4e00-\u9fa5]+' 中的 [\s\n\r\u4e00-\u9fa5]+' 匹配一个或多个连续的空白字符、换行符、回车符或中文字符，并将它们一起删除。

因此，如果您想要删除所有这些字符，并且不关心它们是连续的还是分散的，可以使用 r'[\s\n\r\u4e00-\u9fa5]+'，这样可以更简洁地实现目标。如果您想保留连续的空白字符或中文字符之间的间隔，可以使用 r'[\s]+|[\n]+|[\r]+|[\u4e00-\u9fa5]+'，这将把它们分别删除。

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载，内容版权归原作者所有。本网站的目的在于传递更多信息，不拥有版权，亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@moduyun.com

上一篇： \s匹配任何空白字符，包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。下一篇：代理IP与Socks5代理：跨界电商智能爬虫与出海之道

分享：

最后一次编辑于 2023年11月08日 0

暂无评论

推荐阅读

正则表达式笔记 str.replace+re.sub

X5zJxoD00Cah 2023年11月02日 75 0 0 换行符正则表达式字符串

python中'\n'与'r'的区别和使用习惯

X5zJxoD00Cah 2023年11月02日 38 0 0 换行符 Python 字符串

python "\r\n" 与 "\n" 与 "\r" 与 "\n\r" 的区别

X5zJxoD00Cah 2023年11月30日 29 0 0 换行符特殊字符 Python

正则表达式 []内外的区别

X5zJxoD00Cah 2023年11月02日 53 0 0 回车符换行符中文字符

正则表达式空格

X5zJxoD00Cah 2023年11月02日 78 0 0 换行符字符串元字符

将pandas某列中的字符串按空格或换行符拆分成列表,然后剔除列表中的中文字符串

X5zJxoD00Cah 2023年11月02日 88 0 0 换行符 Python 字符串

UserWarning: Glyph 33258 (\N{CJK UNIFIED IDEOGRAPH-81EA}) missing from current font.

X5zJxoD00Cah 2023年11月02日 37 0 0 中文字体中文字符 ico

X5zJxoD00Cah

作者其他文章更多

通过cmd运行脚本输入变量输出变量

2023-12-12

你的代码中出现的错误`NameError: name '__file__' is not defined`表示Python无法找到`__file__`这个变量。`__file__`是一个特殊的变量，它

2023-12-12

在Python中，你可以使用`pymssql`库来连接到Microsoft SQL Server数据库¹²³⁴⁵。以下是一个示例： ```python import pymssql # 连接参数

2023-12-12

如何为防火墙添加运行执行的例外程序？-

2023-12-12

使用Python开发一个操作系统是一项复杂的任务，因为操作系统通常需

2023-12-12

在CMD中运行Python脚本时，如果出现中文乱码

2023-12-12

python查看库版本

2023-12-12

要安装特定版本的Python库，您可以使用pip命令并指定所需的版本。例如，如果您想安装特定版本的numpy，比如1.21.0，您可以使用以下命令： ```bash pip install nump

2023-12-12

pymssql访问数据库时报错20002

2023-12-12

用pyodbc 代替 pymssql 连接 mssql

2023-12-12

最新推荐更多

Hexo发布管理工具

2024-03-28

GitLab (v16.x) 简述及安装部署

2024-03-13

开源无代码 / 低代码平台 NocoBase 0.20：支持多数据源

2024-03-11

易6画 - 在线海报ppt制作平台

2024-03-02

解读平台工程，DevOps真的死了吗？不，它只是换了个马甲而已，弥补了DevOps空心理论，让DevOps继续发展壮大

2024-02-27

Docker

2024-02-27

mdbook安装使用实录

2024-02-22

【更新公告】AirtestIDE更新至1.2.17版本

2024-02-22

在线图片生成工具：定制化占位图片的利器

2024-02-20

1、Git简介

2024-02-19

发布、部署，傻傻分不清楚？从概念到实际场景，再到工具应用，一篇文章让你彻底搞清楚

2024-02-19

2、Git之Windows版本的安装

2024-02-19

使用Git向Gitee仓库推送项目的完整流程

2024-02-19

测试

2024-01-22

[【stars-one】Android图标生成器 PC工具

2024-01-21

ai文章创作助手，大模型原创助手，已对接rpcms

2024-01-15

如何写好技术文档 - 排版格式和规范(一)

2024-01-12

还在用Jekins？快来试试这款比Jekins简而轻的自动部署软件！

2023-12-29

绿色Windows版gvim

2023-12-29

Golang实现JAVA虚拟机-运行时数据区

2023-12-25