pandas 筛选某列包含空格或汉字的行-摩杜云开发者社区

pandas 筛选某列包含空格或汉字的行

X5zJxoD00Cah 2023年11月02日 65 0

正则表达式字符串 ico

import pandas as pd

# 创建示例 DataFrame
data = {'某列': ['Hello', '123', '包含空格', '包含 汉字', 'OnlyLetters']}
df = pd.DataFrame(data)

# 使用正则表达式筛选包含空格或汉字的行
pattern = r'\s|[\u4e00-\u9fa5]'  # 正则表达式匹配空格或汉字

filtered_df = df[df['某列'].str.contains(pattern, regex=True, na=False)]

# 打印筛选后的 DataFrame
print(filtered_df)

逐个解释正则表达式r'\s|[\u4e00-\u9fa5]'

正则表达式 r'\s|[\u4e00-\u9fa5]' 是一个用于匹配文本模式的正则表达式。让我逐个解释它：

r 前缀：

在正则表达式前面添加 r 前缀表示这是一个原始字符串（raw string），这样可以避免反斜杠 \ 在字符串中被转义。这在正则表达式中非常有用，因为正则表达式通常包含许多反斜杠，而我们不希望它们被解释为转义字符。

\s：

\s 是一个特殊的正则表达式元字符，表示匹配空白字符（whitespace characters），包括空格、制表符（tab）、换行符等。它用于匹配任何空白字符。

|：

| 是正则表达式中的逻辑或运算符，用于分隔两个可能的匹配模式，表示 "或" 的关系。

[\u4e00-\u9fa5]：

[ ] 是字符类（character class）的表示法，在其中可以包含多个字符或字符范围，它表示匹配其中任何一个字符。
\u4e00-\u9fa5 是一个字符范围，表示 Unicode 编码范围内的所有汉字字符。具体来说，\u4e00 是第一个汉字（"一"），\u9fa5 是最后一个汉字（"龥"）的 Unicode 编码。这个范围包括了中文汉字的所有字符。

综合起来，正则表达式 r'\s|[\u4e00-\u9fa5]' 的含义是匹配任何包含空白字符或者包含中文汉字字符的文本。这个正则表达式可以用来筛选包含空格或汉字的文本行。例如，在文本中，如果某一行包含空格或者包含中文汉字字符，这个正则表达式将匹配该行。

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载，内容版权归原作者所有。本网站的目的在于传递更多信息，不拥有版权，亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@moduyun.com

上一篇：将pandas某列中的字符串按空格或换行符拆分成列表,然后剔除列表中的中文字符串下一篇：解释 pandas.series.str.contains里的参数na的作用并举例

分享：

最后一次编辑于 2023年11月08日 0

暂无评论

推荐阅读

3-5 极语言文档类、地址类、日期类、时间类——成员表

JuruRiF6zc15 2023年12月06日 35 0 0 取值数据字符串

tomlkit.dumps函数生成的toml文件的默认编码"gbk", open函数默认encoding='gbk'open().read()只能使用一次, 除非f.seek(0)将句柄放回文件的开头

X5zJxoD00Cah 2023年12月08日 28 0 0 句柄字符串默认编码

pandas extract 获取所有匹配结果正则表达式匹配 (""或任意非数字字符)("0"或"") + today.month + "月" + ("0"或"") + today

X5zJxoD00Cah 2023年12月02日 39 0 0 正则表达式字符串数字字符

# df内每个元素拼接同一字符串

X5zJxoD00Cah 2023年12月12日 43 0 0 字符串

python re 正则表达式 match search . *

X5zJxoD00Cah 2023年11月28日 27 0 0 正则表达式 Python 字符串

python pandas query loc查找行条件查询筛选行字符串列表

X5zJxoD00Cah 2023年12月02日 35 0 0 查询表达式条件查询 python pandas query 字符串

list函数会对对象列表化如果对象是单个多字符字符串会拆分不会增加维度 []不会拆分会增加维度

X5zJxoD00Cah 2023年12月09日 28 0 0 字符串

re.sub 与 pandas.Series.str.replace 的区别 re.sub 需要 [pattern] 匹配字符集的内容否则为完整匹配匹配具体字符串 pandas.Series.

X5zJxoD00Cah 2023年12月06日 30 0 0 空字符串子串字符串

python 今日是1月1日使用datetime分别生成字符串 1月1日 01月01日 1月01日 01月1日

X5zJxoD00Cah 2023年12月02日 26 0 0 Stack Python 字符串

在Python中，字符串前的r和f可以一起使用

X5zJxoD00Cah 2023年12月08日 33 0 0 Python 字符串

pandas contains 与 extract 的区别正如 re.search 与 findall 的区别

X5zJxoD00Cah 2023年12月06日 34 0 0 正则表达式数字字符

如何在pandas.series.str.contains中匹配以".xls"开头的行

X5zJxoD00Cah 2023年11月28日 34 0 0 正则表达式 Python 字符串

re search group groups

X5zJxoD00Cah 2023年11月30日 39 0 0 Group Email 字符串

简单实用：isPalindrome方法在密码验证中的应用

cBXxmmSG2r7P 2023年12月02日 35 0 0 程序员 java 回文字符串字符串回文判断

array([['B1', 'B3', 'Unnamed: 2', 'B4', 'Unnamed: 4', 'Unnamed: 5'], ['B2', nan, 'B5', nan, n

X5zJxoD00Cah 2023年11月28日 24 0 0 数组运算符字符串

根据","+前后任意个数的空格分割string为list

X5zJxoD00Cah 2023年12月02日 35 0 0 re模块正则表达式分割字符串

在Python中，`str()`和`repr()`都是用来将某一类型的变量或者常量转换为字符串对象的方法¹²⁴。然而，它们的目标和使用场景有所不同： - `str()`主要面向用户，其目的是可读性，

X5zJxoD00Cah 2023年12月06日 39 0 0 Python html 字符串

在Python中，你可以使用`float`函数将科学计数法转换为数字³。例如，假设你有一个以科学计数法表示的数字字符串 "1.23e+10" ，你可以使用以下代码将其转换为数字³： ```pytho

X5zJxoD00Cah 2023年11月28日 40 0 0 科学计数法 Python 字符串

X5zJxoD00Cah

作者其他文章更多

通过cmd运行脚本输入变量输出变量

2023-12-12

你的代码中出现的错误`NameError: name '__file__' is not defined`表示Python无法找到`__file__`这个变量。`__file__`是一个特殊的变量，它

2023-12-12

在Python中，你可以使用`pymssql`库来连接到Microsoft SQL Server数据库¹²³⁴⁵。以下是一个示例： ```python import pymssql # 连接参数

2023-12-12

如何为防火墙添加运行执行的例外程序？-

2023-12-12

使用Python开发一个操作系统是一项复杂的任务，因为操作系统通常需

2023-12-12

在CMD中运行Python脚本时，如果出现中文乱码

2023-12-12

python查看库版本

2023-12-12

要安装特定版本的Python库，您可以使用pip命令并指定所需的版本。例如，如果您想安装特定版本的numpy，比如1.21.0，您可以使用以下命令： ```bash pip install nump

2023-12-12

pymssql访问数据库时报错20002

2023-12-12

用pyodbc 代替 pymssql 连接 mssql

2023-12-12

最新推荐更多

Hexo发布管理工具

2024-03-28

GitLab (v16.x) 简述及安装部署

2024-03-13

开源无代码 / 低代码平台 NocoBase 0.20：支持多数据源

2024-03-11

易6画 - 在线海报ppt制作平台

2024-03-02

解读平台工程，DevOps真的死了吗？不，它只是换了个马甲而已，弥补了DevOps空心理论，让DevOps继续发展壮大

2024-02-27

Docker

2024-02-27

mdbook安装使用实录

2024-02-22

【更新公告】AirtestIDE更新至1.2.17版本

2024-02-22

在线图片生成工具：定制化占位图片的利器

2024-02-20

1、Git简介

2024-02-19

发布、部署，傻傻分不清楚？从概念到实际场景，再到工具应用，一篇文章让你彻底搞清楚

2024-02-19

2、Git之Windows版本的安装

2024-02-19

使用Git向Gitee仓库推送项目的完整流程

2024-02-19

测试

2024-01-22

[【stars-one】Android图标生成器 PC工具

2024-01-21

ai文章创作助手，大模型原创助手，已对接rpcms

2024-01-15

如何写好技术文档 - 排版格式和规范(一)

2024-01-12

还在用Jekins？快来试试这款比Jekins简而轻的自动部署软件！

2023-12-29

绿色Windows版gvim

2023-12-29

Golang实现JAVA虚拟机-运行时数据区

2023-12-25