pandas的apply应用-摩杜云开发者社区

pandas的apply应用

gdHRcgezIIQV 2023年11月13日 32 0

python Python

import math

import pandas as pd

import csv

from tqdm import tqdm

def mask(x):
     if not x.cls1:
         return x
     else:
        if pd.isna(x.cls4):
            return x
        else:
            if x.cls4.find(' ') == -1:
                x.cls1=x.cls4
                return x
            else:
                words=x.cls4.split()
                x.cls1=words[0]
                x.cls2=words[1]
                return x
df = pd.read_csv("./2000qV15.txt", sep='\t', encoding='utf8', dtype=str, quoting=csv.QUOTE_NONE)
# df=df.dropna(subset=['url'], how='any').reset_index(drop=True)
# df=df[df['obj_url'].isin(["-"])]['obj_url'].count()
df1 = pd.read_csv("./2000qV15.res.hangye", sep='\t', encoding='utf8', dtype=str, quoting=csv.QUOTE_NONE)

df = df.merge(df1, how="left", on=["query"], suffixes=('', '_DROP'))
df=df.apply(mask, axis=1 )
df.to_csv("./titi.txt", index=False, sep='\t',encoding='utf8', quoting=csv.QUOTE_NONE)
# df=df.drop(['cls4'], axis=1)

print(df)

pandas的apply应用_python

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载，内容版权归原作者所有。本网站的目的在于传递更多信息，不拥有版权，亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@moduyun.com

上一篇： gitlab-- pages 功能实战下一篇：解决大量重复操作浏览器页面的方法

分享：

最后一次编辑于 2023年11月13日 0

暂无评论

推荐阅读

js逆向) 某音cookie中的__ac_signature

ILxlT0HtFgJu 2024年05月17日 68 0 0 Python

详解Python 中可视化数据分析工作流程

YqbaJkf98QJO 2024年05月17日 64 0 0 Python

快递查询 API 接口：让物流信息一目了然

Ugrw6b9GgRUv 2024年05月17日 76 0 0 Python

深入理解Django：中间件与信号处理的艺术

YpHJ7ITmccOD 2024年05月17日 55 0 0 Python

Python 潮流周刊#50：我最喜欢的 Python 3.13 新特性！

xCoOpmCw66sN 2024年05月17日 52 0 0 Python

Django性能之道：缓存应用与优化实战

YpHJ7ITmccOD 2024年05月17日 60 0 0 Python

Django 静态文件管理与部署指南

YpHJ7ITmccOD 2024年05月17日 61 0 0 Python

一篇文章掌握Python中多种表达式的使用：算术表达式、字符串表达式、列表推导式、字典推导式、_集合推导式、_生成器表达式、逻辑表达式、函数调用表达式

FDs7GVd6cZcT 2024年05月17日 69 0 0 Python

DrissionPage自动化框架学习

2Fnpj8K6xSCR 2024年05月17日 101 0 0 Python

Python字符串方法：字符串查找、替换、分割

FDs7GVd6cZcT 2024年05月17日 65 0 0 Python

高精度数学计算的瑞士军刀，mpmath库详解与应用示例

oaRbYQvpZaaT 2024年05月17日 53 0 0 Python

python中小数据池和编码

xKQN3Agd2ZMK 2024年05月17日 70 0 0 Python

python中7种方法实现字符串的拼接

49iChyeZd8DE 2024年05月17日 58 0 0 Python

Python中私有变量和私有方法

oELtfgAoDdFJ 2024年05月17日 52 0 0 Python

使用python中kivy库生成安卓APP

33Mqsls7cINW 2024年05月17日 58 0 0 Python

运算符与表达式

fwjWaDlWXE4h 2024年05月17日 38 0 0 Python

行驶证OCR识别Api接口介绍

Ugrw6b9GgRUv 2024年05月17日 40 0 0 Python

代理http中的代理池对于爬虫业务有多重要？

Smartproxy 30天前 84 0 0 数据 python java 数据 Java redis 数据 python 数据

Django测试与持续集成：从入门到精通

YpHJ7ITmccOD 2024年05月18日 69 0 0 Python

Python 潮流周刊#51：用 Python 绘制美观的图表

xCoOpmCw66sN 2024年05月18日 77 0 0 Python

gdHRcgezIIQV

作者其他文章更多

pandas的apply应用

2023-11-13

最新推荐更多

Spring Boot —— 集成 MyBatis-Plus

2024-05-20

keycloak~作为第三方登录的对接标准

2024-05-20

【日记】母亲生日，我在跟数字人民币 Battle（612 字）

2024-05-18

FFmpeg开发笔记（二十一）Windows环境给FFmpeg集成AVS3解码器

2024-05-18

Qt学习第二篇（基本小组件的使用）

2024-05-18

全网首一份！你最需要的PPTP MS-CHAP V2 挑战响应编程模拟计算教程！代码基于RFC2759，附全部源码！

2024-05-18

Python 潮流周刊#51：用 Python 绘制美观的图表

2024-05-18

Django测试与持续集成：从入门到精通

2024-05-18

自研WPF插件系统(沙箱运行及热插拔)

2024-05-18

记一次asp.net 8 服务器爆满的解决过程

2024-05-18

非常全能WinForm 开发框架 - ReaLTaiizor

2024-05-18

C#反射

2024-05-18

net core jwt的基本原理和实现

2024-05-18

VUE3/JAVA 操作系统开发日志[day 1]

2024-05-18

Nginx R31 doc 官方文档-01-nginx 如何安装

2024-05-18

2024 年 5 月 8 日周三晴热（471 字）

2024-05-17

2024 年 5 月 9 日周四阴常（137 字）

2024-05-17

2024 年 5 月 10 日周五阴凉（1025 字）

2024-05-17

lua~基本语法

2024-05-17

2024 年 5 月 12 日母亲节周日晴常（197 字）

2024-05-17