pandas的apply应用
  gdHRcgezIIQV 2023年11月13日 32 0


 

import math

import pandas as pd

import csv

from tqdm import tqdm

def mask(x):
     if not x.cls1:
         return x
     else:
        if pd.isna(x.cls4):
            return x
        else:
            if x.cls4.find(' ') == -1:
                x.cls1=x.cls4
                return x
            else:
                words=x.cls4.split()
                x.cls1=words[0]
                x.cls2=words[1]
                return x
df = pd.read_csv("./2000qV15.txt", sep='\t', encoding='utf8', dtype=str, quoting=csv.QUOTE_NONE)
# df=df.dropna(subset=['url'], how='any').reset_index(drop=True)
# df=df[df['obj_url'].isin(["-"])]['obj_url'].count()
df1 = pd.read_csv("./2000qV15.res.hangye", sep='\t', encoding='utf8', dtype=str, quoting=csv.QUOTE_NONE)

df = df.merge(df1, how="left", on=["query"], suffixes=('', '_DROP'))
df=df.apply(mask, axis=1 )
df.to_csv("./titi.txt", index=False, sep='\t',encoding='utf8', quoting=csv.QUOTE_NONE)
# df=df.drop(['cls4'], axis=1)

print(df)

pandas的apply应用_python

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月13日 0

暂无评论

推荐阅读
  2Fnpj8K6xSCR   2024年05月17日   101   0   0 Python
  xKQN3Agd2ZMK   2024年05月17日   70   0   0 Python
  fwjWaDlWXE4h   2024年05月17日   38   0   0 Python
  Ugrw6b9GgRUv   2024年05月17日   40   0   0 Python
gdHRcgezIIQV
作者其他文章 更多