Pandas
  TnD0WQEygW8e 2023年11月05日 90 0

Dataframe & Series Columns & Index Missing values: NaN

df.index
df.columns
df.data
type(...)

df.dtypes

series.to_frame()
s.value_counts()
s.describe()
s.isnull()
s.fillna(0)
s.dropna()

s.value_counts(normalize=True)

s.hasnans()
dataframe.isnull()
df.sum()

pd.read_csv(..., index_col="...")
df.reset_index
df.rename(index={...}, columns={...})

idx_list = df.index.tolist()
idx_list[1] = ...
df.index = idx_list

df.drop("...", axis="columns")
df.insert(loc=..., column="...", value=[])

Operations

df.filter(like="...")
df.filter(regex="...")

df.count(...) // no NaN values

df.isnull()
df.sum()
df.head()

df.memory_usage()

df.nunique()
col.astype("categorical")

df.nlargest()
df.sort_values(...)

df.drop_duplicate()

df.iloc[...] // index
df.loc[...] // label

df.columns
df.get_loc(...)

df.col.pct_change()

pd.cut(col, bins)

Tidy data => "Hadley"

  • Stack & melt
  • vs Unstack & pivot

The Zen of Python

Combining Pandas Objects

df.loc[len(df)] = {Age: ...}

pd.concat([df1, df2])

Time Series Analysis

  • date
  • time
  • datetime
  • timedelta
  • pd.Timestamp
df.between_time()
df.at_time()

df.resample("w")
df.size()

df.resample("w", on="col1")


REF
https://gist.github.com/MaximePawlakFr/71a5cfbaef45ad5b0f4f23536752f229



【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月08日 0

暂无评论

推荐阅读
  2Fnpj8K6xSCR   2024年05月17日   101   0   0 Python
  xKQN3Agd2ZMK   2024年05月17日   70   0   0 Python
  fwjWaDlWXE4h   2024年05月17日   38   0   0 Python
  Ugrw6b9GgRUv   2024年05月17日   40   0   0 Python
TnD0WQEygW8e