连续型特征按固定区间/分位数分箱 价格按指定区间分箱 defprice_cut_bins(s): unique_len=len(s.unique()) ifunique_len>10: s=s.replace(-1,np.nan) df_bin=pd.to_numeric(pd.cut(s,bins=[0,100,200,300,500,700,1000,1500,2000,2500,99999999], labels=[100,200,300,500,700,1000,1500,2000,2500,99999] ,include_lowest=True ) ) df_bin.fill...

  zI9rPrSNw38i   2023年11月02日   25   0   0 特征工程特征工程
关注 更多

空空如也 ~ ~

粉丝 更多

空空如也 ~ ~