共 195 篇文章 |
|
使用Pandas读取复杂Excel表单。df=df.set_index(df.columns[0])df=df.stack(level=0).stack(level=0).reset_index()df.columns=list(df.columns[1:].insert(0,''Date''))df.df = pd.read_excel(''3headers_demo.xlsx'' ,sheet_name="Sheet4" ,skiprows=1 ... 阅1 转自优雅野人 公众公开 23-10-16 07:33 |
序号和年龄列由于一开始存在缺失值,导致转换成浮点数类型,现在已经填充后,我们可以将其转换回来:df.序号 = df.序号.astype(''''''''int16'''''''')df.年龄 = df.年龄.astype(''''''''int16'''''''')df.... 阅1 转自awoziji 公众公开 23-10-16 07:33 |
# in df[df[''''''''Pclass''''''''].isin((1,2))].head()# not in df[~df[''''''''Pclass''''''''].isin((1,2))].head()4. groupby分组统计4.1 单个列的聚合。# SQL:sql = ''''''... 阅1 转自RockyLeo 公众公开 23-10-16 07:32 |
df.pivot_table(index=''''''''animal'''''''', columns=''''''''visits'''''''', values=''''''''age'''''''', aggfunc='''... 阅1 转自debianylin 公众公开 23-10-16 07:22 |
df1 = pd.pivot_table(df,index=[''''''''品牌'''''''',''''''''销售区域''''''''],columns=''''''''月份'''''''', values=''... 阅1 转自RockyLeo 公众公开 23-10-16 07:20 |
# 获取名为''''''''viridis''''''''的调色板,颜色列表长度为8,即包含8种颜色cmap = mpl.cm.get_cmap("viridis", 8)# type(cmap)123.def plot_colormap(cmap_name): fig, ax = plt.subplots(figsize=(6, 2)) cmap = mpl.cm.get_cmap(cmap_name) colors =... 阅825 转1 评0 公众公开 23-07-25 14:55 |
阅61 转0 评0 公众公开 23-07-25 14:54 |
因此,让我们只选择LoanID和ForeclosureDate列,并丢弃其余部分:df_per = df_per[:,[''''''''LoanID'''''''',''''''''ForeclosureDate'''''''']]df_per.head(5)LoanID)]df_per.head(5)df_per.names = [... 阅1 转自RockyLeo 公众公开 21-12-01 06:50 |
大道至简:玩转数据可视化。小白我不是这个领域的专家,但我很清楚“可视化探索”数据价值并不是一件很难的工作,很适合每个小白进入数据挖掘这个金领圈!而专门做数据挖掘的软件(SPSS等),有可视化和数据挖掘算法,但就是太丑了,不好操作;微博分析示例中的树状图(小白我看不懂,求解)这个数据挖掘软件里的可视化功能不如Tableau里多,里... 阅27 转0 评0 公众公开 18-09-01 21:19 |
大道至简:玩转数据可视化。小白我不是这个领域的专家,但我很清楚“可视化探索”数据价值并不是一件很难的工作,很适合每个小白进入数据挖掘这个金领圈!而专门做数据挖掘的软件(SPSS等),有可视化和数据挖掘算法,但就是太丑了,不好操作;微博分析示例中的树状图(小白我看不懂,求解)这个数据挖掘软件里的可视化功能不如Tableau里多,里... 阅40 转0 评0 公众公开 18-09-01 21:18 |