宋娃娃姓宋的图书馆

他的首页他的馆藏他的动态馆友反馈关于他分享对话

宋娃娃姓宋

文章		关注		粉丝		访问		贡献

关注

粉丝

访问

贡献

他的首页

他的馆藏

他的动态

馆友反馈

关于他

共 32 篇文章

显示摘要

每页显示

条

使用Apriori算法和FP

使用Apriori算法和FP.2：Apriori算法和FP-growth算法原理。对每个数据集中的项集： 3.1 初始化空FP树 3.2 对每个项集进行过滤和重排序 3.3 使用这个项集更新FP树，从FP树的根节点开始： 3.3.1 如果当前项集的第一个元素项存在于FP树当前节点的子节点中，则更新这个子节点的计数值 3.3.2 否则，创建新的子节点，更新头指...

阅578 转5 评0 公众公开 18-06-15 09:54

FP.FP树结点。123创建条件FP树。# 准备数据with open("./data/kosarak.dat", "rb") as f: parsedDat = [line.split() for line in f.readlines()]initSet = fpgrowth.createInitSet(parsedDat)# 用数据集构造FP树，最小支持度10wmyFPtree, myHeaderTab = fpgrowth.createFPtree(initSet, 100000)# 挖掘FP树freqItems = []f...

阅208 转0 评0 公众公开 18-06-14 20:16

Python 数据挖掘工具包整理

scipy.stats.gmean(几何平均数), scipy.stats.hmean(调和平均数), numpy.mean, numpy.nanmean, pandas.Series.mean.numpy.median, numpy.nanmediam, pandas.scipy.stats.std, scipy.stats.nanstd, numpy.std, pandas.statsmodels.stats.ttest_ind, statsmodels.stats.ttost_ind, statsmodels.stats.ttost.paired;scipy.stats.ttest_1samp, scip...

阅251 转1 评0 公众公开 18-06-14 17:50

Pandas dtypes(数据类型)

Pandas dtypes(数据类型)Index.astype(dtype, copy=True)参数dtype : numpy dtype or pandas typecopy : bool, default True其他转换方法。

阅4084 转0 评0 公众公开 18-05-29 15:23

设置 jupyter notebook 可远程访问

设置 jupyter notebook 可远程访问。jupyter notebook --generate-config.Writing default config to: /root/.jupyter/jupyter_notebook_config.py.从 jupyter notebook 5.0 版本开始，提供了一个命令来设置密码：jupyter notebook password，生成的密码存储在 jupyter_notebook_config.json。以上设置完以后就可以在服务器上启动 jupyter note...

阅96 转0 评0 公众公开 18-05-29 14:49

pandas 将“字符类型的日期列”转化成“时间戳索引（DatetimeIndex）”

pandas 将“字符类型的日期列”转化成“时间戳索引（DatetimeIndex）”DataFrame''''''''>RangeIndex: 640 entries, 0 to 639Data columns (total 7 columns):date 640 non-null objectopen 640 non-null float64close 640 non-null float64high 640 non-null float64low 640 non-null float64volume 640 n...

阅4441 转2 评0 公众公开 18-05-29 14:10

机器学习算法的随机数据生成

机器学习算法的随机数据生成。import numpy as npimport matplotlib.pyplot as plt%matplotlib inlinefrom sklearn.datasets import make_gaussian_quantiles#生成2维正态分布，生成的数据按分位数分成3组，1000个样本,2个样本特征均值为1和2，协方差系数为2X1, Y1 = make_gaussian_quantiles(n_samples=1000, n_features=2, n_classes=3, mean...

阅57 转0 评0 公众公开 18-05-22 14:04

python处理数据的风骚操作[pandas 之 groupby&agg]

# df.set_index(''''''''date'''''''').groupby(''''''''name'''''''')[''''''''ext price''''''''].resample("M").sum()df.g...

阅427 转1 评0 公众公开 18-05-17 14:14

DataFrame执行groupby聚合操作后，如何继续保持DataFrame对象而不变成Series对象

DataFrame执行groupby聚合操作后，如何继续保持DataFrame对象而不变成Series对象。最近在做京东jdata算法比赛，刚接触pandas不久，在处理特征时，碰到一个恶心的问题：用groupby聚合后，之前的dataframe对象变成了series对象，聚合的字段变成了索引index，导致获取这些字段时很麻烦，后面发现reset_index()这个函数，兼职完美的解决了我的需求...

阅751 转0 评0 公众公开 18-05-17 11:56

如何删除python pandas.DataFrame 的多重index

如何删除python pandas.DataFrame 的多重index.如下dataframe想要删除多层index.[html] view plain copy print?namesexbirthsyearprop.top1000.index = top1000.index.droplevel() top1000.index = top1000.index.droplevel() top1000[:10]

阅948 转0 评0 公众公开 18-05-17 11:21

他的文章
他的书籍

筛选

不限类型

网文

撰写

文档

不限 Word PPT Excel RTF PDF TXT

思维导图

相册

音乐

视频

显示摘要不显示摘要

每页10条每页30条每页50条

返回
顶部