共 32 篇文章 |
|
使用Apriori算法和FP.2:Apriori算法和FP-growth算法原理。对每个数据集中的项集: 3.1 初始化空FP树 3.2 对每个项集进行过滤和重排序 3.3 使用这个项集更新FP树,从FP树的根节点开始: 3.3.1 如果当前项集的第一个元素项存在于FP树当前节点的子节点中,则更新这个子节点的计数值 3.3.2 否则,创建新的子节点,更新头指... 阅578 转5 评0 公众公开 18-06-15 09:54 |
FP.FP树结点。123创建条件FP树。# 准备数据with open("./data/kosarak.dat", "rb") as f: parsedDat = [line.split() for line in f.readlines()]initSet = fpgrowth.createInitSet(parsedDat)# 用数据集构造FP树,最小支持度10wmyFPtree, myHeaderTab = fpgrowth.createFPtree(initSet, 100000)# 挖掘FP树freqItems = []f... 阅208 转0 评0 公众公开 18-06-14 20:16 |
scipy.stats.gmean(几何平均数), scipy.stats.hmean(调和平均数), numpy.mean, numpy.nanmean, pandas.Series.mean.numpy.median, numpy.nanmediam, pandas.scipy.stats.std, scipy.stats.nanstd, numpy.std, pandas.statsmodels.stats.ttest_ind, statsmodels.stats.ttost_ind, statsmodels.stats.ttost.paired;scipy.stats.ttest_1samp, scip... 阅251 转1 评0 公众公开 18-06-14 17:50 |
Pandas dtypes(数据类型)Index.astype(dtype, copy=True)参数dtype : numpy dtype or pandas typecopy : bool, default True其他转换方法。 阅4084 转0 评0 公众公开 18-05-29 15:23 |
设置 jupyter notebook 可远程访问。jupyter notebook --generate-config.Writing default config to: /root/.jupyter/jupyter_notebook_config.py.从 jupyter notebook 5.0 版本开始,提供了一个命令来设置密码:jupyter notebook password,生成的密码存储在 jupyter_notebook_config.json。以上设置完以后就可以在服务器上启动 jupyter note... 阅96 转0 评0 公众公开 18-05-29 14:49 |
pandas 将“字符类型的日期列”转化成“时间戳索引(DatetimeIndex)”DataFrame''''''''>RangeIndex: 640 entries, 0 to 639Data columns (total 7 columns):date 640 non-null objectopen 640 non-null float64close 640 non-null float64high 640 non-null float64low 640 non-null float64volume 640 n... 阅4441 转2 评0 公众公开 18-05-29 14:10 |
机器学习算法的随机数据生成。import numpy as npimport matplotlib.pyplot as plt%matplotlib inlinefrom sklearn.datasets import make_gaussian_quantiles#生成2维正态分布,生成的数据按分位数分成3组,1000个样本,2个样本特征均值为1和2,协方差系数为2X1, Y1 = make_gaussian_quantiles(n_samples=1000, n_features=2, n_classes=3, mean... 阅57 转0 评0 公众公开 18-05-22 14:04 |
# df.set_index(''''''''date'''''''').groupby(''''''''name'''''''')[''''''''ext price''''''''].resample("M").sum()df.g... 阅427 转1 评0 公众公开 18-05-17 14:14 |
DataFrame执行groupby聚合操作后,如何继续保持DataFrame对象而不变成Series对象。最近在做京东jdata算法比赛,刚接触pandas不久,在处理特征时,碰到一个恶心的问题:用groupby聚合后,之前的dataframe对象变成了series对象,聚合的字段变成了索引index,导致获取这些字段时很麻烦,后面发现reset_index()这个函数,兼职完美的解决了我的需求... 阅751 转0 评0 公众公开 18-05-17 11:56 |
如何删除python pandas.DataFrame 的多重index.如下dataframe想要删除多层index.[html] view plain copy print?namesexbirthsyearprop.top1000.index = top1000.index.droplevel() top1000.index = top1000.index.droplevel() top1000[:10] 阅948 转0 评0 公众公开 18-05-17 11:21 |