F2967527 IP属地:天津

文章 关注 粉丝 访问 贡献
 
共 218 篇文章
显示摘要每页显示  条
Hadoop、spark、hive到底是什么,做算法要不要学?首先是hdfs,hdfs是hadoop框架中的分布式文件系统。hdfs是hadoop的存储系统,hadoop同样也推出过一套计算系统,就是MapReduce。spark在MapReduce的基础上对MapReduce当中的一些问题进行了优化,比如MapReduce每次运算结束之后都会把数据存储在磁盘上,这会带来巨大的IO开销。并且spark原生支持...
随着数据分析岗位招聘越来越内卷,问“你用过/建过什么模型”的也越来越多。这些模型是经典的营销分析模型,但正因为经典,所以它们大部分基于调研数据,诸如用户态度,感觉,评价,是基于传统调研的手段获取数据。这些模型才是业务提及率最高,讲得最多的模型。线性规划模型是经典的科学管理模型,往往用在已定目标,分配任务的场景(如下图)...
# 安装streamlitpip install streamlit -i https://mirror.baidu.com/pypi/simple/# 安装Plotly Expresspip install plotly_express==0.4.0 -i https://mirror.baidu.com/pypi/simple/# 安装xlrdpip install xlrd==1.2.0 -i https://mirror.baidu.com/pypi/simple/# 绘制饼图pie_chart = px.pie(df_participants, title=''''&#...
相当全面的Numpy使用总结.pptx给本科生入门学习的NumPy使用总结,图比较多。下载地址:https://github.com/fengdu78/WZU-machine-learning-course.包含pdf课件、代码等。课件在ppt文件夹,代码在code文件夹。备注:请不要用于商业用途。如果是在校老师,请告知我们学校和姓名,我可以发原版ppt文件,请联系我:haiguang2000@wzu.edu.cn.
对于上述仅有一种聚合函数的例子,在pandas中更倾向于使用groupby直接+聚合函数,例如上述的分组计数需求,其实就是groupby+count实现。03 groupby+agg上述方法是直接使用groupby+相应的聚合函数,这种聚合统计方法简单易懂,但缺点就是仅能实现单一的聚合需求,对于有多种聚合函数的情况是不适用的。agg内接收聚合函数字典,其中key为列名,va...
vaex 处理海量数据。项目地址:https://github.com/mars-project/mars官方文档:https://docs.mars-project.io Dask.Dask更侧重与其他框架,如:Numpy,Pandas,Scikit-learning相结合,从而使其能更加方便进行分布式并行计算。项目地址:https://github.com/dask/dask官方文档:https://docs.dask.org/en/latest/ CuPy.项目地址:https://gith...
vaex 处理海量数据。项目地址:https://github.com/mars-project/mars官方文档:https://docs.mars-project.io Dask.Dask更侧重与其他框架,如:Numpy,Pandas,Scikit-learning相结合,从而使其能更加方便进行分布式并行计算。项目地址:https://github.com/dask/dask官方文档:https://docs.dask.org/en/latest/ CuPy.项目地址:https://gith...
Google数据可视化团队:数据可视化指南(中文版)每天干货不断,,与优秀数据从业者同行吧!汇聚数据牛人实践精华 网罗职场大佬成长秘籍这是一套谷歌数据可视化团队形成的全面的数据可视化指南,涵盖了设计原则、图表分类、图表的选用、样式设计、交互设计、仪表板设计等方面。数据可视化。数据可视化可以表达不同类型和规模的数据,包括从几个数...
从0到1,掌握数据可视化的基本技巧说在前面。小熊妹也不是专业科班出身的数据分析师,但还是认真的总结了数据可视化的基本技巧。Q1:什么是数据可视化?甚至,基于可视化图形,延伸出来了很多具体的分析方法,比如分层分析法、趋势分析法、同期群分析法、生命周期分析法、矩阵分析法、关联分析法等等。本质上,可视化是数据的一种表现形式,数...
axis 表示轴,是处理多维数据时用于表示维度方向的概念,在 pandas 中大部分的方法都有 axis 参数,因为 pandas 需要调用者告诉他,需要处理的是哪个维度的数据。本文将分享我对 axis 的理解,希望帮助你更好理解 axis 的概念,这些概念不仅仅应用在 pandas ,同样适合于其他相关的库的理解(如 numpy 中的3维或以上的处理)。- 怎么理解不同方法...
帮助 | 留言交流 | 联系我们 | 服务条款 | 下载网文摘手 | 下载手机客户端
北京六智信息技术股份有限公司 Copyright© 2005-2024 360doc.com , All Rights Reserved
京ICP证090625号 京ICP备05038915号 京网文[2016]6433-853号 京公网安备11010502030377号
返回
顶部