想用Python玩转机器学习和数据科学,先要了解都有哪些好用的库及工具。 很多人每天大量的时间都是用在搜索这些上。 这次来自奥地利的Florian Rohrer,为了提高大家的效率,把各种库,以及教程;代码片段;GitHub上高星实用的帖子整理成了一个合集。 一 约50种项目 我敢肯定,这里面一定有你关注的。 我大概列一下原作者的分类吧: 核心类;Pandas和Jupyter;文本提取;大数据;命令行工具;统计;可视化;特色工具;特征选择;可视化;地理工具:推荐系统;决策树模型;NLP;CV;神经网络;文字和自然语言相关;回归;堆叠…… 因为实在太多,太全面了,下面只挑几个给大家看一下 核心类 真的是应有尽有,文末为大家准备了GitHub的链接,可以直接前往进行下载。 Pandas和Jupyter 从一般性技巧到表格的小部件都有哦 可视化 比如通过Python和Blender完成,并显示奥地利注册古迹分布的3D条形图 神经网络 神经网络方面作者还特意分成了“教程-图像方面-文字方面-Libs”四大部分来给大家盘点资源。 二 原作者安利部分 项目作者准备收集了GitHub上不少高质量资源,很多都是标星过万的内容。 看见一连串的Awesome了吗?这可不是标题党,绝对Awesome。
|
|