分享

Python 数据科学手册学习.1

 云深无际 2021-11-03

    Python 数据科学手册pdf+源代码这本书可以说的上是使用python进行数据分析的必备书籍了,作为学习记录还是不想鸽的。

完成了基本的配置工作

help和?搭配使用,可以简单的看成一个查询帮助系统

一个?,基本的信息

二个??,打印源码

_然后Tab补全命令

* 通配符命令

Ipython里面支持的快捷键,建议在cmd用

%
单行输入
%%
多行输入

多个代码复制时使用,先复制代码

然后执行这个命令,就自动复制了

可以使用run命令,运行外面的脚本文件

成功

def square(x): """求平方""" return x ** 2

for N in range(1, 4): print(N, "square is ", square(N))

你自己试试


一些简单的pdb调试命令

性能检测部分

% 单行,说了很多次

%%多行,然后这个命令不会对垃圾回收的什么做干预

所以会慢一些

对于一个函数来说,可以使用下面的函数来对每一行的代码来计时

可以看到对每一行的计时操作

这里就是要重点说的numpy了

按照惯例名字叫np缩写,打印了一下版本

其实np里面最多的概念就是数组,就像matlab一样时矩阵优先

在这里先使用自带的array库,生成一个list

我们用np的时候时这样的输入

然后int和float共存的情况下,进行数据升级操作

也可以指定要生成的数据类型

也可以对每一列进行+1的操作,循环3次

生成一个10个数的数组,类型是integer

也可以生成规模指定的数组

或者可以指定生成的浮点型数组

这几个适合一起对比看,就不单独的截图了

第一个,按照步进2 ,从0到20

第二个在0到1之间,随机生成5个数字

第三个是均匀分布

第四个是均值0,方差1的正态分布

最后一个,[0,10)区间的随机整型数组

最后来个单位阵

np.zeros(10, dtype='int16')
np.zeros(10, dtype=np.int16)

这是两种不同的指定数据类型的方法,我觉得最后的写法更酷更统一一些

标准的数据类型有这么多

对一个数组的操作,大概就是这么多

x3=np.random.randint(10,size=(3,4,5))# 三维数组

先建立一个3x3的数组

上面这些个方法就可以对一个任意维数的数组做定量的描述了

第一个是维度

第二个是形状

第三个是元素的数量

第四个是元素的类型

第五个是单个元素的大小

第六个是所有元素的总和

写一个一维的数组,来所用索引号来访问值

前两个是正向的获取值方法

后两个是使用负值进行末尾元素的获取

x2是一个二维的数组

使用(行,列)这样的元素获取法,这样的形式叫逗号分割的索引元组

如何获得一个子数组

第一个生成一个一维的数组

获取前五个元素

获取后五个元素

获取中间的子数组

隔一个元素取一下

从1开始,隔一个取一下

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多