分享

木舟| Python中常用第三方库 | 《信息技术》(2021版)二次学习微视频005

 木舟u2497sll0j 2022-01-07

(建议在WIFI环境下观看)


Python中常用的第三方库

Python语言自1989年诞生以来,技术不断更迭,生态逐渐完善,加上互联网、大数据、人工智能浪潮的推波助澜。Python逐渐受到大众的青睐。
Python不仅有强大的标准库,同时支持第三方库的扩展应用。接下来我们介绍一下在高中信息技术必修模块,我们需要了解的几个第三方库。
Turtle库是一个比较常用的绘制图像的函数库,类似于一个小乌龟,从一个横轴为x、纵轴为y的坐标系原点位置开始,根据一组函数指令的控制,在这个平面坐标系中移动,从而在它爬行的路径上绘制图形。
turtle.forward(100),表示“画一条100像素的线”
turtle.left(90),表示“逆时针旋转90度”,turtle.right(90)表示“顺时针旋转90度”。
在“网页爬取与解析”时,可以使用这两个库。
Requests库能够让我们很方便地发送HTTP请求,网页请求方式有很多种,GET是最常见的方式,响应速度较快。
通过Requests库抓取到网页源代码后,我们需要从源代码中找到并提取数据,BeautifulSoup库用于从网页中抓取数据。
比如这组代码,就是用于获取网页<title>内容的Python程序代码。 

其中我们看到,前两行语句,分别用于导入用到的第三方库,其中第4行语句,就是用Requests库的get方式获取网页数据。
Pandas库主要作用是数组计算功能以及电子表格和关系数据库的数据处理。它主要处理的数据类型有两种,其中Series是一维数据结构,类似于列表listDataFrame是二维数据结构,典型的是我们常见的二维表格。比如我们看到的这个自行设置的行和列标题的数据表。
Pandas库提供了read_csv()函数用来读取CSV文件;
Pandas库提供了to_csv()函数用来存储CSV文件;
在数据分析之前,我们经常会对数据进行预处理,我们会经常用到Pandas库提供的一些方法。其中drop_duplicates( )方法用于“去除重复值”,isnull( )用于“识别缺失值”,notnull( )用于“识别非缺失值”,dropna( )用于“处理缺失值”。
在处理重复值和缺失值时我们要注意,一般是处理DataFrame二维数据中的“行”数据,一行也称为一条记录。
Matplotlib是一种应用较为广泛的绘图工具包,我们常使用其中的pyplot子库所提供的函数快速绘制图形,进行数据可视化。
引入Matplotlib的子库pyplot的语法是:importmatplotlib.pyplot as plt。导入后,我们就可以用plt相关函数快速绘制图形。
常见的函数有这么几个:
scatter( ),用于绘制散点图;
plot( ),用于绘制折线图;
pie( ),用于绘制饼图;
bar( ),用于绘制柱形图;
boxplot( ),用于绘制箱形图。
更多库和函数的使用,大家可以自行探索。
其实,在Python语言中,既有标准库,如我们前面曾提到过的math,数学函数库,以及random,可以生成随机数等。也有第三方库,如我们前面介绍的pandas,数据处理以及Turtle,绘制图像等。
在使用前,Python标准库不需要安装,它会随着Python的主程序一起安装。但是对于众多的第三方库,在使用前必须安装。安装的方法有很多,一般我们使用的是“pip install  <拟安装的库名>”;同时,无论是标准库还是第三方库,在具体使用前,我们必须导入,导入的方法是“import <拟导入的库名>”,导入后才能够使用相应库的函数或者方法。
同学们,Python语言强大的原因之一,很多人认为就是这些庞大的功能各异的第三方库,目前据说已经有二十多万个,我们介绍的只是很少的一部分,更多的库的使用方法和功能请同学们自行学习。希望同学们在具体实践中慢慢体会,相信大家都是最棒的。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多