配色: 字号:
高中信息技术《数据处理与应用》练习题(含解析)
2023-03-28 | 阅:  转:  |  分享 
  
高中信息技术《数据处理与应用》练习题学校:___________姓名:___________班级:_____________一、选择题1.现
代社会,日常生活中的很多应用都离不开大数据的支持。下列选项中,可以不依赖大数据的是(?)A.手机上的购物广告精准推送B.某共享单车
公司的投放分布决定C.在线语音电话D.实时地图导航2.对于数据可视化的作用说法不正确的是(?)。A.散点图可以清晰地呈现数据之间的
空间关系B.饼图可以直观地呈现各项数据所占比例C.关系图可以呈现数据之间的逻辑关系或空间关系D.趋势图可以直观地呈现数据变化趋势3
.下列关于大数据处理的说法,错误的是 (?)A.处理大数据一般采用分治思想B.数据采集只能收集结构化数据C.图计算主要针对图数据D
.并行处理能节省复杂问题的处理时间4.下列关于Hadoop平台的说法正确的是(  )A.该平台只能处理结构化数据 B.处理信息必须
通过可视化体现处理的结论C.该平台中每台计算机都在处理相同的数据D.该平台可以节省大型和复杂问题的处理时间5.文本数据处理的过程主
要包括:①分词;②数据分析;③特征提取;④结果呈现。顺序正确的是(?)A.①②③④B.②①③④C.①③②④D.③①②④6.下列有关
可视化工具的说法,不正确的是(?)A.Tableau主要用于实时可视化分析,它可以连接本地或云端数据,还可以连接动态数据源B.D3
.js是运行在JavaScript上的数据可视化开源工具库,不可以创建实时交互的网页C.Highcharts是一个开源图表库,支持
移动端,能够简单便捷地在web网站或web应用程序中添加动态、交互性的图表D.GoogleCharts是为浏览器与移动设备定制的交
互式图表开发包,用于在web上可视化数据7.下列关于词云说法错误的是(?)。A.词云是目前常用的关键词可视化形式B.用词云可视化文
本数据可以帮助人们快速地了解文本的内容和特征信息C.词云通常使用字体的大小和颜色表示关键词的重要程度或出现频次D.在词云中,字越大
表示该关键词使用频率就越低8.以下关于数据整理,错误的是(?)A.数据的重复值会导致数据分布变化B.数据的缺失值会导致样本信息减少
C.数据的异常值增加了分析的难度D.数据整理的科学与否对数据分析的影响不大9.下列选项中,没有应用大数据技术的是(?)A.把论文拿
到知网比对,得到精准的查重结果B.电子地图根据车辆的行驶轨迹判断拥堵路段C.政府通过建档立卡和数据分析实行精准扶贫D.班主任利用计
算机分析统计本班学生的成绩10.下列关于数据整理的说法,错误的是(?)A.数据集中缺失的数据可以采用中间值来填充B.数据集中异常数
据可能包含重要信息C.数据集中的重复数据可进行合并删除处理D.数据集中格式不一致的数据,一般保留一种格式的数据,删除其他格式的数据
11.雷达图是一种表现多维数据的图表,专门用来进行多指标体系的比较分析。这种可视化的方法属于(?)。A.有关时间趋势的可视化B.有
关比例的可视化C.有关空间关系的可视化D.有关差异的可视化二、填空题12.请列举出五个数据可视化表达的常见图表名称________
。13.常见的数据计算有数值数据、_________、日期/时间数据、逻辑数据。三、操作题14.我校 2019 级学生高三二模部分
成绩如图 a 所示,利用该数据展开了数据的统计分析和可视化呈现。图 a 请回答下列问题: (1)如图所示,M3:M21 单元格的数
据由 M2 单元格自动填充而得,现已知 M2 单元格数据为各科总分,则 M2 单元格的公式为________。 (2)总分前 10
名的图表如图 b 所示,该图表类型为___________。 图 b (3)算法思路:先按“总分”降序排序,然后利用“姓名”和“
总分”前 10 名制作图表,实现的代码如下。import pandas as pd import matplotlib.pyplo
t as plt font={''family'':''MicroSoft YaHei''} # 显 示 中 文plt.rc(''font''
, font) df=pd.read_excel("2022WZ2M.xlsx") df_sort=df.sort_value
s("总分", ___________) #取总分前 10 名制作图表x=df_sort[''姓名''].head(10) y=___
_____________plt.bar(x,y,color=''b'') plt.grid(alpha=0.5)?# 添 加 网 格
plt.title("2022 年温州二模总分前 10 名")?#添加标题plt.show() 请在程序划线处填上合适的代码。 (
4)制作每门学科的平均分,并按技术成绩降序排序,并将结果保存在文件“2022WZ2M_TJ.xlsx” 中,分析结果如图 c 所示
。?图 c 实现代码如下,请在划线处填上合适的代码。 xk_avg=df.__________("班级")?#按班级分组xkavg
_mean=_________ #计算各科班级平均分 xkavg_mean.to_excel("2022WZ2M_TJ.xlsx"
,index=True,header=True) #保存结果文件四、简答题15.测量大气压值的著名实验是由托里拆利设计完成的。他将
一根长度为1米的玻璃管灌满水银,然后用手指顶住管口,将其倒插进装有水银的水银槽里,放开手指后,可见管内部顶上的水银已下落,留出空间
来了,而下面的部分则仍充满水银。任务:利用水银气压计测量不同海拔高度的大气压数值如下表所示,分析这些数据,通过数字化学习方式探究大
气压与海拔高度的关系,形成可视化报告。海拔/km0123456789101112大气压/(p/kpa)10190807062544
7413631262319不同海拔高度的气压数值参考答案1.C【详解】本题主要考查大数据的应用。大数据是指无法在一定时间内用常规软
件工具对其内容进行抓取、管理和处理的数据集合。在线语音电话不涉及大数据,故本题选C选项。2.A【详解】本题考查数据可视化的相关知识
点散点图用于显示两个不同变量之间的关系,或者用于揭示数据的分布趋势。当数据点较多并且需要显示数据集的相似性时,可以使用散点图。A说
法错误,故本题选A选项3.B【详解】本题主要考查大数据处理。处理大数据一般采用分治思想;大数据采集的是规模巨大的数据,不局限于结构
化数据;图计算主要针对图数据;并行处理能节省复杂问题的处理时间,故本题选B选项。4.D【详解】本题考查的是Hadoop平台相关知识
。该平台可以处理结构化、非结构化和半结构化的数据,分析的结果可以通过可视化来体现,也可以是单纯的数据信息。该平台采用分布式文件格式
,不同的计算机往往处理不同的数据,其目的是为了节省计算时间。5.C【详解】本题主要考查数据处理。文本数据处理的过程是:分词→特征提
取→数据分析→结果呈现,故本题选C选项。6.B【详解】本题主要考查可视化工具。Tableau主要用于实时可视化分析,它可以连接本地
或云端数据,还可以连接动态数据源;D3.js是运行在JavaScript上的数据可视化开源工具库,可以创建实时交互的网页;High
charts是一个开源图表库,支持移动端,能够简单便捷地在web网站或web应用程序中添加动态、交互性的图表;GoogleChar
ts是为浏览器与移动设备定制的交互式图表开发包,用于在web上可视化数据,故本题选B选项。7.D【详解】本题主要考查可视化工具。词
云是目前常用的关键词可视化形式;用词云可视化文本数据可以帮助人们快速地了解文本的内容和特征信息;词云通常使用字体的大小和颜色表示关
键词的重要程度或出现频次;在词云中,字越大表示该关键词使用频率就越高,故本题选D选项。8.D【详解】本题主要考查数据整理。数据的重
复值会导致数据分布变化 ;数据的缺失值会导致样本信息减少;数据的异常值增加了分析的难度;数据整理的科学与否对数据分析的影响较大,故
本题选D选项。9.D【详解】本题主要考查大数据技术的应用。大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到
无法透过主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。结合选项可知,班主任利用计算机
分析统计本班学生的成绩没有应用大数据技术,故本题选D选项。10.D【详解】本题考查的是数据处理。数据集中格式不一致的数据需要根据后
续分析和挖掘的需要进行数据转换。故本题应选D。11.D【详解】本题主要考查数据可视化的方法。雷达图法是日本企业界为评估综合实力而采
用的一种综合评价方法。按这种方法所绘制的财务比率综合图状似雷达,故得此名。这种可视化的方法属于有关差异的可视化,故本题选D选项。1
2.饼图、条形图、折线图、散点图、雷达图、词云图、热力图等。【详解】本题主要考查数据可视化。数据可视化表达的常见图表名称有:饼图、
条形图、折线图、散点图、雷达图、词云图、热力图等。13.文本数据【详解】本题主要考查数据类型。常见的数据计算有数值数据、文本数据、
日期/时间数据、逻辑数据。14.???? =SUM(C2:L2)???? 柱形图 或 垂直柱形图???? ascending= F
alse???? df_sort[''总分''].head(10)或 df_sort.总分.head或 df_sort[''总分''][:
10] 或 df_sort.总分[:10] 或其它等价答案???? groupby???? xk_avg.mean()【详解】本题
考查的是数据处理。(1) M2 单元格数据为各科总分,则故M2 单元格的公式为:=SUM(C2:L2)。(2)由图可知,该图表类型
为柱形图。(3)先按“总分”降序排序,故第一空为:ascending= False,图表y轴表示的前10名总分,故第二空为:df_sort[''总分''].head(10)或 df_sort[''总分''][:10] 或 df_sort.总分[:10] 或其它等价答案;按班级分组,故第三空应为:groupby;计算各班级平均分,故第四空为:xk_avg.mean()。15.从图中可以清晰的看出,海拔与大气压成反比关系【详解】本题考查数据相关知识点;通过Excel的折线图将气压值与海拔的关系清晰展现出来。如图所示:答案第11页,共22页试卷第11页,共33页试卷第11页,共33页答案第11页,共22页
献花(0)
+1
(本文系师者是原创)