
第一章单元测试
1、单选题:
以下哪种技术对大数据技术的发展起了基础支撑作用?
选项:
A: 数据库技术
B: 云计算技术
C: 物联网技术
D: 信息安全技术
答案: 【 云计算技术】
2、单选题:
大数据的特征可以用被总结为4V特征,以下哪个不属于大数据的4V特征
选项:
A: 体量大(Volume)
B: 速度快(Velocity)
C: 种类多(Variety)
D: Venture(风险大)
答案: 【 Venture(风险大)】
3、单选题:
微软研究院所提出的科学研究的第四种范式是指:
选项:
A: 实验
B: 理论分析
C: 计算
D: 数据密集型科学发现(Data Intensive Science Discovery)
答案: 【 数据密集型科学发现(Data Intensive Science Discovery)】
4、填空题:
在大数据时代,我们将有三个重大思维的转变,要相关,________;要全体,不要抽样;要效率,允许不精确。
答案: 【 不要因果】
5、填空题:
2015年9月,国务院印发《_____________________________》系统部署大数据发展工作,指出了其必要性。
答案: 【 促进大数据发展行动纲要】
6、填空题:
以下是关于大数据价值的描述,请填空:大数据可以帮助发现规律,大数据可以帮助________现象,大数据可以帮助预测未来。
答案: 【 解释】
第二章 大数据相关技术基础
测验
1、单选题:
我们通常听某同学讲:“我在阿里云上租了一个服务器”,那么这个服务器是属于云计算的那种应用场景()
选项:
A: IAAS
B: SAAS
C: PAAS
D: 以上都不是
答案: 【 IAAS】
2、单选题:
在野外部署有许多传感器,用于实时采集空气质量数据,当数据传回数据中心后,在存储之前需要进行数据的预处理操作,那么如下哪些操作部署于数据预处理所采用的方法()。
选项:
A: 数据变换
B: 数据不一致性检测
C: 缺失数据填充
D: 以上都是
答案: 【 以上都是】
3、单选题:
数据仓库所存储的数据,通常具有一定特点,下列哪些不属于其特点的()
选项:
A: 经常修改数据项的值
B: 数据大都反应历史
C: 面向特定主题
D: 数据来源多样
答案: 【 经常修改数据项的值】
4、多选题:
为了描述数据的统计学特征,我们常用的统计学指标有()
选项:
A: 均值
B: 方差
C: 中位数
D: 分位数
答案: 【 均值;
方差;
中位数;
分位数】
5、判断题:
大数据的发展需要大规模物理资源、计算资源的支持,以及高效的调度管理,所以从某种程度上讲,云计算的发展促进了大数据的发展和应用。
选项:
A: 正确
B: 错误
答案: 【 正确】
第三章 数据采集与预处理
测试
1、单选题:
对于一组数据(1,2,2,NAN,4),若采用众数法补全缺省值,则NAN该补为()
选项:
A: 1
B: 2
C: 4
D: 1.8
答案: 【 2】
2、多选题:
半结构化数据包括()
选项:
A: HTML文档
B: Excel表格
C: 检查身体后得到的体检报告
D: 银行账户上的消费记录
答案: 【 HTML文档;
Excel表格;
检查身体后得到的体检报告】
3、多选题:
大数据的来源途径有许多,如下哪些属于大数据来源()
选项:
A: 传感器设备采集的数据
B: 人在微博上发表的记录
C: 计算机网络运行产生的日志
D: 网络爬虫得到的数据
答案: 【 传感器设备采集的数据;
人在微博上发表的记录;
计算机网络运行产生的日志;
网络爬虫得到的数据】
4、判断题:
所谓数据的归一化处理,是指把数据变换到[0,1]区间,所以,对于数据1,2,3,4,归一化后得到的值为0.25,0.5,0.75,1
选项:
A: 正确
B: 错误
答案: 【 错误】
5、判断题:
数据的平滑操作,其目的在于消除数据波动产生的噪声。
选项:
A: 正确
B: 错误
答案: 【 正确】
第四章 Hadoop架构和大数据存储简介
单元测验:hadoop简介
发表评论 (已有0条评论)
快来评论,快来抢沙发吧~