
第一章单元测试
1、单选题:
以下哪种技术对大数据技术的发展起了基础支撑作用?
选项:
A: 数据库技术
B: 云计算技术
C: 物联网技术
D: 信息安全技术
答案: 【 云计算技术】
2、单选题:
大数据的特征可以用被总结为4V特征,以下哪个不属于大数据的4V特征
选项:
A: 体量大(Volume)
B: 速度快(Velocity)
C: 种类多(Variety)
D: Venture(风险大)
答案: 【 Venture(风险大)】
3、单选题:
微软研究院所提出的科学研究的第四种范式是指:
选项:
A: 实验
B: 理论分析
C: 计算
D: 数据密集型科学发现(Data Intensive Science Discovery)
答案: 【 数据密集型科学发现(Data Intensive Science Discovery)】
4、填空题:
在大数据时代,我们将有三个重大思维的转变,要相关,________;要全体,不要抽样;要效率,允许不精确。
答案: 【 不要因果】
5、填空题:
2015年9月,国务院印发《_____________________________》系统部署大数据发展工作,指出了其必要性。
答案: 【 促进大数据发展行动纲要】
6、填空题:
以下是关于大数据价值的描述,请填空:大数据可以帮助发现规律,大数据可以帮助________现象,大数据可以帮助预测未来。
答案: 【 解释】
第二章 数据采集与预处理
测试
1、单选题:
对于一组数据(1,2,2,NAN,4),若采用众数法补全缺省值,则NAN该补为()
选项:
A: 1
B: 2
C: 4
D: 1.8
答案: 【 2】
2、多选题:
半结构化数据包括()
选项:
A: HTML文档
B: Excel表格
C: 检查身体后得到的体检报告
D: 银行账户上的消费记录
答案: 【 HTML文档;
Excel表格;
检查身体后得到的体检报告】
3、多选题:
大数据的来源途径有许多,如下哪些属于大数据来源()
选项:
A: 传感器设备采集的数据
B: 人在微博上发表的记录
C: 计算机网络运行产生的日志
D: 网络爬虫得到的数据
答案: 【 传感器设备采集的数据;
人在微博上发表的记录;
计算机网络运行产生的日志;
网络爬虫得到的数据】
4、判断题:
所谓数据的归一化处理,是指把数据变换到[0,1]区间,所以,对于数据1,2,3,4,归一化后得到的值为0.25,0.5,0.75,1
选项:
A: 正确
B: 错误
答案: 【 错误】
5、判断题:
数据的平滑操作,其目的在于消除数据波动产生的噪声。
选项:
A: 正确
B: 错误
答案: 【 正确】
第三章 Hadoop架构和大数据存储简介
单元测验:hadoop简介
1、单选题:
那些不是大数据的特点
选项:
A: 数据量在MB,GB级别
B: 可以处理结构化、半结构化数据
C: 采用的数据模型为平面模型
D: 数据的内部关系相对松散
答案: 【 数据量在MB,GB级别 】
2、单选题:
大数据的容量不断增长,也就要求有更加复杂的数据管理方法,为此,如下哪项不是大数据存储面临的挑战()
选项:
A: 低成本&
发表评论 (已有0条评论)
快来评论,快来抢沙发吧~