Erebus 发表于 2022-12-27 18:29:45

北京中医药大学 大数据概论 试卷


一、填空题(共 30 分,每题2 分)
第三次信息化浪潮的标志是()技术的普及。
大数据计算模式有:()流计算,图计算和查询分析计算。
()是物物相连的互联网,是互联网的延伸。
Hadoop 的两大核心是 HDFS 和()
启动 Hadoop 的命令是()
HDFS采用 ()结构模型,包括一个名称节点和若干数据节点
HBase 采用表来组织数据,表由行和列组成,列划分为若干个()支持动态扩展。
()是 HBase 中最核心的模块。
MapReduce 采用分而治之的策略和()的理念,通过这方式减少节点间的数据移动开销。
MapReduce 框架使用()模块做 Map 前的预处理。
NoSOL 四大类型中包括: 键值数据库、列族数据库、文档数据库和()
()数据库不仅具有 NOSOL 对海量数据的存储能力,还保持了传统数据库的 ACID 和 SOL 等特性。
Spark 中,一个DAG 图划分为多个()

RDD 中的依赖关系分为:()和()
Spark 最大的特点就是将计算数据、中间结果都存储在(),更适合迭代运算。



二、判断题(共 20 分,每题 2 分)(正确的用表示,错误的用X表示)
大数据的发展历程为:萌期、成熟期和大规模应用期。()
HDFS 可以高效存储大量的小文件。()
FsImage 用于维护文件系统树以及文件树中所有文件和文件夹的元数据。()
HBase 中用户数据的存储管理、响应用户的读写请求,都是由主服务器 Master负责的。()
不同的 Map 任务之间会进行通信。()
当处理 CAP 的问题时,CAP 即同时兼顾可用性、分区容忍性和一致性,但系统性能会下降很多。()
专家推荐:人工推荐,由资深的专业人士来进行物品的筛选和推荐,需要较多的人力成本。()
关系数据库可以很好的满足 Web2.0 的需求。()
UserCF 算法推荐的是和目标用户有共同兴趣爱好的其他用户喜欢的物品。()
Spark 的计算模式也属于 MapReduce,但不局限于Map和 Reduce 操作。()



三、简答题(共30 分,每题5分)
请简述大数据、云计算和物联网三者之间的关系。
请简述 Hadoop 的特性。
简述 HBase 的三层结构,以及三层结构中各层次的作用。
请简述 Map 端的 Shuffle 过程。
请简要介绍 Spark 生态系统。
什么是智慧医疗?简述智慧医疗的优点。



四、问答题(共20 分,每题 10 分)
1. 请介绍 HDFS 中名称节点和数据节点的主要作用。阐述 SecondarvNameNode 的作用和工作原理。
2.NoSOL 的三大基石是什么? 并详细介绍三大基石。

页: [1]
查看完整版本: 北京中医药大学 大数据概论 试卷