形考任务 1
试卷总分:100 得分:100
1.数据科学是通过科学方法探索数据,以获得有价值的发现。( )
2.大数据的一个重要特征是数据的多样性,这包括数据的各种格式和类型。( )
3.根据数据在收集过程中是否有控制因素,可以将数据分为截面数据和时间序列数据。( )
4.相对于结构化数据,非结构化数据的主要特点是没有固定的格式,它可能来自各种源,并且无法直接存入传统的关系型数据库。( )
5.办公文档、图像、声音和文本都是结构化数据。( )
6.大数据科学不仅包括数据采集和数据分析,还涵括数据预处理、数据存储和数据管理等环节。( )
7.网页数据是一种半结构化数据。( )
8.大数据技术主要处理的数据类型是结构化数据,而对于非结构化数据处理能力较弱。( )
9.大数据在教育领域的应用主要包括个性化教学和学生行为分析等。( )
10.在电商行业,通过大数据分析用户行为,可以提升产品销售、优化营销策略并改善用户体验。( )
11.下列各项属于定量变量的是( )
A.性别
B.婚姻状况
C.年龄
D.国籍
12.在大数据的处理流程中,下列各项中最先进行的是( )
A.存储与管理
B.可视化
C.采集与预处理
D.分析与挖掘
13.下面哪项不属于大数据预处理步骤( )
A.数据清洗
B.数据集成
C.数据转换
D.数据安全
14.下列关于数据类型的描述中,哪一项是错误的( )?
A.非结构化数据包括文本、图像和音视频等
B.结构化数据指的是预定格式的数据如数据库
C.半结构化数据包括XML文件和电子邮件
D.非结构化数据易于进行大数据分析
15.下列关于非结构化数据的描述,哪一项是错误的( )
A.非结构化数据没有固定的数据模型
B.非结构化数据包括图像、声音、视频等
C.非结构化数据不可以进行数据分析
D.非结构化数据数量大
16.以下哪一项不是结构化数据( )
A.关系数据库中的数据
B.Excel表格中的数据
C.歌词文本
D.二维数据表
17.关于时间序列数据的描述,以下哪一项是错误的?( )
A.是按时间顺序排列的观测值序列
B.不能使用统计方法进行分析
C.在时间间隔上接近的观测值通常更相关
D.两个观测值在时间间隔上越远,它们的相关性就更弱
18.关于传统数据与大数据的获取与处理,下列描述中错误的是( )。
A.传统的数据获取来源单一
B.采用关系型数据库和并行数据库可以处理传统数据
C.获取大数据的数据来源广泛
D.大数据的数据量相对较小
19.关于大数据,以下哪个描述是正确的?( )
A.大数据只包括结构化数据
B.大数据只关乎数据的体量
C.大数据处理没有安全隐私问题
D.大数据可以来自各种来源,包括业务交易、社交媒体等
20.在以二维表形式表示的数据集中,行表示( )
A.特征
B.样本
C.属性
D.字段
21.下列各项属于结构化数据的是( )
A.图像
B.二维数据表
C.声音
D.文本
22.下列各项不属于大数据在银行业的应用的是( )
A.客户分析
B.风险管理
C.运营优化
D.疾病预防与治疗
23.下列哪个应用场景不属于大数据在医疗领域的应用( )
A.疾病诊断
B.患者管理
C.电子病历分析
D.动物饲养管理
24.下列哪项不是大数据在电商领域的主要应用( )
A.用户行为分析
B.商品推荐
C.存货管理
D.航天探索
25.下列哪项并非大数据在电商领域的应用?( )
A.客户画像
B.仓储管理
C.精准营销
D.生态保护