[单选题]在关于数据挖掘的描述中,正确的是()
正确答案 :A
数据挖掘可以支持人们进行决策
解析:本题考查数据挖掘的基本概念,数据挖掘用于支持决策分析,同时数据挖掘是应用于数据仓库之上的处理加工,对数据有一定的要求,如果数据源质量不好,必然影响到挖掘的结果。
[单选题]关于数据库中关系性质的描述,错误的是()
正确答案 :B
表中任意两列的值不能相同
解析:关系可以有3种类型:基本关系(通常又称为基本表或基表)、查询表和视图表。基本表是实际存在的表,它是实际存储数据的逻辑表示。查询表是查询结果对应的表。视图表是由基本表或其他视图表导出的表,是虚表,不对应实际存储的数据。基本关系具有以下6条性质:列是同质的,即每一列中的分量是同一类型的数据,来自同一个域。不同的列可出自同一个域,称其中的每一列为一个属性,不同的属性要给予不同的属性名。列的顺序无所谓,即列的次序可以任意交换。任意两个元组不能完全相同。但在大多数实际关系数据库产品中,如Oracle等,如果用户没有定义有关的束条件,它们都允许关系表中存在两个完全相同的元组。行的顺序无所谓,即行的次序可以任意交换。分量必须取原子值,即每一个分量都必须是不可分的数据项。
[单选题]在数据库系统中,“事务”是访问数据库并可能更新各种数据项的一个程序执行单元。为了保证数据完整性,要求数据库系统维护事务的原子性、一致性、隔离性和持久性。针对事务的这4种特性,考虑以下的架构设计场景。假设在某一个时刻只有一个活动的事务,为了保证事务的原子性,对于要执行写操作的数据项,数据库系统在磁盘上维护数据库的一个副本,所有的写操作都在数据库副本上执行,而保持原始数据库不变,如果在任一时刻操作不得不中止,系统仅需要删除副本,原数据库没有受到任何影响。这种设计策略称为(1)。事务的一致性要求在没有其他事务并发执行的情况下,事务的执行应该保证数据库的一致性。数据库系统通常采用(2)机制保证单个事务的一致性。事务的隔离性保证操作并发执行后的系统状态与这些操作以某种次序顺序执行(即可串行化执行)后的状态是等价的。两阶段锁协议是实现隔离性的常见方案,该协议(3)。持久性保证一旦事务完成,该事务对数据库所做的所有更新都是永久的,如果事务完成后系统出现故障,则需要通过恢复机制保证事务的持久性。假设在日志中记录所有对数据库的修改操作,将一个事务的所有写操作延迟到事务提交后才执行,则在日志中(4)。当系统发生故障时,如果某个事务已经开始,但没有提交,则该事务应该(5)。
正确答案 :
解析:本题主要考查数据库系统架构设计知识。在数据库系统中,“事务”是访问并可能更新各种数据项的一个程序执行单元。为了保证数据完整性,要求数据库系统维护事务的原子性、一致性、隔离性和持久性。题干中第1个架构设计场景描述了数据库设计中为了实现原子性和持久性的最为简单的策略:“影子拷贝”。该策略假设在某一个时刻只有一个活动的事务,首先对数据库做副本(称为影子副本),并在磁盘上维护一个dp_pointer指针,指向数据库的当前副本。对于要执行写操作的数据项,数据库系统在磁盘上维护数据库的一个副本,所有的写操作都在数据库副本上执行,而保持原始数据库不变,如果在任一时刻操作不得不中止,系统仅需要删除新副本,原数据库副本没有受到任何影响。题干中的第2个架构设计场景主要考查考生对事务一致性实现机制的理解。事务的一致性要求在没有其他事务并发执行的情况下,事务的执行应该保证数据库的一致性。数据库系统通常采用完整性约束检查机制保证单个事务的一致性。题干中的第3个架构设计场景主要考查数据库的锁协议。两阶段锁协议是实现事务隔离性的常见方案,该协议通过定义锁的增长和收缩两个阶段约束事务的加锁和解锁过程,能够保证事务的串行化执行,但由于事务不能一次得到所有需要的锁,因此该协议可能会导致死锁。题干中的第4个架构设计场景主要考查数据库的恢复机制,主要描述了基于日志的延迟修改技术(Deferred-ModificationTechruque)的设计与恢复过程。该技术通过在日志中记录所有对数据库的修改操作,将一个事务的所有写操作延迟到事务提交后才执行,日志中需要记录“事务开始”和“事务提交”时间,还需要记录数据项被事务修改后的新值,无须记录数据项被事务修改前的原始值。当系统发生故障时,如果某个事务已经开始,但没有提交,则该事务对数据项的修改尚未体现在数据库中,因此无须做任何恢复动作。
[单选题]设有员工实体Employee(employeeID,name,sex,age,tel,departID),其中employeeID为员工号,name为员工姓名,sex为员工性别,age为员工年龄,tel为员工电话,记录该员工的手机号码、办公室电话等,departID为员工所在部门号,参照另一部门实体Department的主码departID。Employee实体中存在派生属性(1)。Employee实体中还存在多值属性(2)。对属性departID的约束是(3)。
正确答案 :
解析:所谓派生属性,是表示其值可以从一个相关属性和属性集的值派生得到的属性,这个属性在实体中不是必需的。根据这个定义,age是一个派生属性,因为用属性birth(出生时间)替换age并可计算age。多值属性是指可同时由多个值表示的属性。例如,包含关于雇员信息的数据库可能包含关于他们个人兴趣的数据。一个雇员可能有几个兴趣:运动、电影、投资、烹调,并且由于这些值的任何一个或所有这些值可能同时是雇员的兴趣,所以这些数据应作为数据类型列表合成到资源。对于多值属性的处理,一般是提升为单独的一个或多个实体。因为departID为员工所在部门号,参照另一部门实体Department的主码departID,因此,在实体Employee中,departID为外键。
[单选题]建立一个供应商、零件数据库。其中"供应商"表S(Sno,Sname,Zip,City)中的属性分别表示供应商代码、供应商名、供应商邮编、供应商所在城市,其函数依赖为Sno→(Sname,Zip,City),Zip→City。"零件"表P(Pno,Pname,Color,Weight,City),表示零件号、零件名、颜色、重量及产地。表S与表P之间的关系SP(Sno,Pno,Price,Qty)表示供应商代码、零件号、价格、数量。若要求:供应商代码不能为空,且值是唯一的,供应商的名也是唯一的;零件号不能为空,且值是唯一的;一个供应商可以供应多种零件,而一种零件可以由多个供应商供应。请将下面的SQL语句空缺部分补充完整。CREATETABLES(SnoCHAR(5)(1),SnameCHAR(30)UNIQUE,ZipCHAR(8),CityCHAR(20)(2));
正确答案 :
解析:在给定的SQL语句中,因为Sno是主键,所以第(1)空应该填"PRIMARYKEY",但给出的选项中没有这个词组。试题描述告诉我们,"供应商代码不能为空,且值是唯一的",所以应该选择B,而在第(2)空处填写"PRIMARYKEY(Sno)"。
[单选题]建立一个供应商、零件数据库。其中"供应商"表S(Sno,Sname,Zip,City)中的属性分别表示供应商代码、供应商名、供应商邮编、供应商所在城市,其函数依赖为Sno→(Sname,Zip,City),Zip→City。"零件"表P(Pno,Pname,Color,Weight,City),表示零件号、零件名、颜色、重量及产地。表S与表P之间的关系SP(Sno,Pno,Price,Qty)表示供应商代码、零件号、价格、数量。若要求:供应商代码不能为空,且值是唯一的,供应商的名也是唯一的;零件号不能为空,且值是唯一的;一个供应商可以供应多种零件,而一种零件可以由多个供应商供应。请将下面的SQL语句空缺部分补充完整。CREATETABLES(SnoCHAR(5)(1),SnameCHAR(30)UNIQUE,ZipCHAR(8),CityCHAR(20)(2));
正确答案 :
解析:在给定的SQL语句中,因为Sno是主键,所以第(1)空应该填"PRIMARYKEY",但给出的选项中没有这个词组。试题描述告诉我们,"供应商代码不能为空,且值是唯一的",所以应该选择B,而在第(2)空处填写"PRIMARYKEY(Sno)"。
[单选题]某高校管理信息系统的数据库设计过程中,(1)阶段是在需求分析的基础上,对用户信息加以分类、聚集和概括,建立信息模型,并依照选定的数据库管理系统软件,转换成为数据的(2),再依照软硬件环境,最终实现数据的合理存储。
正确答案 :
解析:通常将数据库设计分为需求分析、概念结构设计、逻辑结构设计和数据库物理设计4个阶段。需求分析是指收集和分析用户对系统的信息需求和处理需求,得到设计系统所必需的需求信息,建立系统说明文档。其目标是通过调查研究,了解用户的数据要求和处理要求,并按一定格式整理形成需求说明书。概念结构设计阶段的目标是对需求说明书提供的所有数据和处理要求进行抽象与综合处理,按一定的方法构造反映用户环境的数据及其相互联系的概念模型,即用户的数据模型或企业数据模型。这种概念数据模型与DBMS无关,是面向现实世界的、极易为用户所理解的数据模型。为保证所设计的概念数据模型能正确、完全地反映用户的数据及其相互关系,便于进行所要求的各种处理,在本阶段设计中可吸收用户参与和评议设计。在进行概念结构设计时,可先设计各个应用的视图,即各个应用所看到的数据及其结构,然后再进行视图集成,以形成一个单一的概念数据模型。这样形成的初步数据模型还要经过数据库设计者和用户的审查与修改,最后形成所需的概念数据模型。逻辑结构设计阶段的设计目标是把上一阶段得到的与DBMS无关的概念数据模型转换成等价的,并为某个特定的DBMS所接受的逻辑模型所表示的概念模式,同时将概念设计阶段得到的应用视图转换成外部模式,即特定DBMS下的应用视图。在转换过程中要进一步落实需求说明,并满足DBMS的各种限制。该阶段的结果是用DBMS所提供的数据定义语言(DDL)写成的数据模式。逻辑设计的具体方法与DBMS的逻辑数据模型有关。逻辑模型应满足数据库存取、一致性及运行等各方面的用户需求。物理设计阶段的任务是把逻辑设计阶段得到的满足用户需求的已确定的逻辑模型在物理上加以实现,其主要的内容是根据DBMS提供的各种手段,设计数据的存储形式和存取路径,如文件结构、索引的设计等,即设计数据库的内模式或存储模式。数据库的内模式对数据库的性能影响很大,应根据处理需求及DBMS、操作系统和硬件的性能进行精心设计。
[单选题](1)可用于描述数据流图中数据存储及其之间的关系,最初用于数据库概念设计。在某学生选课系统中使用该工具来描述,学生的学号属于(2)。
正确答案 :
解析:实体联系图可用于描述数据流图中数据存储及其之间的关系,最初用于数据库概念设计。在实体联系图中,有实体、联系和属性3个基本部分。在某学生的选课系统中,学生属于实体,而学生的学号则属于该实体的属性。
[单选题]某公司的部门(部门号,部门名,负责人,电话)、商品(商品号,商品名称,单价,库存量)和职工(职工号,姓名,住址)3个实体之间的关系如表2-18、表2-19和表2-20所示。假设每个部门有一位负责人和一部电话,但有若干名员工;每种商品只能由一个部门负责销售。部门关系不属于第三范式的原因是(1)。如果用户要求得到表2-21所示的结果,需要(2),并增加关系模式(3)。
正确答案 :
解析:在部门(部门号,部门名,负责人,电话)关系模式中,部门号是主码,所以不存在对码的部分依赖问题。根据试题假设,每个部门有一位负责人和一部电话,也就是说,存在"责人一电话"样的函数依赖,即存在对主码的传递函数依赖。在表2-21中,有职工号、姓名、部门、月销售额4个属性,其中职工号和姓名可以由表2-20得出,但是,由表2-19至表2-20无法得出职工所在的部门,因此,应该在表2-20中增加"部门号"属性。同时,要计算出职工的月销售总额,还需要一个表来记录职工销售的数据。该表需要包括的属性有职工号、商品号、日期、数量。
[单选题]某数据库中有员工关系E(员工号,姓名,部门,职称,月薪);产品关系P(产品号,产品名称,型号,尺寸,颜色);仓库关系W(仓库号,仓库名称,地址,负责人);库存关系I(仓库号,产品号,产品数量)。a.若数据库设计中要求:①仓库关系W中的"负责人"引用员工关系的员工号。②库存关系I中的"仓库号,产品号"唯一标识I中的每一个记录。③员工关系E中的职称为"工程师"的月薪不能低于3500元。则①②③依次要满足的完整性约束是(1)。b.若需得到每种产品的名称和该产品的总库存量,则对应的查询语句为:SELELCT产品名称,SUM(产品数量)FROMP,IWHEREP.产品号=I.产品号(2)
正确答案 :
解析:本题考查关系的完整性约束和SQL的基本知识及应用。第(1)空考查数据库完整性约束。首先需要了解实体完整性、参照完整性和用户定义完整性的概念。实体完整性:实体完整性要求主键中的任一属性不能为空,所谓空值是"不知道"或"无意义"的值。之所以要保证实体完整性,主要是因为在关系中,每个元组的区分是依据主键值的不同,若主键值取空值,则不能标明该元组的存在。例如,对于学生关系S(Sno,Sname,Ssex),其主键为Sno,在插入某个元组时,就必须要求Sno不能为空。更加严格的DBMS,则还要求Sno不能与已经存在的某个元组的Sno相同。参照完整性:若基本关系R中含有与另一基本关系S的主键PK相对应的属性组FK(FK称为R的外键),则参照完整性要求,对R中的每个元组在FK上的值必须是S中某个元组的PK值,或者为空值。参照完整性的合理性在于,R中的外键只能对S中的主键引用,不能是S中主键没有的值。例如,对于学生关系S(Sno,Sname,Ssex)和选课关系C(Sno,Cno,Grade)两个关系,C中的Sno是外键,它是S的主键,若C中出现了某个S中没有的Sno,即某个学生还没有注册,却已有了选课记录,这显然是不合理的。用户定义的完整性:实体完整性和参照完整性适用于任何关系型DBMS。除此之外,不同的数据库系统根据其应用环境的不同,往往还需要一些特殊的约束条件。用户定义的完整性就是针对某一具体数据库的约束条件,反映某一具体应用所涉及的数据必须满足的语义要求。从以上概念说明可以看出"仓库关系W中的"负责人"引用员工关系的员工号"属于参照完整性,"库存关系I中的"仓库号,产品号"唯一标识I中的每一个记录"属于实体完整性,"员工关系E中的职称为"工程师"的月薪不能低于3500元"属于用户自定义完整性。第(2)空要求"得到每种产品的名称和该产品的总库存量",要达到该效果需要对数据表的数据进行分组统计。由于现在是要根据产品名称来统计库存量,所以分组的依据应是产品名称,所以应使用"GROUPBY产品名称"。
查看原题 查看所有试题