配色: 字号:
数据库原理-复习资料
2015-06-30 | 阅:  转:  |  分享 
  
数据库概论(1)DB:即数据库(Database),是统一管理的相关数据的集合。DB能为各种用户共享,具有最小冗余度,数据间联系密切,而又有较高的数据独立性。(2)DBMS:即数据库管理系统(DatabaseManagementSystem),是位于用户与操作系统之间的一层数据管理软件,为用户或应用程序提供访问DB的方法,包括DB的建立、查询、更新及各种数据控制。DBMS总是基于某种数据模型,可以分为层次型、网状型、关系型、面向对象型DBMS。(3)DBS:即数据库系统(DatabaseSystem),是实现有组织地、动态地存储大量关联数据,方便多用户访问的计算机软件、硬件和数据资源组成的系统,即采用了数据库技术的计算机系统。(4)1:1联系:如果实体集E1中的每个实体最多只能和实体集E2中的一个实体有联系,反之亦然,那么实体集E1对E2的联系称为“一对一联系”,记为“1:1”。(5)1:N联系:如果实体集E1中每个实体与实体集E2中任意个(零个或多个)实体有联系,而E2中每个实体至多和E1中的一个实体有联系,那么E1对E2的联系是“一对多联系”,记为“1:N”。(6)M:N联系:如果实体集E1中每个实体与实体集E2中任意个(零个或多个)实体有联系,反之亦然,那么E1对E2的联系是“多对多联系”,记为“M:N”。(7)数据模型:模型是对现实世界的抽象。在数据库技术中,表示实体类型及实体类型间联系的模型称为“数据模型”。它可分为两种类型:概念数据模型和结构数据模型。(6)概念数据模型:是独门于计算机系统的模型,完全不涉及信息在系统中的表示,只是用来描述某个特定组织所关心的信息结构。(9)结构数据模型:是直接面向数据库的逻辑结构,是现实世界的第二层抽象。这类模型涉及到计算机系统和数据库管理系统,所以称为“结构数据模型”。结构数据模型应包含:数据结构、数据操作、数据完整性约束三部分。它主要有:层次、网状、关系三种模型。(10)层次模型:用树型结构表示实体类型及实体间联系的数据模型。(11)网状模型:用有向图结构表示实体类型及实体间联系的数据模型。(12)关系模型:是目前最流行的数据库模型。其主要特征是用二维表格结构表达实体集,用外鍵表示实体间联系。关系模型是由若干个关系模式组成的集合。(13)概念模式:是数据库中全部数据的整体逻辑结构的描述。它由若干个概念记录类型组成。概念模式不仅要描述概念记录类型,还要描述记录间的联系、操作、数据的完整性、安全性等要求。(14)外模式:是用户与数据库系统的接口,是用户用到的那部分数据的描述。(15)内模式:是数据库在物理存储方面的描述,定义所有的内部记录类型、索引和文件的组成方式,以及数据控制方面的细节。(16)模式/内模式映象:这个映象存在于概念级和内部级之间,用于定义概念模式和内模式间的对应性,即概念记录和内部记录间的对应性。此映象一般在内模式中描述。(17)外模式/模式映象:这人映象存在于外部级和概念级之间,用于定义外模式和概念模式间的对应性,即外部记录和内部记录间的对应性。此映象都是在外模式中描述。(18)数据独立性:在数据库技术中,数据独立性是指应用程序和数据之间相互独立,不受影响。数据独立性分成物理数据独立性和逻辑数据独立性两级。(19)物理数据独立性:如果数据库的内模式要进行修改,即数据库的存储设备和存储方法有所变化,那么模式/内模式映象也要进行相应的修改,使概念模式尽可能保持不变。也就是对模式的修改尽量不影响概念模式。(20)逻辑数据独立性:如果数据库的概念模式要进行修改(如增加记录类型或增加数据项),那么外模式/模式映象也要进行相应的修改,使外模式尽可能保持不变。也就是对概念模式的修改尽量不影响外模式和应用程序。(21)宿主语言:在数据库技术中,编写应用程序的语言仍然是一些高级程序设计语言,这些语言称为宿主语言(hostlanguage),简称主语言。(22)DDL:数据定义语言(DataDefinitionLanguage),用于定义数据库的三级结构,包括外模式、概念模式、内模式及其相互之间的映象,定义数据的完整性、安全控制等约束。(23)DML:数据操纵语言(DataManipulationLanguage),由DBMS提供,用于让用户或程序员使用,实现对数据库中数据的操作。DML分成交互型DML和嵌入型DML两类。依据语言的级别,DML又可分成过程性DML和非过程性DML两种。(24)交互型DML:如果DML自成系统,可在终端上直接对数据库进行操作,这种DML称为交互型DML。(25)嵌入型DML:如果DML嵌入在主语言中使用,此时主语言是经过扩充能处理DML语句的语言,这种DML称为嵌入型DML。(26)过程性DML:用户编程时,不仅需要指出“做什么”(需要什么样的数据),还需要指出“怎么做”(怎么获得数据)。层状、网状的DML属于过程性语言。(27)非过程性DML:用户编程时,只需要指出“做什么”,不需要指出“怎么做”。Notice:以上关于DML的各个概念单独出现时,首先要解释DML的含义。(28)DD:数据字典(DataDictionary),数据库系统中存放三级结构定义的数据库称为数据字典。对数据库的操作都要通过访问DD才能实现。(29)DD系统:管理DD的实用程序称为“DD系统”。1.2文件系统阶段的数据管理有些什么缺陷?试举例说明。文件系统有三个缺陷:(1)数据冗余性(redundancy)。由于文件之间缺乏联系,造成每个应用程序都有对应的文件,有可能同样的数据在多个文件中重复存储。(2)数据不一致性(inconsistency)。这往往是由数据冗余造成的,在进行更新操作时,稍不谨慎,就可能使同样的数据在不同的文件中不一样。(3)数据联系弱(poordatarelationship)。这是由文件之间相互独立,缺乏联系造成的。1.3数据库阶段的数据管理有些什么特点??(1)采用复杂的数据模型表示数据结构?(2)有较高的数据独立性(数据结构分成用户的逻辑结构、整体逻辑结构和物理结构三级)?(3)数据库系统为用户提供方便的用户接口,可以使用查询语言、终端命令或程序方式操作数据,也可以用程序方式操作数据库。?(4)系统提供了四个方面的数据控制功能:数据库的恢复、并发控制、数据完整性和数据安全性,以保证数据库中数据是安全的、正确的和可靠的。?(5)对数据的操作不一定以记录为单位,还可以数据项为单位,增加了系统的灵活性。1.4你怎样理解实体、属性、记录、字段这些概念的类型和值的差别?试举例说明。???实体(entity):是指客观存在可以相互区别的事物。实体可以是具体的对象,如:一个学生,一辆汽车等;也可以是抽象的事件,如:一次借书、一场足球赛等。???属性(attribute):实体有很多特性,每一个特性称为属性。每个属性有一个值域,其类型可以是整数型、实数型、字符串型。比如,学生(实体)有学号、姓名、年龄、性别等属性,相应值域为字符、字符串、整数和字符串型。???字段(field):标记实体属性的命名单位称为字段或数据项。它是可以命名的最小信息单位,所以又称为数据元素或初等项。字段的命名往往和属性名相同,比如,学生有学号、姓名、年龄、性别等字段。???记录(record):字段的有序集合称为记录。一般用一个记录描述一个实体,所以记录又可以定义为能完整地描述一个实体的字段集。如:一个学生记录,由有序的字段集(学号、姓名、年龄、性别等)组成。1.5逻辑记录与物理记录,逻辑文件与物理文件有些什么联系和区别?联系:?(1)逻辑记录与物理记录都是记录,是字段的有序集合;?(2)逻辑文件与物理文件都是文件,是同一类记录的汇集。区别:(1)逻辑记录与逻辑文件是逻辑数据描述,物理记录与物理文件是物理数据描述。(2)物理数据描述是指数据在存储设备上的存储方式,物理记录、物理文件(还有物理联系、物理结构等术语),都是用来描述实际存储设备上的数据。(3)逻辑数据描述是指程序员或用户用以操作的数据形式,是抽象的概念化数据。逻辑记录、逻辑文件(还有逻辑联系、逻辑结构等术语),都是用户观点的数据描述。1.6为某百货公司设计一个ER模型。百货管辖若干个连锁商店,每家商店经营若干商品,每家商店有若干职工,但每个职工只能服务于一家商店。实体类型“商店”的属性有:商店编号,店名,店址,店经理。实体类型“商品”的属性有:商品编号,商品名,单价,产地。实体类型“职工”的属性有:职工编号,职工名,性别,工资。在联系中应反映出职工参加某商店工作的开始时间,商店销售商品的月销售量。试画出反映商店、商品、职工实体类型及联系类型的ER图,并将其转换成关系模式集。实体:商店(商店编号,店名,店址,店经理)商品(商品编号,商品名,单价,产地)职工(职工编号,职工名,性别,工资)联系:SC(商店—商品之间1:N的联系,联系属性为“职工参加商店工作的开始时间”。SE(商店—职工之间1:N的联系),联系属性为“月销售量”。ER图:关系模式集:商店模式(商店编号,店名,店址,店经理)商品模式(商品编号,商品名,单价,产地,商店编号,月销售量)职工模式(职工编号,职工名,性别,工资,商店编号,开始时间)1.7试述ER模型、层次模型、网状模型、关系模型和面向对象模型的主要特点。ER模型的主要特点:?(1)优点:接近于人的思维,容易理解;与计算机无关,用户容易接受。?(2)缺点:只能说明实体间语义的联系,不能进一步说明详细的数据结构。层次模型的特点:?(1)优点:记录之间的联系通过指针实现,查询效率较高。?(2)缺点:只能表示1:N联系,实现M:N结构较复杂;由于层次顺序的严格和复杂,引起数据的查询和更新操作也很复杂。网状模型的特点:?(1)优点:记录之间联系通过指针实现,M:N联系也容易实现(每个M:N联系可拆成两个1:N联系),查询效率较高。?(2)缺点:编写应用程序比较复杂,程序员必须熟悉数据库的逻辑结构。关系模型的特点:???用关鍵码而不是用指针导航数据,表格简单,用户易懂,编程时并不涉及存储结构、访问技术等细节。1.8试述概念模式在数据库结构中的重要地位。???概念模式是数据库中全部数据的整体逻辑结构的描述。它由若干个概念记录类型组成。概念模式不仅要描述概念记录类型,还要描述记录间的联系、操作、数据的完整性、安全性等要求。数据按外模式的描述提供给用户,按内模式的描述存储在磁盘中,而概念模式提供了连接这两级的相对稳定的中间观点,并使得两级的任何一级的改变都不受另一级的牵制。1.9数据独立性与数据联系这两个概念有什么区别????数据独立性是指应用程序与数据之间相互独立,不受影响。???数据联系是指同一记录内部各字段间的联系,以及记录之间的联系。1.10试述DBMS在用户访问数据库过程中所起的作用.???用户对数据库进行操作,DBMS把操作从应用程序带到外部级、概念级、再导向内部级,进而操作存储器中的数据。(结合P22“用户访问数据的过程”来理解)1.11试述DBMS的主要功能。DBMS的主要功能有:(1)数据库的定义功能(2)数据库的操纵功能(3)数据库的保护功能(4)数据库的存储管理(5)数据库的维护功能(6)数据字典1.12试叙DBMS对数据库的保护功能。DBMS对数据库的保护主要通过四个方面实现:(1)数据库的恢复。(2)数据库的并发控制。(3)数据库的完整性控制。(4)数据库的安全性控制。1.13试叙DBMS对数据库的维护功能。DBMS中有一些程序提供给数据库管理员运行数据库系统时使用,这些程序起着数据库维护的功能。主要有四个实用程序:(1)数据装载程序(loading)(2)备份程序(backup)(3)文件重组织程序(4)性能监控程序1.14从模块结构看,DBMS由哪些部分组成?从模块结构看,DBMS由两大部分组成:查询处理器和存储管理器(1)查询处理器有四个主要成分:DDL编译器,DML编译器,嵌入型DML的预编译器,查询运行核心程序(2)存储管理器有四个主要成分:授权和完整性管理器,事务管理器,文件管理器,缓冲区管理器(以上几题具体可参照书上p20-21)1.15DBS由哪几个部分组成?DBS由四部分组成:数据库、硬件、软件、数据库管理员。1.16什么样的人是DBA?DBA应具有什么素质?DBA的职责是什么????DBA是控制数据整体结构的人,负责DBS的正常运行。DBA可以是一个人,在大型系统中也可以是由几个人组成的小组。DBA承担创建、监控和维护整个数据库结构的责任。DBA应具有下列素质:(1)熟悉企业全部数据的性质和用途;(2)对用户的需求有充分的了解;(3)对系统的性能非常熟悉。DBA的主要职责有五点:(1)概念模式定义(2)内模式定义(3)根据要求修改数据库的概念模式和内模式(4)对数据库访问的授权(5)完整性约束的说明1.1使用DBS的用户有哪几类?使用DBS的用户有四类:1)DBA2)专业用户3)应用程序员4)最终用户1.1DBMS的查询处理器有哪些功能?DBMS的查询处理器可分成四个成分:1)DML编译器2)嵌入型DML的预编译器3)DDL编译器4)查询运行核心程序1.DBMS的存储处理器有哪些功能?DBMS的存储处理器提供了应用程序访问数据库中数据的界面,可分成四个成分:1)授权和完整性管理器2)事务管理器3)文件管理器4)缓冲区管理器1.2磁盘存储器中有哪四类主要的数据结构?数据文件:存储了数据库中的数据;

数据字典(DD):存储三级结构的描述;

索引文件:为提高查询速度而设置的逻辑排序手段;

统计数据组织:存储DBS运行时统计分析数据。关系模型(1)关系模型:用二维表格结构表示实体集,外键表示实体间联系的数据模型称为关系模型。(2)关系模式:关系模式实际上就是记录类型。它的定义包括:模式名,属性名,值域名以及模式的主键。关系模式不涉及到物理存储方面的描述,仅仅是对数据特性的描述。(3)关系实例:元组的集合称为关系和实例,一个关系即一张二维表格。(4)属性:实体的一个特征。在关系模型中,字段称为属性。(5)域:在关系中,每一个属性都有一个取值范围,称为属性的值域,简称域。(6)元组:在关系中,记录称为元组。元组对应表中的一行;表示一个实体。(7)超键:在关系中能唯一标识元组的属性集称为关系模式的超键。(8)候选键:不含有多余属性的超键称为候选键。(9)主键:用户选作元组标识的一个候选键为主键。(单独出现,要先解释“候选键”)(10)外键:某个关系的主键相应的属性在另一关系中出现,此时该主键在就是另一关系的外键,如有两个关系S和SC,其中S#是关系S的主键,相应的属性S#在关系SC中也出现,此时S#就是关系SC的外键。(11)实体完整性规则:这条规则要求关系中元组在组成主键的属性上不能有空值。如果出现空值,那么主键值就起不了唯一标识元组的作用。(12)参照完整性规则:这条规则要求“不引用不存在的实体”。其形式定义如下:如果属性集K是关系模式R1的主键,K也是关系模式R2的外键,那么R2的关系中,K的取值只允许有两种可能,或者为空值,或者等于R1关系中某个主键值。这条规则在使用时有三点应注意:1)外键和相应的主键可以不同名,只要定义在相同值域上即可。2)R1和R2也可以是同一个关系模式,表示了属性之间的联系。3)外键值是否允许空应视具体问题而定。(13)过程性语言:在编程时必须给出获得结果的操作步骤,即“干什么”和“怎么干”。如Pascal和C语言等。(14)非过程性语言:编程时只须指出需要什么信息,不必给出具体的操作步骤。各种关系查询语言均属于非过程性语言。(15)无限关系:当一个关系中存在无穷多个元组时,此关系为无限关系。如元组表达式{t|┐R(t)}表示所有不在关系R中的元组的集合,这是一个无限关系。(16)无穷验证:在验证公式时需对无穷多个元组进行验证就是无穷验证。如验证公式(u)(P(u))的真假时需对所有的元组u进行验证,这是一个无穷验证的问题。2.2为什么关系中的元组没有先后顺序????因为关系是一个元组的集合,而元组在集合中的顺序无关紧要。因此不考虑元组间的顺序,即没有行序。2.3为什么关系中不允许有重复元组????因为关系是一个元组的集合,而集合中的元素不允许重复出现,因此在关系模型中对关系作了限制,关系中的元组不能重复,可以用键来标识唯一的元组。2.4关系与普通的表格、文件有什么区别?关系是一种规范化了的二维表格,在关系模型中,对关系作了下列规范性限制:1)关系中每一个属性值都是不可分解的。2)关系中不允许出现相同的元组(没有重复元组)。3)由于关系是一个集合,因此不考虑元组间的顺序,即没有行序。4)元组中,属性在理论上也是无序的,但在使用时按习惯考虑列的顺序。2.5笛卡尔积、等值联接、自然联接三者之间有什么区别?笛卡尔积对两个关系R和S进行乘操作,产生的关系中元组个数为两个关系中元组个数之积。等值联接则是在笛卡尔积的结果上再进行选择操作,从关系R和S的笛卡儿积中选择对应属性值相等的元组;自然连接则是在等值联接(以所有公共属性值相等为条件)的基础上再行投影操作,并去掉重复的公共属性列。当两个关系没有公共属性时,自然连接就转化我笛卡尔积。2.6设有关系R和S(如下:)

计算:2.7设有关系R和S(如下:)计算:2.8如果R是二元关系,那么下列元组表达式的结果是什么?{t|(u)(R(t)∧R(u)∧(t[1]≠u[1]∨t[2]≠u[2]))}???这个表达式的意思是:从关系R中选择元组,该元组满足:第1分量值或第2分量值至少有一个不等于其他某元组。由于R是二元关系,只有两个分量,由于没有重复元组,上述条件显然满足。所以,这个表达式结果就是关系R。2.9假设R和S分别是三元和二元关系,试把表达式π1,5(σ2=43=4(R×S))转换成等价的:(1)汉语查询句子;(2)元组表达式;(3)域表达式。(1)汉语表达式:从R×S关系中选择满足下列条件的元组:第2分量(R中第2分量)与第4分量(S中第1分量)值相等,或第3分量(R中第3分量)与第4分量(S中第1分量)值相等;并取第1列与第5列组成的新关系。(2)元组表达式:{t|(u)(v)(R(u)∧S(v)∧(u[2]=v[1]∨u[3]=v[1])∧t[1]=u[1]∧t[2]=v[2])}(3)域表达式:{xv|(y)(z)(u)(R(xyz)∧S(uv)∧(y=u∨z=u))}2.10假设R和S都是二元关系,试把元组表达式{t|R(t)(u)(S(u)∧u[1]≠t[2])}转换成等价的:(1)汉语查询句子;(2)域表达式:(3)关系代数表达式。(1)汉语表达式:选择R关系中元组第2分量值不等于S关系中某元组第1分量值的元组。(2)域表达式:{xy|(u)(v)(R(xy)∧S(uv)∧(u≠y))}(3)关系代数表达式:π1,2(σ2≠3(R×S))2.11试把域表达式{ab|R(ab)R(ba)}转换成等价的:(1)汉语查询句子;(2)关系代数表达式;(1)汉语查询句子:选择R中元组第1分量值与第2分量值互换后仍存在于R中的元组。(2)关系代数表达式:π1,2(σ1=42=3(R×R));2.12设有两个关系R(A,B,C)和S(D,E,F),试把下列关系代数表达式转换成等价的元组表达式:(1)πA(R);(2)σB=''17''(R);(3)R×S;(4)πA,F(σC=D(R×S))(1){t|(u)(R(u)∧t[1]=u[1])}(2){t|R(t)∧t[2]=''17'')}(3){t|(u)(v)(R(u)∧S(v)∧t[1]=u[1]∧t[2]=u[2]∧t[3]=u[3]∧t[4]=v[1]∧t[5]=v[2]∧t[6]=v[3])}(4){t|(u)(v)((R(u)∧S(v)∧u[3]=v[1]∧t[1]=u[1]∧t[2]=v[3])}2.13设有三个关系:S(S#,SNAME,AGE,SEX)SC(S#,C#,GRADE)C(C#,CNAME,TEACHER)试用关系代数表达式表示下列查询语句。(见下一题)2.14试用元组表达式表示上题中各个查询语句。(1)检索LIU老师所授课程的课程号、课程名。πC#,CNAME(σTEACHER=''LIU''(C)){t|(u)(C(u)∧C[3]=''LIU''∧t[1]=u[1]∧t[2]=u[2])}(2)检索年龄大于23岁的男学生的学号与姓名。πS#,SNAME(σAGE>''23''SEX=''男''(S)){t|(u)(S(u)∧u[3]>''23''u[4]=''男''t[1]=u[1]∧t[2]=u[2])}(3)检索学号为S3学生所学课程的课程名与任课教师名。πCNAME,TEACHER(σS#=''S3''(SCC)){t|(u)(v)(SC(u)∧C(v)∧u[1]=''S3''∧v[1]=u[2]∧t[1]=v[2]∧t[2]=v[3])}(4)检索至少选修LIU老师所授课程中一门课程的女学生的姓名。πSNAME(σSEX=''女''TEACHER=''LIU''(SSCC)){t|(u)(v)(w)(S(u)∧SC(v)∧C(w)∧u[4]=''女''v[1]=u[1]∧v[2]=w[1]∧w[3]=''LIU''∧t[1]=u[2])}(5)检索WANG同学不学的课程号。πC#(C)-πC#(σSNAME=''WANG''(SSC))或者,πC#(SC)-πC#(σSNAME=''WANG''(SSC))(全部课程号减去WANG同学所学的课程号){t|(u)(v)(C(u)∧SC(v)∧(u[1]=v[2]=>(w)(s(w)∧w[1]=v[1]∧W[2]≠''wang''))∧t[1]=u[1])}(从C中选择满足条件的元组:SC中的所有元组,如果学号与C中所选元组相同的话,其在S中对应的姓名肯定不是''wang''。)Notice:"p1=>p2"的含义是:如果p1为真,则p2为真。(6)检索至少选修两门课程的学生学号。πS#(σ1=42≠5(SC×SC))SC自乘之后,再选择(同一个学号中两个课程号不同的元组),投影。{t|(u)(v)(SC(u)∧SC(v)∧u[1]=v[1]∧u[2]≠v[2])∧t[1]=u[1]}(7)检索全部学生都选修的课程的课程号与课程名。πC#,CNAME(C(πS#,C#(SC)÷πS#(S)))(涉及到全部值时,应用除法,“除数”是"全部"){t|(u)(v)(w)(S(u)∧SC(v)∧C(w)∧u[1]=v[1]∧v[2]=w[1]∧t[1]=v[1]∧t[2]=V[2])}(8)检索选修课程包含LIU老师所授课程的学生学号。πS#(σTEACHER=''LIU''(SCC)){t|(u)(v)(SC(u)∧C(v)∧u[2]=v[1]∧v[3]=''LIU''∧t[1]=u[1])}如果LIU老师有多门课程,则选修课程包含LIU老师所授全部课程的学生学号为:πS#,C#(SC)÷πC#(σTEACHER=''LIU''(C))2.17为什么要对关系代数表达式进行优化????在关系代数运算中,各个运算所费时间和空间是不一样的。如何安排若干关系的运算操作步骤,直接影响到整个操作所需要的时间和空间。对关系代数表达式进行优化,可以提高系统的操作效率,达到执行过程即省时间又省空间的目的。

关系数据库SQL语言

(1)SQL模式:SQL模式是表和授权的静态定义。一个SQL模式定义为基本表的集合。一个由模式名和模式拥有者的用户名或账号来确定,并包含模式中每一个元素(基本表、视图、索引等)的定义。(2)SQL数据库:SQL(StructuredQueryLanguage),即‘结构式查询语言’,采用英语单词表示和结构式的语法规则。一个SQL数据库是表的汇集,它用一个或多个SQL模式定义。(3)基本表:在SQL中,把传统的关系模型中的关系模式称为基本表(BaseTable)。基本表是实际存储在数据库中的表,对应一个关系。(4)存储文件:在SQL中,把传统的关系模型中的存储模式称为存储文件(StoredFile)。每个存储文件与外部存储器上一个物理文件对应。(5)视图:在SQL中,把传统的关系模型中的子模式称为视图(View),视图是从若干基本表和(或)其他视图构造出来的表。(6)行:在SQL中,把传统的关系模型中的元组称为行(row)。(7)列:在SQL中,把传统的关系模型中的属性称为列(coloumn)。(8)实表:基本表被称为“实表”,它是实际存放在数据库中的表。(9)虚表:视图被称为“虚表”,创建一个视图时,只把视图的定义存储在数据词典中,而不存储视图所对应的数据。(10)相关子查询:在嵌套查询中出现的符合以下特征的子查询:子查询中查询条件依赖于外层查询中的某个值,所以子查询的处理不只一次,要反复求值,以供外层查询使用。(11)联接查询:查询时先对表进行笛卡尔积操作,然后再做等值联接、选择、投影等操作。联接查询的效率比嵌套查询低。(12)交互式SQL:在终端交互方式下使用的SQL语言称为交互式SQL。(13)嵌入式SQL:嵌入在高级语言的程序中使用的SQL语言称为嵌入式SQL。3.2对于教学数据库的三个基本表学生S(S#,SNAME,AGE,SEX)学习SC(S#,C#,GRADE)课程C(C#,CNAME,TEACHER)试用SQL的查询语句表达下列查询:(1)检索LIU老师所授课程的课程号和课程名。SELECTC#,CNAMEFROMCWHERETEACHER=‘LIU’(2)检索年龄大于23岁的男学生的学号和姓名。SELECTS#,SNAMEFROMSWHERE(AGE>23)AND(SEX=‘M’)(3)检索至少选修LIU老师所授课程中一门课程的女学生姓名。SELECTSNAMEFROMSWHERESEX=‘F’ANDS#IN(SELECTS#FROMSCWHEREC#IN(SELECTC#FROMCWHERETEACHER=‘LIU’)

NOTICE:有多种写法,比如联接查询写法:SELECTSNAMEFROMS,SC,CWHERESEX=‘F’ANDSC.S#=S.S#ANDSC.C#=C.C#ANDTEACHER=''LIU''但上一种写法更好一些。

(4)检索WANG同学不学的课程的课程号。SELECTC#FROMCWHEREC#NOTIN(SELECTC#FROMSCWHERES#IN(SELECTS#FROMSWHERESNAME=''WANG''))(5)检索至少选修两门课程的学生学号。SELECTDISTINCTX.SNOFROMSCX,SCYWHEREX.SNO=Y.SNOANDX.CNO<>Y.CNONotice:对表SC进行自连接,X,Y是SC的两个别名。(6)检索全部学生都选修的课程的课程号与课程名。SELECTC#,CNAMEFROMCWHERENOTEXISTS(SELECTFROMSWHERES#NOTIN(SELECTFROMSCWHERE?SC.C#=C.C#))

要从语义上分解:(1)选择课程的课程号与课程名,不存在不选这门课的同学。??其中,“不选这门课的同学”可以表示为:

SELECT

?FROM?S

?WHERE?S#NOTIN

??(SELECT?

??????FROMSC??

??????WHERE?SC.C#=C.C#)

或者 SELECT?FROM?S

?WHERE??NOTEXISTS

??(SELECT?

??????FROMSC??

?????WHERES.S#=C.S#AND?

SC.C#=C.C#)

??????

(7)检索选修课程包含LIU老师所授课的学生学号。SELECTDISTINCTS#FROMSCWHEREC#IN(SELECTC#FROMCWHERETEACHER=''LIU''))3.3设有两个基本表R(A,B,C)和S(D,E,F),试用SQL查询语句表达下列关系代数表达式:(1)πA(R)(2)σB=''17''(R)(3)R×S(4))πA,F(σC=D(R×S))(1)SELECTAFROMR(2)SELECTFROMRWHEREB=''17''(3)SELECTA,B,C,D,E,FFROMR,S(4)SELECTA,FFROMR,SWHERER.C=S.D3.43.4设有两个基本表R(A,B,C)和S(A,B,C)试用SQL查询语句表达下列关系代数表达式:(1)RS(2)R∩S(3)R-S(4)πA,B(R)πB,C(S)(1)SELECTA,B,CFROMRUNIONSELECTA,B,CFROMS(2)SELECTA,B,CFROMRINTERSECTSELECTA,B,CFROMS(3)SELECTA,B,CFROMRWHERENOTEXISTS(SELECTA,B,CFROMSWHERER.A=S.AANDR.B=S.BANDR.C=S.C)(4)SELECTR.A,R.B,S.CFROMR,SWHERER.B=S.B3.5试叙述SQL语言的关系代数特点和元组演算特点。(P61-62)3.6试用SQL查询语句表达下列对教学数据库中三个基本表S、SC、C的查询:(1)统计有学生选修的课程门数。SELECTCOUNT(DISTINCTC#)FROMSC(2)求选修C4课程的学生的平均年龄。SELECTAVG(AGE)FROMSWHERES#IN(SELECTS#FROMSCWHEREC#=''C4'')或者,SELECTAVG(AGE)FROMS,SCWHERES.S#=SC.S#ANDC#=''004''(3)求LIU老师所授课程的每门课程的学生平均成绩。SELECTCNAME,AVG(GRADE)FROMSC,CWHERESC.C#=C.C#ANDTEACHER=''LIU''GROUPBYC#(4)统计每门课程的学生选修人数(超过10人的课程才统计)。要求输出课程号和选修人数,查询结果按人数降序排列,若人数相同,按课程号升序排列。SELECTDISTINCTC#,COUNT(S#)FROMSCGROUPBYC#HAVINGCOUNT(S#)>10ORDERBY2DESC,C#ASC(5)检索学号比WANG同学大,而年龄比他小的学生姓名。SELECTX.SNAMEFROMSASX,SASYWHEREY.SNAME=''WANG''ANDX.S#>Y.S#ANDX.AGE(SELECTAVG(AGE)FROMSASYWHEREY.SEX=''女'')(9)求年龄大于所有女同学年龄的男学生姓名和年龄。SELECTSNAME,AGEFROMSASXWHEREX.SEX=''男''ANDX.AGE>ALL(SELECTAGEFROMSASYWHEREY.SEX=''女'')3.7试用SQL更新语句表达对教学数据库中三个基本表S、SC、C的各个更新操作:(1)往基本表S中插入一个学生元组(‘9’,‘WU’,18)。INSERTINTOS(S#,SNAME,AGE)VALUES(''59'',''WU'',18)(2)在基本表S中检索每一门课程成绩都大于等于80分的学生学号、姓名和性别,并把检索到的值送往另一个已存在的基本表STUDENT(S#,SANME,SEX)。INSERTINTOSTUDENT(S#,SNAME,SEX)SELECTS#,SNAME,SEXFROMSWHERENOTEXISTS(SELECTFROMSCWHEREGRADE<80ANDS.S#=SC.S#)(3)在基本表SC中删除尚无成绩的选课元组。DELETEFROMSCWHEREGRADEISNULL(4)把WANG同学的学习选课和成绩全部删去。DELETEFROMSCWHERES#IN(SELECTS#FROMSWHERESNAME=''WANG'')(5)把选修MATHS课不及格的成绩全改为空值。UPDATESCSETGRADE=NULLWHEREGRADE<60ANDC#IN(SELECTC#FROMCWHERECNAME=''MATHS'')(6)把低于总平均成绩的女同学成绩提高5%。UPDATESCSETGRADE=GRADE1.05WHEREGRADE<(SELECTAVG(GRADE)FROMSC)ANDS#IN(SELECTS#FROMSWHERESEX=''F'')(7)在基本表SC中修改C4课程的成绩,若成绩小于等于75分时提高5%,若成绩大于75分时提高4%(用两个UPDATE语句实现)。UPDATESCSETGRADE=GRADE1.05WHEREC#=''C4''ANDGRADE<=75UPDATESCSETGRADE=GRADE1.04WHEREC#=''C4''ANDGRADE>753.8“仓库管理”关系模型有五个关系模式:零件PART(P#,PNAME,COLOR,WEIGHT)项目PROJECT(J#,JNAME,DATE)供应商SUPPLIER(S#,SNAME,SADDR)供应P_P(J#,P#,TOTOAL)采购P_S(P#,S#,QUANTITY)(1)试用SQLDDL语句定义上述五个基本表,并说明主键和外键。CREATETABLEPART(P#CHAR(4)NOTNULL,PNAMECHAR(12)NOTNULL,COLORCHAR(10),WEIGHTREAL,PRIMARYKEY(P#))CREATETABLEPROJECT(J#CHAR(4)NOTNULL,JNAMECHAR(12)NOTNULL,DATEDATE,PRIMARYKEY(J#))CREATETABLESUPLIER(S#CHAR(4)NOTNULL,SNAMECHAR(12),SADDRVARCHAR(20),PRIMARYKEY(S#))CREATETABLEP_P(J#CHAR(4),P#CHAR(4),TOTALINTEGER,PRIMARYKEY(J#,P#),FOREIGNKEY(J#)REFERENCEPROJECT(J#),FOREIGNKEY(P#)REFERENCEPART(P#))CREATETABLEP_S(P#CHAR(4),S#CHAR(4),QUANTITYINTEGER,PRIMARYKEY(P#,S#),FOREIGNKEY(P#)REFERENCEPART(P#),FOREIGNKEY(S#)REFERENCESUPLIER(S#))(2)试将PROGECT、P_P、PART三个基本表的自然联接定义为一个视图VIEW1,PART、P_S、SUPPLIER三个基本表的自然联接定义为一个视图VIEW2。CREATEVIEWVIEW1(J#,JNAME,DATE,P#,PNAME,COLOR,WEIGHT,TOTAL)ASSELECTPROJECT.J#,JNAME,DATE,PART.P#,PNAME,COLOR,WEIGHT,TOTALFROMPROJECT,PART,P_PWHEREPART.P#=P_P.P#ANDP_P.J#=PROJECT.J#CREATEVIEWVIEW2(P#,PNAME,COLOR,WEIGHT,S#,SNAME,SADDR,QUANTITY)ASSELECTPART.P#,PNAME,COLOR,WEIGHT,SUPPLIER.S#,SNAME,SADDR,QUANTITYFROMPART,P_S,SUPPLIERWHEREPART.P#=P_S.P#ANDP_S.S#=SUPPLIER.S#(3)试在上述两个视图的基础上进行数据查询:1)检索上海的供应商所供应的零件的编号和名字。SELECTP#,PNAMEFROMVIEW2WHERESADDR=''SHANGHAI''2)检索项目J4所用零件的供应商编号和名字。SELECTS#,SNAMEFROMVIEW2WHEREP#IN(SELECTP#FROMVIEW1WHEREJ#=''J4'')3.9对于教学数据库中基本表SC,已建立下列视图:CREATEVIEWS_GRADE(S#,C_NUM,AVG_GRADE)ASSELECTS#,COUNT(C#),AVG(GRADE)FROMSCGROUPBYS#试判断下列查询和更新是否允许执行。若允许,写出转换到基本表SC上的相应操作。(1)SELECTFROMS_GRADE允许SELECTS#,COUNT(C#),AVG(GRADE)FROMSCGROUPBYS#(2)SELECTS#,C_NUMFROMS_GRADEWHEREAVG_GRADE>80允许SELECTS#,COUNT(C#)FROMSCWHEREAVG(GRADE)>80(3)SELECTS#,AVG_GRADEFROMS_GRADEWHEREC_NUM>(SELECTC_NUMFROMS_GRADEWHERES#=‘S4’)允许SELECTS#,AVG(GRADE)FROMSCASXWHERECOUNT(X.C#)>(SELECTCOUNT(Y.C#)FROMSCASYWHEREY.S#=''S4'')GROUPBYS#(4)UPDATES_GRADESETC_NUM=C_NUM+1WHERES#=‘S4’不允许(5)DELETEFROMS_GRADEWHEREC_NUM>4不允许3.10预处理方式对于嵌入式SQL的实现有什么重要意义????预处理方式是先用预处理程序对源程序进行扫描,识别出SQL语句,并处理成宿主语言的函数调用形式;然后再用宿主语言的编译程序把源程序编译成目标程序。这样,不用扩充宿主语言的编译程序,就能处理SQL语句。3.11在宿主语言的程序中使用SQL语句有哪些规定?在宿主语言的程序中使用SLQ语句有以下规定:(1)在程序中要区分SQL语句与宿主语言语句(2)允许嵌入的SQL语句引用宿主语言的程序变量(称为共享变量),但有两条规定:1)引用时,这些变量前必须加“:”作为前缀标识,以示与数据库中变量有区别。2)这些变量由宿主语言的程序定义,并用SQL的DECLARE语句说明。(3)SQL的集合处理方式与宿主语言单记录处理方式之间要协调。需要采用游标机制,把集合操作转换成单记录处理方式。3.12SQL的集合处理方式与宿主语言单记录处理方式之间如何协调????由于SQL语句处理的是记录集合,而宿主语言语句一次只能处理一个记录,因此需要用游标(cousor)机制,把集合操作转换成单记录处理方式。2.13嵌入式SQL语句何时不必涉及到游标?何时必须涉及到游标????(1)INSERT、DELETE、UPDATE语句,查询结果肯定是单元组时的SELECT语句,都可直接嵌入在主程序中使用,不必涉及到游标。???(2)当SELECT语句查询结果是多个元组时,此时宿主语言程序无法使用,一定要用游标机制把多个元组一次一个地传送给宿主语言处理。

关系数据(1)函数依赖:FD(functiondependency),设有关系模式R(U),X,Y是U的子集,r是R的任一具体关系,如果对r的任意两个元组t1,t2,由t1[X]=t2[X]导致t1[Y]=t2[Y],则称X函数决定Y,或Y函数依赖于X,记为X→Y。X→Y为模式R的一个函数依赖。(2)函数依赖的逻辑蕴涵:设F是关系模式R的一个函数依赖集,X,Y是R的属性子集,如果从F中的函数依赖能够推出X→Y,则称F逻辑蕴涵X→Y,记为F|=X→Y。(3)部分函数依赖:即局部依赖,对于一个函数依赖W→A,如果存在XW(X包含于W)有X→A成立,那么称W→A是局部依赖,否则称W→A为完全依赖。(4)完全函数依赖:见上。(5)传递依赖:在关系模式中,如果Y→X,X→A,且XY(X不决定Y),AX(A不属于X),那么称Y→A是传递依赖。(6)函数依赖集F的闭包F+:被逻辑蕴涵的函数依赖的全体构成的集合,称为F的闭包(closure),记为F+。(7)1NF:第一范式。如果关系模式R的所有属性的值域中每一个值都是不可再分解的值,则称R是属于第一范式模式。如果某个数据库模式都是第一范式的,则称该数据库存模式属于第一范式的数据库模式。第一范式的模式要求属性值不可再分裂成更小部分,即属性项不能是属性组合和组属性组成。(8)2NF:第二范式。如果关系模式R为第一范式,并且R中每一个非主属性完全函数依赖于R的某个候选键,则称是第二范式模式;如果某个数据库模式中每个关系模式都是第二范式的,则称该数据库模式属于第二范式的数据库模式。(注:如果A是关系模式R的候选键的一个属性,则称A是R的主属性,否则称A是R的非主属性。)(9)3NF:第三范式。如果关系模式R是第二范式,且每个非主属性都不传递依赖于R的候选键,则称R是第三范式的模式。如果某个数据库模式中的每个关系模式都是第三范式,则称为3NF的数据库模式。(10)BCNF:BC范式。如果关系模式R是第一范式,且每个属性都不传递依赖于R的候选键,那么称R是BCNF的模式。(11)4NF:第四范式。设R是一个关系模式,D是R上的多值依赖集合。如果D中成立非平凡多值依赖X→→Y时,X必是R的超键,那么称R是第四范式的模式。(12)推理规则的正确性和完备性:正确性是指,如果X→Y是从推理规则推出的,那么X→Y在F+中。完备性是指,不能从F使用推理规则导出的函数依赖不在F+中。(13)依赖集的覆盖和等价:关系模式R(U)上的两个函数依赖集F和G,如果满足F+=G+,则称F和G是等价的。如果F和G等价,则可称F覆盖G或G覆盖F。(14)最小依赖集:如果函数集合F满足以下三个条件:(1)F中每个函数依赖的右部都是单属性;(2)F中的任一函数依赖X→A,其F-{X→A}与F是不等价的;(3)F中的任一函数依赖X→A,Z为X的子集,(F-{X→A}){Z→A}与F不等价。则称F为最小函数依赖集合,记为Fmin。(15)无损联接:设R是一关系模式,分解成关系模式ρ={R1,R2...,Rk},F是R上的一个函数依赖集。如果对R中满足F的每一个关系r都有r=πR1(r)πR2(r)...πRk(r)则称这个分解相对于F是"无损联接分解"。(16)保持依赖集:所谓保持依赖就是指关系模式的函数依赖集在分解后仍在数据库中保持不变,即关系模式R到ρ={R1,R2,...,Rk}的分解,使函数依赖集F被F这些Ri上的投影蕴涵。(17)多值依赖:设R(U)是属性集U上的一个关系模式,X,Y,Z是U的子集,并且Z=U-X-Y,用x,y,z分别代表属性集X,Y,Z的值,只要r是R的关系,r中存在元组(x,y1,z1)和(x,y2,z2)时,就也存在元组(x,y1,z2)和(x,y2,z1),那么称多值依赖(MultiValuedDependencyMVD)X→→Y在关系模式R中成立。4.2关系模式R有n个属性,在模式R上可能成立的函数依赖有多少个?其中平凡的函数依赖有多少个?非平凡的函数依赖有多少个?(要考虑所有可能的情况,数学排列组合问题。对于数据库本身而言,本题没多大意义)

???所有属性相互依赖时,函数依赖最多。

平凡的函数依赖:对于函数依赖X→Y,如果YX,那么称X→Y是一个“平凡的函数依赖”。

4.3建立关于系、学生、班级、社团等信息的一个关系数据库,一个系有若干个专业,每个专业每年只招一个班,每个班有若干个学生,一个系的学生住在同一宿舍区,每个学生可以参加若干个社团,每个社团有若干学生。???描述学生的属性有:学号、姓名、出生年月、系名、班级号、宿舍区。???描述班级的属性有:班级号、专业名、系名、人数、入校年份。???描述系的属性有:系名、系号、系办公地点、人数。???描述社团的属性有:社团名、成立年份、地点、人数、学生参加某社团的年份。请给出关系模式,写出每个关系模式的最小函数依赖集,指出是否存在传递函数依赖,对于函数依赖左部是多属性的情况,讨论函数依赖是完全函数依赖还是部分函数依赖。指出各关系的候选键、外部键,有没有全键存在?各关系模式如下:学生(学号,姓名,出生年月,系名,班级号,宿舍区)班级(班级号,专业名,系名,人数,入校年份)系(系名,系号,系办公地点,人数)社团(社团名,成立年份,地点,人数)

?????加入社团(社团名,学号,学生参加社团的年份)学生(学号,姓名,出生年月,系名,班级号,宿舍区)

●“学生”关系的最小函数依赖集为:Fmin={学号→姓名,学号→班级号,学号→出生年月,学号→系名,系名→宿舍区}●以上关系模式中存在传递函数依赖,如:学号→系名,系名→宿舍区●候选键是学号,外部键是班级号,系名。notice:在关系模式中,如果Y→X,X→A,且XY(X不决定Y),A不属于X,那么称Y→A是传递依赖。

班级(班级号,专业名,系名,人数,入校年份)

●“班级”关系的最小函数依赖集为:Fmin={(系名,专业名)→班级号,班级号→人数,班级号→入校年份,班级号→系名,班级号→专业名}(假设没有相同的系,不同系中专业名可以相同)●以上关系模式中不存在传递函数依赖。●“(系名,专业名)→班级号”是完全函数依赖。●候选键是(系名,专业名),班级号,外部键是系名。系(系名,系号,系办公地点,人数)

●“系”关系的最小函数依赖集为:Fmin={系号→系名,系名→系办公地点,系名→人数,系名→系号}●以上关系模式中不存在传递函数依赖●候选键是系名,系号社团(社团名,成立年份,地点,人数)

●“社团”关系的最小函数依赖集为:Fmin={社团名→成立年份,社团名→地点,社团名→人数)●以上关系模式中不存在传递函数依赖。●候选键是社团名



加入社团(社团名,学号,学生参加社团的年份)

●“加入社团”关系的最小函数依赖集为:Fmin={(社团名,学号)→学生参加社团的年份)●“(社团名,学号)→学生参加社团的年份”是完全函数依赖。

●以上关系模式中不存在传递函数依赖。●候选键是(社团名,学号)。

4.4对函数依赖X→Y的定义加以扩充,X和Y可以为空属性集,用φ表示,那么X→φ,φ→Y,φ→φ的含义是什么?根据函数依赖的定义,以上三个表达式的含义为:(1)一个关系模式R(U)中,X,Y是U的子集,r是R的任一具体关系,如果对r的任意两个元组t1,t2,由t1[X]=t2[X]必有t1[φ]=t2[φ]。即X→φ表示空属性函数依赖于X。这是任何关系中都存在的。(2)φ→Y表示Y函数依赖于空属性。由此可知该关系中所有元组中Y属性的值均相同。(3)φ→φ表示空属性函数依赖于空属性。这也是任何关系中都存在的。4.5已知关系模式R(ABC),F={A→C,B→C},求F+。

??可以直接通过自反律、增广律、传递律加以推广:F+={φ→φ,A→φ,B→φ,C→φ,A→C,B→C,AB→φ,AB→A,AB→B,AB→C,AB→BC,AB→AB,AB→ABC,BC→φ,BC→C,BC→B,BC→BC,AC→φ,AC→C,AC→A,AC→AC,ABC→φ,ABC→A,ABC→B,ABC→C,ABC→BC,ABC→AB,ABC→ABC}

4.6试分析下列分解是否具有无损联接和保持函数依赖的特点:(1)设R(ABC),F1={A→B}在R上成立,ρ1={AB,AC}。首先,检查是否具有无损联接特点:第1种解法--算法4.2:



A

B

C



AB

a1

a2

b13



AC

a1

b22

a3



A

B

C



a1

a2

b13



a1

a2

a3



(1)构造表 (2)根据A→B进行处理 结果第二行全是a行,因此分解是无损联接分解。第2种解法:(定理4.8)设R1=AB,R2=ACR1∩R2=AR2-R1=BA→B,∴该分解是无损联接分解。然后,检查分解是否保持函数依赖πR1(F1)={A→B,以及按自反率推出的一些函数依赖}πR2(F1)={按自反率推出的一些函数依赖}F1被πR1(F1)所蕴涵,所以该分解保持函数依赖。(2)设R(ABC),F2={A→C,B→C}在R上成立,ρ2={AB,AC}首先,检查是否具有无损联接特点:第1种解法(略)第2种解法:(定理4.8)设R1=AB,R2=ACR1∩R2=AR2-R1=CA→C,∴该分解是无损联接分解。然后,检查分解是否保持函数依赖πR1(F2)={按自反率推出的一些函数依赖}πR2(F2)={A→C,以及按自反率推出的一些函数依赖}F1中的B→C没有被蕴涵,所以该分解没有保持函数依赖。(3)设R(ABC),F3={A→B},在R上成立,ρ3={AB,BC}.首先,检查是否具有无损联接特点:第1种解法:



A

B

C



AB

a1

a2

b13



BC

b21

a2

a3



A

B

C



a1

a2

a3



a1

b22

a3



(1)构造表 (2)根据A→B进行处理 没有一行全是a行。因此这个分解不具有无损联接特性。第2种解法:(定理4.8)??设R1=AB,R2=BCR1∩R2=BR2-R1=C,R1-R2=AB→C,B→A不在F3中该分解不具有无损联接特性。然后,检查分解是否保持函数依赖πR1(F3)={A→B,以及按自反率推出的一些函数依赖}πR2(F3)={按自反率推出的一些函数依赖}F1被πR1(F3)所蕴涵,所以该分解保持函数依赖。(4)设R(ABC),F4={A→B,B→C}在R上成立,ρ4={AC,BC}首先,检查是否具有无损联接特点:第1种解法(略)第2种解法:??设R1=AC,R2=BCR1(AC)∩R2(BC)=CR2-R1=B,R1-R2=AC→B,C→A不在F4中该分解不具有无损联接特性。然后,检查分解是否保持函数依赖πR1(F2)={按自反率推出的一些函数依赖}πR2(F2)={B→C,以及按自反率推出的一些函数依赖}F1中的A→B没有被蕴涵,所以该分解没有保持函数依赖。4.7设R=ABCD,R上的函数依赖集F={A→B,B→C,A→D,D→C},R的一个分解ρ={AB,AC,AD},求:(1)F在ρ的每个模式上的投影。(2)ρ相对于F是无损联接分解吗?(3)ρ保持依赖吗?(1)πAB(F)={A→B,及按自反律所推导出的一些平凡函数依赖}πAC(F)={A→C,及按自反律所推导出的一些平凡函数依赖}πAD(F)={A→D,及按自反律所推导出的一些平凡函数依赖}(2)



A

B

C

D



AB

a1

a2

b13

b14



AC

a1

b22

a3

b24



AD

a1

b32

b33

a4



A

B

C

D



a1

a2

a3

a4



a1

a2

a3

a4



a1

a2

a3

a4



(1)构造表 (2)根据A→B,B→C,A→D,D→C进行处理 每一行都是a,ρ相对于F是无损联接分解。(3)πAB(F)πAC(F)∪πAD(F)={A→B,A→C,A→D},没有满足B→C,D→C函数依赖,因此ρ相对于F的这个分解不保持函数依赖。4.8设R=ABCD,R上的F={A→C,D→C,BD→A},试证明ρ={AB,ACD,BCD}相对于F不是无损联接分解。根据算法4.2



A

B

C

D



AB

a1

a2

b13

b14



ACD

a1

b22

a3

a4



BCD

b31

a2

a3

a4



A

B

C

D



a1

a2

a3

b14



a1

b22

a3

a4



b31

a2

a3

a4



(1)构造表 (2)根据A→C,D→C,BD→A进行处理 没有一行都是a,所以,ρ相对于F不是无损联接分解。4.9设R=ABCD,R上的F={A→B,B→C,D→B},把R分解成BCNF模式集。(1)若首先把R分解成{ACD,BD},试求F在这两个模式上的投影。(2)ACD和BD是BCNF吗?如果不是,请进一步分解。(1)πACD(F)={A→C}πBD(F)={D→B}(2)因为根据BCNF的定义,要求关系模式是第一范式,且每个属性都不传递依赖于R的侯选键。BCD中(A,D)为候选键,可是(A,D)→A,A→C,所以它不是BCNF模式。它可进一步分解为:{AC,DC},此时AC,DC均为BCNF模式。BD是BCNF,因为R2(BD)是第一范式,且每个属性都不传递依赖于D(候选键),所以它是BCNF模式。4.10设R=ABCD,ρ={AB,BC,CD}。F1={A→B,B→C};F2={B→C,C→D};(1)如果F1是R上的函数依赖集,此时ρ是无损联接分解吗?若不是,试举出反例。(2)如果F2是R上的函数依赖集呢?(1)不是无损联接。可由算法4.2判断或由定理4.8判断。根据算法4.2



A

B

C

D



AB

a1

a2

b13

b14



BC

b21

a2

a3

b24



CD

b31

b32

a3

a4



A

B

C

D



a1

a2

a3

b14



b21

a2

a3

b24



b31

b32

a3

a4



(1)构造表 (2)根据A→B,B→C进行处理 结果没有出现一行全a的情况,所以它不是无损联接。举例如下:设模式R的一关系r为{(a1b1c1d1),(a2b2c1d2)}则有:r1=πAB(r)={(a1b1),(a2b2)}r2=πBC(r)={(b1c1),(b2c1)}r3=πCD(r)={(c1d1),(c1d2)}令a=r1r2r3={(a1b1c1d1),(a1b1c1d2),(a2b2c1d1),(a2b2c1d2)}r≠a,所以ρ不是无损联接。(2)如果F2是R上的函数依赖,则可以判断,ρ是无损联接。判断过程同上。4.11设关系模式R(S#,C#,GRADE,TNAME,TADDR),其属性分别表示学生学号、选修课程的编号,成绩、任课教师地址等意义。如果规定,每个学生每学一门课只有一个成绩;每门课只有一个教师任教;每个教师只有一个地址(此处不允许教师同名同姓)。(1)试写出关系模式R基本的函数依赖和候选键。(2)试把R分解成2NF模式集并说明理由。(3)试把R分解成3NF模式集,并说明理由。(1)F={(S#,C#)→GRADE,C#→TNAME,TNAME→TADDR}侯选键是(S#,C#)。(2)在模式R中,TNAME不完全依赖于键(S#,C#),因此需进行分解,可分解为下列两个关系。SC={S#,C#,GRADE}C={C#,TNAME,TADDR}分解后,SC中,GRADE完全依赖于侯选键(S#,C#),在C中,主属性是C#,TNAME、TADDR均完全依赖于C#。因此,该分解符合2NF模式。(3)3NF:若每个关系模式是2NF,则每个非主属性都不传递于R的候选键。按上述已分好的两个模式,SC中已满足“每个非主属性都不传递于R的候选键”,已是3NF,而在C中,C#→TNAME,TNAME→TADDR,TADDR传递依赖于C#,因此还需分成两个模式:CT(C#,TNAME),T(TNAME,TADD)。分解后,总共有SC={S#,C#,GRADE},CT(C#,TNAME),T(TNAME,TADD)三个模式。该分解符合3NF模式。4.12图4.6表示一个公司各部门的层次结构,对每个部门,数据库中包含部门号(唯一的)D#,预算费(BUDGET)以及此部门领导人员的职工号(唯一的)E#等信息。对每一个部门,还存有部门的全部职工,生产科研项目以及办公室的信息。职工信息包括:职工号,他所参加的生产科研项目号(J#),他所在办公室的电话号(PHONE#)。生产科研项目包含:项目号(唯一的),预算费。办公室信息包含:办公室号(唯一的),面积。对每个职工,数据库中有他曾担任过的职务以及担任某一职务时的工资历史。对每个办公室包含此办公室中全部电话号吗的信息。请给出你认为合理的数据依赖,把这个层次结构转换成一组规范化的关系。提示:此题可分步完成,先转换成一组1NF的关系,然后逐步转换成2NF,3NF,...。先得到一个泛关系的模式如下:D={D#,Manager_E#,Budget,E#,J#,Phone#,Business,Sa_History,Office#,Area}D#:部门号,Manager_E#:部门领导人员的职工号,E#:职工号,J#:生产科研项目号,Phone#:办公室的电话号,Business:职工职务,Sa_History:工资历史,Office#:办公室号,Area:办公室面积根据所给信息,给出下列数据依赖:F={D#→Manager_E#,E#→Office#,(E#,Business)→Sa_History,J#→Budget,E#→J#,Office#→Area,Office→D#,#Phone#→Office#}(假设一个部门可能有多个办公室,有多个项目,一个办公室只属于一个部门,有多部电话,一个员工只参加一个项目,一个项目可能属于多个部门)

只要保证每个属性值不可分割,以上范式即为1NF。候选键为(E#,Business,Phone#)

转换成2NF关系(消除局部依赖):Em_Dep(E#,D#,Manager_E#,Office#,Area,J#,Budget)??对应F={D#→Manager_E#,E#→Office#,J#→Budget,E#→J#,Office#→Area,Office→D#}History(E#,Business,History)??对应F={(E#,Business)→Sa_History}Phone(Phone#,Office#)??对应F={Phone#→Office#}转换成3NF关系(消除非主属性对侯选键的传递依赖):Department(D#,Manager_E#)Office(Office#,Area,D#)Emproee(E#,J#,Office#)History(E#,Business,History)Phone(Phone#,Office#)Project(J#,Budget)

注意:由于对题意理解的不同,可能答案不唯一。4.13设关系模式R(ABC)上有一个多值依赖A→→B。如果已知R的当前关系中存在三组(ab1c1)、(ab2c2)和(ab3c3),那么这个关系中至少还应存在哪些元组???从多值依赖的定义可以得出,至少应存在下列元组:(ab1c2)、(ab1c3)、(ab2c1)、(ab2c3)、(ab3c1)、(ab3c2)

数据库设计

(1)数据库设计:数据库设计是指对于一个给定的应用环境,提供一个确定最优数据模型与处理模式的逻辑设计,以及一个确定数据库存储结构与存取方法的物理设计,建立起既能反映现实世界信息和信息联系,满足用户数据要求和加工要求,又能被某个数据库管理系统所接受,同时能实现系统目标,并有效存取数据的数据库。(2)数据库工程:指数据库应用系统的开发,它是一项软件工程,但有数据库应用自身的特点。(3)评审:在数据库设计过程中,评审的目的是为了确认某一阶段的任务是否全部完成,避免重大的疏漏或错误,并在生存期的早期阶段给予纠正,以减少系统研制的成本。(4)数据字典:是对系统中数据的详尽描述,它提供对数据库数据描述的集中管理。它的处理功能是存储和检索元数据,并且为数据库管理员提供有关的报告。对数据库设计来说,数据字典是进行详细的数据收集和数据分析所获得的主要成果。数据字典主要包括四个部分:数据项、数据结构、数据流、数据存储。5.2数据系统的生存期分成哪几个阶段?数据库结构的设计在生存期中的地位如何?分成七个阶段:规划、需求分析、概念设计、逻辑设计、物理设计、实现、运行和维护。数据库结构的设计在生存期中的地位很重要,数据库结构的设计包括逻辑设计、物理设计,逻辑设计把概念模式转化为与选用的具体机器上的DBMS所支持的数据模型相符合的逻辑结构,而物理设计主要是设计DB在物理设备上的存储结构与存取方法等。5.3什么是数据库设计?数据库设计过程的输入和输出有哪些内容????数据库设计是指对于一个给定的应用环境,提供一个确定最优数据模型与处理模式的逻辑设计,以及一个确定数据库存储结构与存取方法的物理设计,建立起既能反映现实世界信息和信息联系,满足用户数据要求和加工要求,又能被某个数据库管理系统所接受,同时能实现系统目标,并有效存取数据的数据库。???数据库设计过程的输入包括四部分内容:1)总体信息需求;2)处理需求;(3)DBMS的特征;(4)硬件和OS(操作系统)特征。数据库设计过程的输出包括两部分:(1)完整的数据库结构,其中包括逻辑结构和物理结构;(2)基于数据库结构和处理需求的应用程序的设计原则。这些输出一般以说明书的形式出现。5.4基于数据库系统生存期的数据库设计分成哪几个阶段?分为5个阶段:简记为(规需概逻物):规划、需求分析、概念设计、逻辑设计和物理设计五个阶段。5.5什么是比较好的数据库设计方法?数据库设计方法应包括哪些内容?一个好的数据库设计方法应该能在合理的期限内,以合理的工作量产生一个有实用价值的数据库结构。一种实用的数据库设计方法应包括以下内容:设计过程、设计技术、评价准则、信息需求、描述机制。5.6数据库设计的规划阶段应做哪些事情????数据库设计中的规划阶段的主要任务是进行建立数据库的必要性及可行性分析,确定数据库系统在组织中和信息系统中的地位,以及各个数据库之间的联系。5.7数据库设计的需求分析阶段是如何实现的?目标是什么????数据库设计的需求分析通过三步来完成:即需求信息的收集、分析整理和评审。???其目的在于对系统的应用情况作全面详细的调查,确定企业组织的目标,收集支持系统总的设计目标的基础数据和对这些数据的要求,确定用户的需求,并把这些要求写成用户和数据设计者都能够接受的文档。5.8评审在数据库设计中有什么重要作用?为什么允许设计过程中有多次的回溯与反复????评审的作用在于确认某一阶段的任务是否全部完成,通过评审可以及早发现系统设计中的错误,并在生存期的早期阶段给予纠正,以减少系统研制的成本。???如果在数据库已经实现时再发现设计中的错误,那么代价比较大。因此应该允许设计过程的回溯与反复。设计过程需要根据评审意见修改所提交的阶段设计成果,有时修改甚至要回溯到前面的某一阶段,进行部分乃至全部重新设计。5.9数据字典的内容和作用是什么?数据字典的内容一般包括:数据项、数据结构、数据流、数据存储和加工过程。其作用是对系统中数据做出详尽的描述,提供对数据库数据的集中管理。5.10对概念模型有些什么要求?对概念模型一般有以下要求:?(1)概念模型是对现实世界的抽象和概括,它应真实、充分地反映现实世界中事物和事物之间的联系,具有丰富的语义表达能力,能表达用户的各种需求,包括描述现实世界中各种对象及其复杂联系、用户对数据对象的处理要求和手段。?(2)概念模型应简洁、明晰,独立于机器、容易理解、方便数据库设计人员与应用人员交换意见,使用户能积极参与数据库的设计工作。?(3)概念模型应易于变动。当应用环境和应用要求改变时,容易对概念模型修改和补充。?(4)概念模型应很容易向关系、层次或网状等各种数据模型转换,易于从概念模式导出也DBMS有关的逻辑模式。5.11概念设计的具体步骤是什么?概念设计的主要步骤为:(1)进行数据抽象、设计局部概念模式;(2)将局部概念模式综合成全局概念模式;(3)评审。5.12什么是数据抽象?主要有哪两种形式的抽象?数据抽象在数据库设计过程中起什么作用????数据抽象是对人、物、事或概念的人为处理,它抽取人们关心的共同特性,忽略非本质的细节,并把这些特性用各种概念精确地加以描述,这些概念组成了某种模型。数据抽象有两种形式:??(1)系统状态的抽象,即抽象对象;??(2)系统转换的抽象,即抽象运算。数据抽象是概念设计中非常重要的一步。通过数据抽象,可以将现实世界中的客观对象首先抽象为不依赖任何具体机器的信息结构。5.13什么是ER图?构成ER图的基本要素是什么?ER图是用来表示数据库概念设计ER模型的工具,它提供了表示实体、属性和联系的方法。构成ER图的基本要素是实体、属性和联系。5.14试述采用ER方法的数据库概念设计的过程.???利用ER方法进行数据库的概念设计,可分成三步进行:首先设计局部ER模式,然后把各局部ER模式综合成一个全局ER模式,最后对全局ER模式进行优化,得到最终的ER模式,即概念模式。5.15逻辑设计的目的是什么?试述逻辑设计过程的输入和输出环境。???逻辑设计的目的是把概念设计阶段设计好的基本ER图转换为与选用的具体机器上的DBMS所支持的数据模型相符合的逻辑结构(包括数据库模式和外模式)。逻辑设计过程中的输入信息有:?(1)独立于DBMS的概念模式,即概念设计阶段产生的所有局部和全局概念模式;?(2)处理需求,即需求分析阶段产生的业务活动分析结果;?(3)约束条件,即完整性、一致性、安全性要求及响应时间要求等;?(4)DBMS特性,即特定的DBMS特性,即特定的DBMS所支持的模式、子模式和程序语法的形式规则。逻辑设计过程输出的信息有:

?(1)DBMS可处理的模式;

?(2)子模式;

?(3)应用程序设计指南;

?(4)物理设计指南。5.16试述逻辑设计阶段的主要内容。逻辑设计主要是把概念模式转换成DBMS能处理的模式。转换过程中要对模式进行评价和性能测试,以便获得较好的模式设计。逻辑设计的主要步骤包括:(1)初始模式的形成(2)子模式设计(3)应用程序设计梗概(4)模式评价(5)修正模式。5.17规范化理论对数据库设计有什么指导意义?在概念设计阶段,已经把关系规范化的某些思想用作构造实体类型和联系类型的标准,在逻辑设计阶段,仍然要使用关系规范化的理论来设计模式和评价模式。规范化的目的是减少乃至消除关系模式中存在的各种异常,改善完整性,一致性和存储效率。5.18什么是数据库结构的物理设计?试述其具体步骤。数据库结构的物理设计是指对一个给定的逻辑数据模型选取一个最适合应用环境的物理结构的过程,所谓数据库的物理结构主要指数据库在物理设备上的存储结构和存取方法。物理设计的步骤为:(1)设计存储记录结构,包括记录的组成、数据项的类型和长度,以及逻辑记录到存储记录的映射;(2)确定数据存储安排;(3)设计访问方法,为存储在物理设备上的数据提供存储和检索的能力;(4)进行完整性和安全性的分析、设计;(5)程序设计。5.19数据实现阶段主要做哪几件事情?数据库实现阶段的主要工作有以下几点:(1)建立实际数据库结构(2)试运行(3)装入数据5.20什么是数据的再组织设计?试述其重要性。???对数据的概念模式、逻辑结构或物理结构的改变称作数据再组织。???数据再组织,通常是由于环境,需求的变化或性能原因而进行的,如信息定义的改变,增加新的数据类型,对原有的数据提出了新的使用要求,改用具有不同物理特征的新存储设备以及数据库性能下降等都要求进行数据库的重新组织。5.21数据系统投入运行后,有哪些维护工作?数据系统投入运行后,主要维护工作有:(1)维护数据库的安全性与完整性控制及系统的转储和恢复;(2)性能的监督、分析与改进;(3)增加新功能;(4)发现错误,修改错误。6.1什么是数据库的完整性?DBMS的完整性子系统的功能是什么?数据库的完整性是指数据的正确性和相容性。DBMS完整性子系统的功能是:(1)监督事务的执行,并测试是否违反完整性规则;(2)如有违反,则采取恰当的操作,如拒绝、报告违反情况,改正错误等方法进行处理。6.完整性规则由哪几个部分组成?关系数据库的完整性规则有哪几类?完整性规则由三部分组成:触发条件:即什么时候使用规则进行检查;约束条件:即要检查什么样的错误;ELSE子句:即查出错误后该如何处理。完整性规则有以下三类:域完整性规则,用于定义属性的取值范围;域联系的规则,定义一个或多个关系中,属性值间的联系、影响和约束。关系完整性规则,定义更新操作对数据库中值的影响和限制。6.试详述SQL中的完整性约束机制?SQL中的完整性约束规则有主键约束、外键约束、属性值约束和全局约束等多种形式。主键约束。它是数据中最重要的一种约束。在关系中主键值不允许空,也不允许出现重复,体现了关系要满足实体完整性规则。主键可用主键子句或主键短语进行定义。外键约束。根据参照完整性规则,依赖关系中外键或者为空值,或者是基本关系(参照关系)中的该键的某个值。外键用外键关系子句定义,并考虑删除基本关系元组或修改基本关系的主键值的影响,依赖关系可按需要采用RESTRICT、SETNULL、CASCADE方式。属性值约束。当要求某个属性的值不允许空值时,那么可以在属性定义后加上关键字:NOTNULL,这是非空值约束。还可以用CHECK子句对一个属性值加以限制以及使用域约束子句CREATDOMAIN定义新域并加以属性值检查。全局约束。在关系定义时,可以说明一些比较复杂的完整性约束,这些约束涉及到多个属性间的联系或不同关系间的联系,称为全局约束。主要有基于元组的检查子句和断言。前者是对单个关系的元组值加以约束,后者则可对多个关系或聚合操作有关的完整性约束进行定义。6.参照完整性规则在SQL可以用哪几种方式实现?删除基本关系的元组时,依赖关系可以采取的做法有哪三种?修改基本关系的主键值时,依赖关系可以采取的做法有哪三种?参照完整性规则要求"不引用不存在的实体",参照完整性规则在SQL可用以下几种方式实现:(1)在SQL中采用外键子句定义外键,并考虑删除基本关系元组或修改基本关系的主键值,对依赖关系产生的影响;(2)在属性值上进行约束如基于属性的检查;(3)全局约束中的基于元组的检查子句等。删除基本关系元组或修改基本关系的主键值时,依赖关系可以采用的做法有:RESTRICT方式:只有当依赖关系中没有一个外键值与基本关系中要删除/修改的主键值相对应时,系统才能执行删除/修改操作,否则拒绝删除或修改。SETNULL方式:删除基本元组时,将依赖关系中所有与基本关系中被删除主键值相对应的外键值置为空值。修改基本关系的主键值时,将依赖关系中所有与基本关系中被修改主键值相对应的外键值置为空值。CASCADE方式:若删除则将依赖关系中所有外键值与基本关系中要删除的主键值相对应的元组一并删除,若修改则将依赖关系中所有与基本关系中要修改的主键值相对应的外键值一并修改为新值。6.试对SQL2中的基于属性的检查约束、基于元组的检查约束和断言三种完整性约束进行比较:各说明什么对象?何时激活?能保证数据库的一致性吗?

约束形式 说明对象 激活条件 是否保证一致性 基于属性的检查 只对一个属性值加以约束 插入或修改属性值时 不一定 基于元组的检查 对单个关系的元组值加以约束 在插入或修改元组时 不一定 断言 多个关系或聚合操作 任何变动 保证 设教学数据库的模式如下:S(S#,SNAME,AGE,SEX)SC(S#,C#,GRADE)C(C#,CNAME,TEACHER)试用多种方式定义下列完整性约束:(1)在关系S中插入学生年龄值应在16~25岁之间(2)在关系SC中插入元组时,其S#值和C#值必须分别在S和C中出现。(3)在关系SC中修改GRADE值时,必须仍在0~100之间。(4)在删除关系C中一个元组时,首先要把关系SC中具有同样C#的元组全部删去。(5)在关系S中把某个S#值修改为新值时,必须同时把关系SC中那些同样的S#值也修改为新值。(1)定义S时采用检查子句:CREATTABLES(S#CHAR(4),SNAMEchar(10)NOTNULL,AGESMALLINT,PRIMARYkey(S#),CHECK(AGE>=16andAGE<=25))(2)采用外键子句约束CREATTABLESC(S#CHAR(4),C#CHAR(4),GRADESMALLINT,FOREIGNkey(S#)REFERENCES(S#),FOREIGNkey(C#)REFERENCEC(C#))(3)采用元组检查CREATTABLESC(S#CHAR(4),C#CHAR(4),GRADESMALLINT,FOREIGNkey(S#)REFERENCES(S#),FOREIGNkey(C#)REFERENCEC(C#),CHECK(GRADE>=0andAGE<=100))(4)采用外键约束CREATTABLESC(S#CHAR(4),C#CHAR(4),GRADESMALLINT,FOREIGNkey(S#)REFERENCES(S#),FOREIGNkey(C#)REFERENCEC(C#))若改为:在删除关系C中一个元组时,同时把关系SC中具有同样C#的元组全部删去,则为:......FOREIGNkey(C#)REFERENCEC(C#)ONDELETECASCADE......(5)采用外键约束CREATTABLESC(S#CHAR(4),C#CHAR(4),GRADESMALLINT,FOREIGNkey(S#)REFERENCES(S#)ONUPDATECASCADE,FOREIGNkey(C#)REFERENCEC(C#))6.什么是数据库的安全性?有哪些安全措施?数据库的安全性是指保护数据库防止不合法的使用,以免数据的泄漏、非法更改和破坏。可以从以下方面设置数据库的安全措施:环境级、职员级、OS级、网络级和数据库系统级。6什么是"权限"?用户访问数据库可以有哪些权限?对数据库模式有哪些修改权限?用户使用数据库的方式称为权限。用户访问数库的权限有:读权限、插入权限、修改权限、删除权限。用户修改数据库模式的权限有索引权限、资源权限、修改权限、撤销权限。6.试解释权限的转授与回收。在数据库系统中,为了保证数据的安全性,用户对数据的操作必须首先从DBA处获得权限,才能进行对数据的操作。同时数据库系统也允许用户将获得的权限转授给其他用户,也允许把已授给其他用户的权限再回收上来。但应保证转授出去的权限能收得回来。6.SQL语言中的视图机制有哪些优点?视图机制使系统具有三个优点:数据安全性、数据独立性和操作简便性。6.SQL中用户权限有哪几类?并作必要的解释。SQL2中定义了六类用户权限,分别是:(1)SELECT:允许用户对关系或视图执行SELECT操作。(2)INSERT:允许用户对关系或视图执行INSERT操作,如果还说明了一个属性表,那么表示只能插入这些属性的值,关系中其他属性值将置为缺省值或为空值。(3)DELETE:允许用户对关系或视图执行DELETE操作。(4)UPDATE:允许用户对关系或视图执行UPDATE操作,如果还说明了一个属性表,那么表示只能修改这些属性的值,否则表示可以修改关系中任一属性值。(5)REFERENCES:允许用户定义新关系时,引用其他关系的主键作为外键。(6)USAGE:允许用户使用定义的域。
献花(0)
+1
(本文系信息检索04...首藏)