第一章1、 人们将能源、物质和信息并列为人类社会活动的三大要素。
2、 数据是信息的载体,而信息是数据的内涵。
3、 数据处理的任务的矛盾焦点不是计算,而是把数据管理好。
4、 数据管理技术大体分为三个阶段:自由管理阶段、文件系统阶段、数据库阶段。
5、 数据项是描术事物性质最小数据单位。记录是若干数据项的集合。文件是若干记录的集合。
6、 文件系统阶段管理的缺点:文件是面向特定用途设计的,导致程序与文件相互依存;数据冗余大;数据可能发生矛盾;数据联系弱。
7、 数据库系统阶段的特点:
数据结构化;数据共享;减少了数据冗余;有交高的独立性;用户接口。
8、 数据结构化是文件系统与数据库系统的最大区别。
9、 数据独立性包括:物理数据独立性和逻辑数据独立性。物理独立性是指物理结构发生改变,不会影响到逻辑结构,用户不用需改程序;逻辑结构独立性是指全局逻辑发生改变时,用户也不需改支程序。
10、 数据库系统包括(DBS):数据库;硬件;数据库管理系统(DBMS);应用程序;数据库管理员(DBA)。
11、 数据库是一个结构化的集合,主要是通过综合各个用户的文件,除去不必要的冗余,使之相互联系所形成的数据结构。联系是数据库的重要特点,至于怎样实现联系取决于数据库类型。
12、 数据库的三级体系结构包括:概念模式、内模式、外模式。
13、 概念模式简称模式,是对数据库的整体逻辑描述,故称为DBA视图;内模式又称
存储模式,具体描述了数据如何存储在存储介质上,故称为系统
程序员视图;外模式双称为子模式,外模式面向用户,是用户眼中的数据库,故称为用户视图。
14、 模式是内模式的逻辑表示,内模式是模式的物理实现,外模式则是模式的部分抽取。
15、 模式体现了数据库的总体观,内模式体现了数据库的存储观,外模式体现了数据库的用户观;总体观和存储观只有一个,而用户观可能有多个。
16、 只有内模式才是真正存储数据的,而模式和外模式仅是一种逻辑表示数据的方法,但却可以使用,这是靠DBMS的映射工能实现的。
17、 三个模式间存在着两种映射:外模式/模式;模式/内模式。
18、 采用是映射技术的好处:保证了数据的独立性;保证了数据共享;方便了用户使用数据库;有利于数据的
安全和保密。
19、 数据库有两类用户:一是应用程序员,二是终端用户。每个用户都有一个用户工作区UMA,UMA是用户程序与系统缓冲区
交换数据的场所。
20、 数据库管理系统包括:数据库定义功能、映射功能、操纵功能、程序设计语言、数据库运行控制功能、数据库维护功能。
21、 程序设计语言有两种类型:宿主型和自主型。宿主型用一般的程序设计语言(如C)编程,而把DML作为主语言的一种扩充嵌入到主语言中;自主型是自含的程序设计语言,如foxpro。
22、 DBMS对数据库运行的控制主要是通过数据的安全性、完整性、故障恢复和并发操作四方面实现的。
23、 数据的完整性指数据的正确性和相容性。建库时,把完整性作为模式的组成部分存入数据字典,数据字典从结构上对数据的语义和数值范围加以约束。
24、 DBMS对并发控制机制,是通过例如“加锁”、“解锁”控制并发作业的进程以保证数据的正确性。
25、 数据库维护功能所括:数据的初始装入、数据库转储、数据库重组及记载系统工作日志等工能。
26、 模式是全局逻辑结构、内模式是全局物理结构、外模式是局部逻辑结构;修改内模式,模式不变,这是物理数据的独立性;修改模式,外模式不变,这是逻辑数据独立性。
第二章1、 数据模型是客观事物及其联系的数据描述。数据之间的联系,是数据模型的最大特点。
2、 数据模型采用一种形式化描述方法,把数据和数据之间的联系表达清楚。
3、 数据模型表示的是数据库的框架,在框架约束下填上具体数据才是数据库。
4、 数据模型应具有描述数据和数据联系两方面的功能。
5、 对数据的描述,每个数据项均需指明其数据类型和取值范围,这是数据完整性约束所必须的。
6、 数据模型表示为:DM={R,L};R代表记录类型的集合。L代表不同记灵类型联系的集合。
7、 数据模型仅是一种形式化描述记录类型及其联系的方法,与具体DBMS无关。
8、 数据模型本质上是信息模型的数据化表示。信息模型又称实体联系模型,是客观事物及其自然联系在人头脑中所形成的概念。
9、 从实体联系模型到数据模型经在了三个阶段:现实世界—信息世界—数据世界。
10、 实体是现实世界任何可相互区别的事物,如人、电视机、产品质量、一场球赛,一律都是实体。属性是实体所具有的性质,实体靠属性来描述。
11、 实体和属性都有型和值之分,型是概念的内涵,而值是概念的实例。如:学生这个实体,通号“学号”“姓名”等属性表明学生状况,这是实体型,而每个学生的具体情况,则是实体值。姓名、年龄等是属性型,而具体的张三21岁、男等是属性值。可见,型表达的是个性的共性,而值是人体具体内容。通常属性是个变理,属性值是该变理的取值。
12、 域:实体中每个属性,都有一个取值范围,这叫作属性的域。域可以是整数、实数、字符串、日期、逻辑真假等。
13、 当有多个属性可作为键而选定其中一个时,则称它为该实体的主键。若在实体诸属性中,某属性虽非该实体主键,却是另一实体的主键,称此属性为外部键。
14、 术语对应关系: 信息世界 计算机世界
实体集 文件
实体 记录
属性 数据项(字段)
实体键 记录键
15、 实体间联系三种类型:一对一(1:1)、一对多(1:n)、多对多(m:n)。举例:部门与主管;部门与职员;学生与课程。
16、 实体联系表示法简称E-R方法,此法通过所谓E-R图表示实体及其联系,在设计数据库时,人们往往反民E-R图作为一个中间步聚。
17、 E-R图中包括:实体、属性和联系三种基本图素。实体用方框表示,实体属性用椭图框表示,联系用菱形框表示。
18、 E-R图画法:把有联系的实体(方框)通过联系(菱形框)连接起来,注明联系方式,再把实体的属性(椭圆框)连到相应的实体上。
19、 设计E-R图的原则:先局部后整体,在综合的过程中,去除重复的实体,去掉不必要的联系。注意,能作为属性的就不要作为实体。
20、 数据库中的数据模型包括:层次模型、网状模型、关系模型。
21、 数据库有类型之分,是根据数据模型划分的,而任何一个DBMS也是根据数据模型有针对性地设计出来的。
22、 层次模型用树结构来表示。它最适合表现客观世界有严格辈份关系的事物,缺点是不能直接支持m:n联系,如IMS数据库管理系统。
23、 网状模型用图来表示。它只支持1:n联系,对m:n联系,可以将其转换成1:n,如DBTG系统。
24、 关系的直观解释就是一张二维表,而关系模型就是用若干个二维表来表示实体及其联系的,这是关系模型的本质。关系模型就是通过若干关系框架表示实体及其联系。
第三章
1、 在数学上把所有可能的配对叫笛尔卡积,记为M*W,其意义是诸集合中各元素间一切可能的组合。笛尔卡积可看成一个二维表。
2、 在关系对应的二维表中,行对应元组,列对应域。笛尔卡积允许有相同的域。
3、 关系的性质:不允许许“表中套表”;表中各列取自同一个域,在此一列中的各个分量具有相同性质;列的次序可以任意交换,不改变意义;表中的行叫元组,代表一个实体,不允许有相同的两行;行的次序同样也可以交换。
4、 关系和Foxpro对应:关系—数据库,元组—记录,属性—字段。
5、 不同关系型DBMS的数据描述语言不尽相同,有问答式,有语言描述式。
6、 问答式,Foxpro就是此类。语言描述式有专门的描述语言定义关系模式:关系名、组成该关系的各个域名、数据类型、长度和取值范围。
7、 关系数据库必须遵循三类完整性约束规则包括:实体完整性约束规则、引用完整性约束规则、用户定义的完整性约束规则。
8、 实体完整性约束是指关系中的“主键”不允许取空值。
9、 引用完整性约束是限制不存在的记录。如果一个关系A中含有另一关系B的主键所对应的外部键,则A关系中外部键的取值必须满足两种情况:要么在B关第中能找到某个记录,该记录的主键值等于A关系中的外部键值;要么A中的这个外部键干脆取空值。
10、 关系数据操纵语言DML的特点:操作对象与结果—关系;非过程性强;语言一体化;有严密的数学工具。
11、 关系数据描述语言、数据操纵语言乃至数据控制语言通常融于一体。
12、 关系数据库上的操作包括:查询、统计、汇总、插入、删除、修改。核心是查询。
13、 关系DML查询方式分为:用关系代数运算表达查询;用关系演算公式表达查询。这两种方式是功能是等价的。但从非过程性而言,后者优于前者。
14、 关系代数包括:集合运算符—并、交、差、笛卡尔积;关系运算符—投影、选择、连接;比较运算符——><=;逻辑运算符—或、与、非。
15、 并、交、差,当用于关系时,要求参加运算的两个关系是相容的,即两关系度数相同,相应属性取自同一个域。
16、 选择是单目运算;投影是单目运算;关系笛尔积是二目运算,是域笛尔卡积的扩充;连接是双止运算;自然连接是连接的一个重要特例,它要求被子连接两关系有若干相同的属性名。
17、 关系代数中只有并、交、差、选择、投影和连接是基本运算。
18、 关系规范化本质就是对关系不断分解。
19、 关系规范化实质是围绕函数依赖进行的。函数依赖描述的是非主属性与主键之间的关系。
20、 函数依赖分为:函数依赖;完全函数依赖;部分函数依赖;传递函数依赖。
21、 范式一共包括:第一范式到第五范式。实际的关系数据库一般使用3NF以上的关系。
22、 1NF的缺点:数据冗余大;修改麻烦;插入异常;删除异常。
23、 插入异常是指在关系中键值不允许是空值。改缺点的方法是消除同时存在于一个关系中属性间的不同依赖情况,就是使一个关系表示的信息单纯些。
24、 2NF:满足第一关系,消除部分依赖,所以属于第二范式。
25、 3NF:满足第二关系,消除传递依赖,所以属于第三范式。3NF的关系消除了非主属性对主键的部分依赖和传递依赖。
26、 关系规范化过程实质是对关系不断分解的过程,通过分解使关系逐步达到较高范式。
27、 分解关系的基本原则:分解必须是无损的;分解后的关系要相互独立。
28、 各范式这间的关系:3NF属于2NF属于1NF。值得提出的是,不是范式越高越好。因为范式越高,关系所表达的信息越单纯,查询数据就得作接接运算,开销很大。
第四章
1、 数据库设计包含两方面内容:结构特性设计和行为特性设计。
2、 结构特性是在模式和子模式中定义的,而行为特性通过应用程序去实现。数据库设计中结构设计是关键。
3、 数据库逻辑设计分成三个阶段:第一阶段—收集和分析用户要求(分析实体以其联系)、第二阶段—建立E-R模型(画E-R图)、第三阶段—数据库模式设计(建立数据模型)。
4、 第一阶段包括四步:分析用户活动、确定系统范围、分析用户活动所涉及的数据和分析系统数据。
5、 分析用户活动所涉及的的数据的焦点是搞清用户活动图中所处理的数据,并以数据流图的形式表示出数据的流向和对数据所进行的加工。
6、 数据流图是一种从数据和对数据的加工两方面表达系统工作过程的图形表示法。数据流图中有四种基本成分:数据及其流动方向(用带箭头的线段表示)、对数据的加工(用圆形框表示)、文件(用卡片形框表示)、源点和终点(用方框表示)。
7、 画数据流图的原则:由外向内,自顶而下。
8、 分析系统数据描述后的产物是数据字典。DBMS数据字典实际上是一个关于数据库信息的特殊数据库。
9、 数据流图和数据字典两者结合起来,加上必要的说明才能构成系统说明书。数据字典产生于数据流图,是对数据流图中的四个成分的描述的产物。
10、 数据流的描述:是定义数据流的组成,通常包含若干数据项,一般可以在数据流图的下面。文件的描述:也是定义它的组在,此外还需要指出文件的组织方式,如图书=编号+书名+作者+单价。数据项的描述:对数据项进行定义,一般包括名称、类型、长度、允许范围等。加工的描述:说明加工的逻辑关系。
11、 E-R模型,现在我们用它表示数据库概念模型。
12、 局部E-R模型设计(根据流程图和数据字典分析实体及属性):从数据流图出发确定实体和属性,并根据数据流图中表示的对数据的加工,确定实体之间的联系。关键是确定实体和反映实体间的联系。总体E-R模型设计:去掉重得的实体。P53
13、 第三阶段可以分二步:初步设计——把E-R图转换为关系模型。优化设计——对模式进行调整和改善,通常采取定性判断方法。
14、 数据库物理设计包括:选择存储结构;确定存取方法;选择存了路径;确定数据的存放位置。
15、 选择何种存储结构与DBMS有关,存取方法与存储结构有关。数据库的物理实现取决于特定的DBMS,在规划存储结构时主要应考虑存取时间和存储空间两方面开销。
16、 经过概念设计è逻辑设计è物理设计,标志着数据库的框架搭设成功。
17、 数据库的系统的生命周期分为:分析、设计、编码、测试、运行。
18、 程序编码就是具体程序设计,所用的语言取决于DBMS语言系统。通过调试程序,能发现数据库设计是否合理。数据库维护包括:日常维护、定期维护、故障维护。
19、 技术文档包括:系统说明书、技术说明书、使用说明书。
20、 系统设计说明包括:数据流图、数据字典、行为动作主要技术资料构成。