数据库及其应用笔记 (一)作者:不详 出自:网友提供 http://www.csai.cn 2005年10月27日
第一章 人类社会活动的三大要素是能源、物质和信息。 信息是现实世界各种事物的存在特征、运动形式以及不同事物间的相互联系等诸要素在人脑中的抽象反映,进而形成概念。是一个抽象的概念。信息源于客观事物,而后通过人们加工处理再控制客观事物,从而达到认识世界,改造世界的目的。数据本质上是对信息的一种符号化表示,即用一定的符号表示信息。符号是由人为而定,在计算机中通常使用0和1这两个符号。信息和数据,既有区别,又有联系,数据是信息的载体,用来载荷信息,信息是数据的内涵,数据处理本质上就是信息处理。 从已知数据出发,参照相关数据,进行加工计算,产生出一些新的数据,这些新的数据又表示了新的信息,可以作为某种决策的依据,这一过程就是数据处理过程。数据处理的任务不是计算,而是管理数据。数据处理本质上就是信息处理。数据的收集、整理、组织、存储、查询、维护和传送等各种操作,是数据处理的基本环节,是任何数据处理任务必有的共性部分。 数据管理大体上可分为自由管理阶段、文件系统阶段和数据库系统阶段。 文件是操作系统管理数据的基本单位,文件可以命名,通过文件名以记录为单位存取数据,不必关心数据的存储位置。若干记录的集合称为文件。 描述事物性质的最小数据单位是数据项。记录是若干数据的集合,一个记录能表达一个具体事物。 在数据库系统阶段,数据库技术具有以下五个特点:数据结构化、数据共享、减少了数据冗余、有较高的数据独立性和提供了方便的用户接口。文件系统与数据库系统的最大区别是数据结构化。 数据库系统由数据库、支持数据库运行的软硬件、数据库管理系统和应用程序等部分组成。 DB是存储在磁盘等外部直接存取设备上的数据集合,是按一定的数据结构组织起来的,数据库是一个结构化的数据集合,主要是通过综合各个用户的文件,除去不必要的冗余,使之相互联系所形成的数据结构。(结构化的、有联系的数据集合) 数据库系统中的硬件是数据库赖以存在的物理设备,包括CPU、存储器和其他外部设备。 数据库系统中的软件是指数据库管理系统。-用于数据管理的软件系统 数据库管理系统简称DBMS,是是数据库系统的关键组成部分,是专门用于数据管理的软件。任何数据操作,包括数据库定义、数据查询、数据维护、数据库运行控制等都是在DBMS管理下进行的。DBMS是用户与数据库的接口,应用程序只有通过DBMS才能和数据库打交道。 DBA是指数据库管理员,其职责是维护和管理数据库,使之始终处于最佳状态。 UWA:用户工作区,是用户程序与系统缓冲区交换数据的场所。用户只能对UWA中的数据进行处理,其数据是DBMS根据用户的请求装进去的。 DD:数据字典,其中存放着数据库三级结构的描述以及各数据项的类型、值域和关键字等,从结构上对数据的语言和数值范围加以约束。 计算机系统中任何软件必须在操作系统的支持下才能工作。 1975年SPARC公布了数据库标准报告,提出了数据库三级组织结构,称SPARC分级结构,从内到外分三个层次描述,分别称为内模式、概念模式、外模式。 概念模式,简称模式,是对数据库的整体逻辑描述,并不涉及物理存储,故称为DBA视图。 内模式,又称存储模式,具体描述了数据是如何组织存储在存储介质上,是系统程序员用一定的文件形式组织起来的一个个存储文件和联系手段。故称内模式为系统程序员视图。只有内模式才是真正存储数据的。 外模式通常是模式的一个子集,又称子模式,外模式面向用户,是用户眼中的数据库,称外模式为用户视图。 数据库系统的三级结构中,总体观和存储观有一个,用户观有多个,一个应用对应一个用户观。三级结构的关系,可以概括为模式是内模式的逻辑表示,内模式是模式的物理实现,外模式是模式的部分抽取。 三个模式反映了对数据库的三种不同观点,模式表示了概念级数据库,体现了对数据库的总体观,内模式表示了物理级数据库,体现了对数据库的存储观,外模式表示了用户级数据库,体现了对数据库的用户观。 数据库三个模式之间存在两种映射,一是外模式/模式间的映射,另一映射是模式/内模式间的映射。 在数据库系统的组织结构中,模式/内模式映射把概念数据库与物理数据库联系起来,外模式/模式把用户数据库与概念数据库联系起来。 映射技术的好处:保证了数据的独立性、保证了数据共享、方便了用户使用数据库、有利于数据的安全和保密。 应用程序员和终端用户是数据库的用户。 DBMS通过DDL(数据描述语言)来定义三种模式,并将各种模式翻译成相应的目标代码。 DML数据操纵语言实现对数据库的操作,基本操作有:插入、修改、删除、检索。 DBMS有两种类型的程序设计语言:如FORTRAN、C等属于宿主(HL)型,FoxPro则属于自主(SCL型。 DBMS对数据库运行的控制主要是通过数据安全性控制、完整性控制、故障恢复和并发操作四个方面实现的。 关于信息和数据,下面的论述是正确的。D (A)只有区别没有联系(B)信息是数据的载体(C)同一信息用同一数据表示形式(D)数据处理本质上就是信息处理 数据库是。B(A)单用户独享的(B)多用户共享的(C)多用户(D)单用户 下面关于数据库管理系统的论述,是正确的。B (A)数据库管理系统是用户与应用程序的接口(B)应用程序只有通过数据库管理系统才能和数据库联系 (C)数据库管理系统用DML来定义三级模式(D)数据库管理系统用DDL来实现对数据库的各种操作 数据库系统提供了多种语言,下面不是其中的一种。(A)DDL(B)SCL(C)DML(D)HL 第二章 数据模型是对客观事物及其联系的描述,是记录及其联系的集合,应具有描述数据和数据联系两方面的功能,采用形式化的描述方法表达数据和数据之间的联系。数据模型表示的是数据库的框架,在该框架约束下填上具体数据才是数据库。数据库类型根据数据模型划分。数据的数据结构形式就是数据模型 为保证数据的完整性,数据模型对数据的描述应包括)模型中包含哪些记录类型,并对记录类型进行命名;指明各个记录类型由哪些数据项构成,并对数据项进行命名;每个数据项均需指明其数据类型和取值范围。 对数据间联系的描述要指明:各个不同记录类型间所存在的联系和联系方式。 公式DM{R,L}是对数据模型的描述,其中R代表记录类型的集合,L代表不同记录类型联系的集合。 公式的含义是表示了数据模型具有描述数据和数据联系两方面的功能,R是对数据的描述,L是对数据间联系的描述。 数据模型本质上是对“信息模型”的数据化表示,信息模型又称“实体联系模型”,是客观事物及其自然联系在人脑中所形成的概念。 信息来自于三个领域:现实世界、信息世界和数据世界。 在信息世界中,不论是实际存在的东西,还是概念性的东西,或是事物与事物之间的联系,一律统称为实体。不同实体是由其属性的不同而被区分的。实体和属性都有“型”和“值”之分。“型”是概念的内涵,而“值”是概念的实例。“型”表达的是个体的共性,而“值”是个体的具体内容。 “键”也称关键字,是指在实体属性中,可用于区分实体集中不同个体的那个或几个属性的组合。 当有多个属性可作为键而选定其中一个时,则称它为该实体的“主键”。若在实体诸属性中,某实体虽非该实体的主键,却是另一个实体的主键,则称此属性为“外部键”。实体中每个属性,都有一个取值范围,这叫做属性的“域”。 实体间的联系分别是一对一联系(1:1),一对多联系(1:n),多对多联系(m:n)。 E-R方法,又称为实体联系表示法。 E-R图中所表示的实体及其联系,实际上是信息模型。E-R图的三大要素:属性、实体、联系。 目前,成熟地应用于数据库系统中的数据模型有层次模型、网状模型和关系模型。 层次模型用树结构表示记录类型及其联系。结构特点:有且仅有一个结点无父结点,其他结点有且仅有一个父结点。在层次模型中,上一层记录型和下一层记录型之间的联系为1:n.不能直接支持m:n联系。对于记录之间的m:n关系,可以将其转换为1:n联系。 网状模型的结构是结点的连通图,特点是:有一个以上结点无父结点且至少有一个结点有多于一个父结点。典型代表是DBTG系统。 目前,在微机上的数据库系统应用最广泛的数据模型是关系模型。关系模型的本质是一张二维表,关系模型中,一张二维表就称为一个关系。如果二维表中的数据有变化,则它的记录数改变,它的字段数相对固定。 在文件系统中,一张二维表称为一个文件,表头行称为记录型,表中其他各行称为记录,而每一列中的各元素称为一个数据项。通常在数据库中,二维表以文件的形式存储在磁盘上,一个关系就是一个文件(一张二维表)。 从E-R图导出关系模型的时候,图中的每一个实体,都应转换为关系,其中应包括对应实体的全部属性,并应根据关系所表达的语义确定哪个属性(或哪几个属性组合)作为主键。 E-R图:方框表示实体,椭圆表示实体的属性,菱形表示联系。 信息世界用语:实体集、实体、属性、实体键,在数据世界中对应:文件、记录、数据项(字段)、记录键。 以下关于数据模型的描述,A不正确。 (A)数据模型表示的是数据库本 |
||
| |