5.3 关系数据库设计理论" w; C# m0 i- h' k# |0 D# ~
5.3.1 问题的提出$ ~2 S5 o; R; r* z& N {+ F
究竟一个关系数据库包含哪些属性是合理的,如何评价一个关系模式设计的优劣?7 c/ o+ C1 w2 D; j q. z- T
5.3.2 函数依赖
f2 ~, ?0 f0 c$ d% p* R函数依理论利用一个关系中属性之间的依赖关系评价和优化关系模式,以保证存储到数据库中的关系具有较好特性; S; o! Y- b+ n9 v5 G( \. R! W& x
1、 函数依赖:
# c' O, C3 s. o5 p' o' `4 P6 z6 f4 r(1) 设R(U)为一关系模式,X和Y为属性全集U的子集,若对于R(U)的任意一个可能的关系r,r中不可能存在两个元组在X上的属性值相等,而在Y上的属性值不等,则称“X函数决定Y”或“Y函数依赖于X”,并记作X" J5 o) C _$ u1 M
Y,其中X称为决定因素,因为根据函数依赖定义,给定一个X,就能惟一决定一个Y。. J1 E) F& u9 [( X6 X
(2) 这里讨论的函数关系与数学上的不同,是不能计算的,是一个关系中属性之间存在的依赖关系;它是一种语义范畴的概念,只能根据两个属性之间的语义来确定一个函数依赖是否存在。% Q* U+ h# U! c* d$ U
2、 完全与部分函数依赖:
$ \% F6 \1 y$ Z/ P# F(1) 在关系模式R(U)中,如果XàY成立,并且对X的任何真子集X’不能函数决定Y,则称Y对X是完全函数依赖,被记作X---f---àY。; z2 h8 `" r& m5 @" L+ N1 Q$ h
(2) 若XàY,但Y不完全函数依赖于X,则称Y对X是部分函数依赖,记作X--pàY;
$ I& c( N0 u$ U# s3、 传递函数依赖:
, W: H$ z! ?4 s) U# q9 A在关系R(U)模式中,如果X决定Y,(Y不属于X),Y不决定X,Y决定Z,则称Z对X传递函数依赖。, I( z+ G# o) _; v ~6 R- X1 |
4、 平凡与非平凡函数依赖:
4 v5 W! X; Q Q; V* A2 I(1) 若X决定Y,但Y属于X,则称XàY是平凡函数依赖,否则称非平凡函数依赖;
: T. Y& l. V8 |( v, W* i(2) 即平凡函数依赖,仅当其右边的属性集是左边属性集的子集时成立;
3 }6 E9 Z: }0 v$ r" d(3) 非平凡函数依赖,仅当其右边的属性集至少有一个属性不属于左边有集合时成立;
( ^, ?+ t- a- L" W$ `(4) 完全非平凡函数依赖:仅当其右边的属性集中属性都不在左边的集合时成立;
+ s9 T* ^. l+ ^1 i! j5 F& ~7 d5、 码:8 W5 ` S8 Y4 z+ x) Z3 a9 h
(1) 在关系模式R(U)中,K为R的属性或属性组,若K函数决定A1.A2….An,则K为关系模式R的候选码,包含在候选码中的属性称为主属性,否则为非主属性;) o* b8 w0 Y' N' Q
(2) 若一个关系的候选码不止一个,则选定其中一个作为关系R的主码;& r! @- v6 c# B: {; B* M7 b
(3) 关系的码属性除了必须完全函数决定关系的所有其他属性外,还必须满足最小化规则,即在关系模式R(U)中,不存在一个K的真子集能够函数决定R的其他属性。7 ~% O7 F8 d; u4 N
6、 函数依赖的推理规则:
8 F4 ~( {! V' N* I! k6 J+ ^(1) 自反律:若Y(包含于)X(包含于)U,则XàY成立;4 T/ L: g5 Y4 e; d8 ~0 {! y2 ^
(2) 增广律:若XàY,且Z(包含于)U,则XZàYZ成立;
$ Y/ M7 g% e( A) u(3) 传递律:若XàY,YàZ,则XàZ成立;! ?$ J. e h' {% k3 \
(4) 合并规则:若XàY,XàZ成立,则XàYZ;3 @' h+ p1 r e5 b8 H* Q
(5) 分解规则:若XàY和Z(包含于)Y成立,则XàZ也成立;
/ ?/ O' v7 L5 J) s! V(6) 伪传递规则:若XàY,YWàZ,则XWàZ成立;
5 |$ \3 }! h3 F' R1 a5 e7、 属性集闭包:! D9 d. g6 ?$ D/ a% F: F7 y+ z
(1) 设F是属性集U上的函数依赖集,X为U的一个子集,那么对于F,属性集X关于F的闭包(用X+表示)为:X+={A|XàA}
3 b; s$ I9 E$ Y: Q* x(2) 由属性集团包的定义可知,若想判断函数依赖XàY是否成立,只要计算X关于函数依赖集F的闭包,若Y是X闭包中的一个元素则XàY成立;: Z4 o$ J" `1 c0 q
8、 确定关系的码:
" ~4 }1 p( r) W% e$ q(1) 利用迭代算法计算X+,步骤如下:, n! Z+ n- L& e0 k, t B8 g) y
(A) 选X作为闭包X+的初值X(0);4 I; U6 R3 s h2 k0 a
(B) 由X(i)计算X(i+1)时,它是由X(0)并上属性集合A所组成,其中A满足下列条件:Y(包含于)X(i),且F中存在函数依赖YàZ,而A(包含于)Z。因为U是有穷的,所以会得到X(i)=X(i+1),此时X(i)为所求的X+。7 B. ^0 N1 p4 d. _1 n- k) j/ N0 Y
5.3.3 规范化设计方法
" b# U' I3 G: ]7 Z- X4 S% q1、 第一范式:
4 M- S& V7 J' |: F! L' p+ r(1) 定义:设关系模式R(F,U),如果R的每一个属性都是不可分的数据项,则此关系模式为第一范式;/ l+ I! N3 z K' o$ J; d; I( A% \
(2) 一个给定关系和第一范式(1NF)的区别:% p- k/ i/ m% ]2 l* S0 i" ?
(A) 一个关系中的数据按照行和列的形式组织,每个元组具有相同数目的属性个数,且每一个元组的属性值具有统一的数据类型和长度;元组或属性的排列与顺序无关,每个元组必须通过一个属性或属性组惟一识别;' r' N) o9 P5 J" @
(B) 第一范式实际上对关系增加了一个约束,即关系中元组的每个属性都只取一个值,第一范式是对关系模式的基本要求,不满足第一范式的数据库就不是关系数据库。
. `7 J; i* Y8 w2、 第二范式:. Z. E: x; j7 v+ G9 Y% F
(1) 定义:若关系模式R(F,U)是1NF,且每个非主属性完全函数依赖于码,则称R为第二范式,即在2NF中不存在非主属性对码的部分依赖;
7 S5 G f, l z4 T/ ~" _(2) 仅满足第一范式关系会存在种种问题,要消除必须用更高级的范式标准来设计,称为标准化;6 v6 R! ?! m2 g( V. O* ?
(3) 具体做法是将大的关系分解成多个小的关系,使分解后的关系满足更高级范式的要求。
5 j( z2 c, X. v8 L; D/ s- W(4) 第二范式实际上对关系增加了一个约束,就是关系中的每一个属性必须完全依赖于主码,即在第一范式的基础上,消除非主属性对主码的部分函数依赖可达到2NF;, d# U7 i' d: F& B
3、 第三范式:$ C W. O+ J! I
(1) 定义:若关系R(U,F)为第一范式,且不存在非主属性对主码的传递函数依赖,则称R为第三范式;5 U5 L/ {) \% s- M. B% ^
(2) 第三范式是在第二范式的基础上对关系又增加了一个约束,就是关系中的每一个非主属性必须只依赖于主码。即2NF的基础上,消除非主属性对主码的传递函数依赖可达到3NF。 |