Академический Документы
Профессиональный Документы
Культура Документы
CƠ SỞ DỮ LIỆU NÂNG CAO LÝ THUYẾT PHỤ THUỘC HÀM Thầy giảng dạy: TS. Hoàng Quang
Tại sao phải nghiên cứu LTPTH? DƯ THỪA DL DỊ THƯỜNG DƯ THỪA DL DỊ THƯỜNG
MỘT SỐ CÁC ĐỊNH NGHĨA TRONG LÝ THUYẾT PHỤ THUỘC HÀM
∀ Y → C A B C r = a b c b d c a e c X ◊ C r thỏa B ◊Phụ thuộc hàm r thỏa A t 1 [Y] = t 2 [Y]⇒ r : t 1 [X]
= t 2 [X] ∈t 1 , t 2
Y Stop R=◊Lược đồ quan hệ thoả mãn phụ thuộc hàm KHÔNG THỎA MÃN X <U, SC> Or R= < U, F >
Bao đóng của tập phụ thuộc hàm
R = <U, F>. F + là tập tất cả các phụ thuộc hàm hệ quả của F
Y}→ Y | F╞ X →F + = {X
F +⊆F
Khoá của lược đồ quan hệ
R = <U, F> U. X là khoá của R nếu:⊆, X
U ( siêu khoá )→1.X
X : X’ là siêu khoá của R⊂ X’ ∃ 2. Không
Ví dụ : R = <U, F> C} {A} là khoá của R→ B, B →U = ABC; F = {A
Hệ tiên đề Amstrong
Cho R = <U, F>
F +∈ X → Y) : Y ⊆ U ) (X ⊆- (X, Y
F +∈ YZ → F +: XZ ∈ Y) → U) (X ⊆- (X, Y, Z
F +∈ Z → F +): X ∈ Z → F + , Y ∈ Y → U) (X ⊆- (X, Y, Z
Hệ tiên đề Amstrong (2)
Ví dụ : R =<U, F> C}→ B, A →, U =ABC, F = {A
F +∈ BC →Chứng minh: A
B (1)→A
C (2)→A
AB (3) (Luật gia tăng)→ A ⇒Từ (1)
BC (4) (Luật gia tăng)→ AB ⇒Từ (2)
Từ (3) & BC (Luật bắc cầu)→ A ⇒(4)
đpcm⇒
Bao đóng của tập thuộc tính (X + )
Ví dụ
C}→ B, B →F = {A
A + F = ABC
(AB) + = ABC
R = <U, F> X + F⊆ Y ⇔ F + ∈ Y → U. Khi đó: X ⊆và X, Y
X + F + }=X + F∈ A →= {A | X
Hai tập phụ thuộc hàm tđương
Cho F & G nếu và chỉ nếu F + = G +⇔G. F
G⇔Ý tưởng đề kiểm chứng F
F+ G G+ F &
Hai tập phụ thuộc hàm tđương (2)
Ví dụ : Kiểm tra F và G có tđương hay ko
C→ B, A → BC}, G={A →F={A
G + }⊆{Kiểm tra F
B :A + F = ABC B→A
C: A + F = ABC C→A
F + }⊆{Kiểm tra G
BC: A + G = ABC BC→A
Vậy F tđ với G
Phủ cực tiểu của một lược đồ quan hệ (1)
Cho R = <U, F>, F được gọi là phủ cực tiểu của R khi và chỉ khi:
Vế phải chỉ có 1 thuộc tính
Không có thuộc tính dư thừa ở vế trái
Không có phụ thuộc hàm dư thừa
Phủ cực tiểu của một lược đồ quan hệ (2)
X∈ B ∀ F, ∈ A → X ∀ ⇔b)
F +≠ A)) + → (X {B} ∪ A} ) → ((F {X ⇔
F +∉ A → X: X{B} ∈ B ∀ F, ∈ A → X ∀ ⇔
X: (X {B}) + A∈ B ∀ F, ∈ A → X ∀ ⇔
A}) +→ (F {X ∉ A → F: X ∈ A → X ∀ ⇔c)
A} A→ F, X + F{X ∈ A → X ∀ ⇔
Phủ cực tiểu của tập phụ thuộc hàm
R = <U, F>. G đgl 1 phủ cực tiểu của F nếu thoả 2 điều kiện:
F⇔G
G là phủ cực tiểu của R’ = <U, G>
Phủ cực tiểu của 1 phụ thuộc hàm là không duy nhất
Xin chân thành cảm ơn thầy và các bạn đã tham gia thảo luận!
CƠ SỞ DỮ LIỆU NÂNG CAO LÝ THUYẾT PHỤ THUỘC HÀM Thầy giảng dạy: TS. Hoàng Quang 1
Tại sao phải nghiên cứu LTPTH? DỊ THƯỜNG DƯ THỪA DL 2
MỘT SỐ CÁC ĐỊNH NGHĨA TRONG LÝ THUYẾT PHỤ THUỘC HÀM 3
t1[Y] = t2[Y] A B C r=⇒ r : t1[X] = t2[X] ∈ t1, t2 ∀ ⇔ Y →Phụ thuộc hàm X C 4◊ C r thỏa B◊a b c b d
c a e c r thỏa A
R R=∈r ∃ Y Stop ◊Lược đồ quan hệ thoả mãn phụ thuộc hàm X <U, SC> Or R= < U, F > KHÔNG
THỎA MÃN 5
Bao đóng của tập phụ thuộc hàm R = <U, F>. F+ là tập tất cả các phụ F+ 6⊆Y} F →Y | F╞ X→thuộc hàm
hệ quả của F F+ = {X
Khoá của lược đồ quan hệ R = <U, F>U→ U. X là khoá của R nếu: 1.X⊆, X X : X’ là siêu khoá của R Ví
dụ: R =⊂ X’ ∃ (siêu khoá) 2.Không <U, F> U = C} {A} là khoá của R 7→B, B→ABC; F = {A
Hệ tiên đề Amstrong Cho R = <U, F> F+∈X → Y) : Y⊆ (X ∩ U ) ⊆- (X, Y F+):∈Z → F+, Y∈Y → (X∩
U) ⊆ F+ - (X, Y, Z ∈YZ → F+: XZ∈Y) → (X∩ U) ⊆- (X, Y, Z F+ 8∈Z →X
Hệ tiên đề Amstrong (2) Ví dụ: R =<U, F>C} Chứng→B, A→, U =ABC, F = {A ⇒ AB (3) (Luật gia tăng)
Từ (2) → A ⇒C (2) Từ (1) →B (1) A→ F+ A∈ BC →minh: A BC (4) (Luật gia tăng) Từ (3)→AB &
đpcm 9⇒ BC (Luật bắc cầu) → A ⇒(4)
B,→ F+}=X+F Ví dụ F = {A∈A →Bao đóng của tập thuộc tính (X+) X+ = {A | X C} A+F = ABC (AB)+
= ABC R =→B <U, F> Y⇔ F + ∈ Y → U. Khi đó: X ⊆và X, Y X+F 10⊆
Hai tập phụ thuộc hàm tđương Cho F & G nếu và chỉ nếu F+ = G+ Ý⇔G. F ) F+ =∈ : → Y ⊇ X F
⇒X(C / mY BT G ∀ ⇒ G + ↓ F ᅪ G + (1) ⇔tưởng đề kiểm chứng F X ᅪ Y F ᅪ G Y X+ F G+∀G + ᅴ ■
○G ᅪ F (2) + ᅪ & G F+ 11
Hai tập phụ thuộc hàm tđương (2) Ví dụ: Kiểm tra F và G có tđương hay ko C: A+F = ABC C
{Kiểm→B :A+F = ABC B A→ G+} A⊆C {Kiểm tra F →B, A→BC}, G={A→F={A BC: A+G = ABC BC
Vậy F tđ với G 12→ F+} A⊆tra G
Phủ cực tiểu của một lược đồ quan hệ (1) Cho R = <U, F>, F được gọi là Không cóν Vế phải chỉ có 1
thuộc tính ν phủ cực tiểu của R khi và chỉ khi: Không có phụ thuộc hàm dư thừa 13ν thuộc tính dư thừa
ở vế trái
Phủ cực tiểu của một lược đồ ((F \\⇔ X ∈ B ∀ F, ∈ A → X ∀ ⇔quan hệ (2) b) ∈ A → X ∀ ⇔ F+ ∉A →
X: X\\{B} ∈ B ∀F, ∈A → X∀ ⇔ F+ ≠ A))+ → (X \\ {B} ∪A} ) →{X F,∈ A → X ∀ ⇔A})+ → (F \\
{X∉A → F: X∈ A → X ∀ ⇔ X: (X \\ {B})+ ᅪ A c) ∈ B ∀F, A} ᅪ A 14→X+F\\{X
Phủ cực tiểu của tập phụ thuộc hàm R = <U, F>. G đgl 1 phủ cực tiểu G là phủ cực tiểu của R’ =ν F
⇔Gν của F nếu thoả 2 điều kiện: <U, G> Phủ cực tiểu của 1 phụ thuộc hàm là không duy nhất 15
Giải thuật tìm phủ cực tiểu Bước 1 ↓ X ᅪ A1 X ᅪ A2 X ᅪ A1A 2 ...A n ᅪ ᅪ ᅪᅪ X) do If∈ F) do
For (mỗi B ∈ A →ᅴ ■ ˆ % Phan ra M Bước 2 ○X ᅪ A n For (mỗi X A) then X := X \\ {B}; 16⊇((X \\
A) then F⊇A} → F) do If (X+F\\{X∈ A → Giải thuật (tt) Bước 3 For (mỗi X ν A}; Kết luận: G := F;
17→:= F \\ {X
Ví dụ Tìm phủ cực tiểu của tập PTH R = <U, F>→A, D →,U = ABD, F ={B A,→ F = {B⇒A →D} = BA
ᅪ D A B→ loại bỏ B+F\\{B⇒ D ⊇D B+F = BAD →D B→ D} AB→A, AB A}→A ᅪ D+F\\{D→D}
D→A, B→ F = {D⇒A → A} loại bỏ B⇒ A ⊇A} = BDA → B+F\\{B→D, D→B D} 18→A, B→= D A Kết
luận: F = {D
Khóa của lược đồ Định lý Hồ Thuần - Nguyễn Văn Bào (Điều kiện cần để X là Function Key(R) 1. Xđịnh
T 2. Xác định◊ P) ∩ (T ∪ (U \\ P) ⊆ X ⊆khoá) (U \\ P) P) (X:= S) 4. For∩ (T ∪P 3. X := (U \\ P) < P)∩
(T ∈mỗi A > ∩ S ∈do (A P ) 5. If∩T <(X \\ A)F+ = U> then X := X \\ A; Return X. 19
Giải thuật xác định tất cả các khoá của 1 lược đồ quan hệ Định lý Lucchesi và Osborn: (Điều kiện cần và
đủ để bổ sung khoá) R = <U, F>. K là 1 tập khác rỗng các khoá của lược đồ quan hệ R. Điều kiện cần và
đủ để bổ sung khoá (K \\ Y) không chứa phần tử nào của∪ F sao cho T = X ∈Y → X∃ K ∈k∃ mới vào K
là: K. 20
K ; K := {R}; For∈Giải thuật Tìm 1 khoá k < K∈mỗi k > For <mỗi F∈Y ◊X> (K \\ Y) ; If∪do T := X
<T không chứa phần tử nào của K> {K’} 21∪then Tìm khoá k’ nhận T làm siêu khoá ; K+ := K
Giải thuật (2) goto 3; EndIf; EndFor; EndFor; Return; 22
Mạng bus :
Có một kênh chung để chuyền dữ liệu, các máy tính và các thiết bị đầu cuối sẽ được gắn vào đó.
1.1 SƠ LƯỢC VỀ MẠNG MÁY TÍNH Mạng bus
Công thức chung cho sự xác định thời gian trả lời
Response_time = C CPU * seq_#instr + C I/O * seq_#I/O S +
C MSG * seq_#msgs + C TR * seq_#bytes
Trong ®ã:
seq_#x (x cã thÓ lµ sè lÖnh cña CPU, I/O, sè th«ng b¸o, sè byte) lµ sè lín nhÊt cña x khi thùc hiÖn truy
vÊn mét c¸ch tuÇn tù.
Trong đó: Response_time : thời gian trả lời truy vấn
C CPU : chi phí của một lệnh CPU
C I/O : chi phí của một xuất/nhập đĩa
C MSG : chi phí của việc khởi đầu và nhận một thông báo.
C TR : chi phí truyền một đơn vị dữ liệu từ trạm này đến trạm khác
#instr: tổng tất cả các lệnh CPU ở các trạm
#I/OS: số lần xuất/nhập đĩa
#msgs: số thông báo
#bytes : tổng kích thước của tất cả các thông báo.
4.4 Tối ưu hoá truy vấn trong CSDL phân tán
VÝ dô: Minh ho¹ sù kh¸c nhau gi÷a tæng chi phÝ vµ thêi gian tr¶ lêi , trong ®ã m¸y tÝnh tr¶ lêi truy vÊn
t¹i tr¹m 3 víi d÷ liÖu tõ tr¹m 1 vµ 2, ë ®©y chØ cã chi phÝ truyÒn th«ng ®îc xÐt Gi¶ sö, C MSG vµ C
TR ®îc biÓu thÞ theo ®¬n vÞ thêi gian. Tæng chi phÝ truyÒn x ®¬n vÞ tõ tr¹m 1 ®Õn tr¹m 3 vµ y ®¬n
vÞ tõ tr¹m 2 ®Õn tr¹m 3 lµ: Total_cost = C MSG + C TR *x + C MSG + C TR *y = 2C MSG + C TR *
(x+y) V× viÖc truyÒn d÷ liÖu cã thÓ ®îc thùc hiÖn song song nªn thêi gian tr¶ lêi cña truy vÊn lµ
Response_time = max{C MSG + C TR * x, C MSG + C TR * y} 4.4 Tối ưu hoá truy vấn trong CSDL
phân tán Tr¹m 2 Tr¹m 1 Tr¹m 3 x y H×nh 4.12: VÝ dô cña sù biÕn ®æi 1 truy vÊn
2. Phép chiếu
Phép chiếu có thể có hoặc không loại bỏ các bản sao, ở đây chỉ xét phép chiếu loại bỏ các bản sao.
Lực lượng quan hệ kết quả của một phép chiếu tùy ý là khó đánh giá chính xác, vì tương quan giữa thuộc
tính chiếu là thường không biết. Tuy nhiên, có hai trường hợp tầm thường nhưng đặc biệt có lợi:
Nếu phép chiếu của R trên một thuộc tính đơn A thì lực lượng được tính đơn giản là số các bộ khi phép
chiếu được thực hiện.
A (R)) =π Nếu một trong các thuộc tính chiếu là khoá của R, thì card( S) = card(R) * card(S)× card(R)
và card(R
4.4 Tối ưu hoá truy vấn trong CSDL phân tán
3. Phép nối
Không có một cách tổng quát để xác định lực lượng của một phép nối nếu không có các thông tin thêm.
Cận trên của lực lượng của phép nối chính là lực lượng của tích Decartes.
Tuy nhiên, có một số trường hợp xuất hiện thường xuyên và việc đánh giá là đơn giản:
S, trong đó A là khoá của R, B là khoá ngoài của∈ R, B ∈- Nếu R AB S với A S, thì lực lượng của kết
quả xấp xỉ là: card(R AB S) = card(R)
Với các phép nối khác, lực lượng của kết quả là:
card(R S) = SF J * card(R) * card(S)
4.4 Tối ưu hoá truy vấn trong CSDL phân tán
4. Phép nửa nối Hệ số chọn của phép nửa nối (SF SJ ) xấp xỉ là: 4.4 Tối ưu hoá truy vấn trong CSDL phân
tán Công thức này chỉ phụ thuộc vào thuộc tính A của S, nên thường được gọi là hệ số chọn thuộc tính A
của S, ký hiệu SF SJ (S.A) và là hệ số chọn của S.A trên bất cứ thuộc tính nối khác. Vì thế, lực lượng của
phép nối được tính như sau: card(R AS) = SF SJ (S.A) * card(R) SF SJ (R S) = A (S))
Card(dom[A])π Card(
5. Phép hợp
S, vì các bộ giống nhau giữa R và S bị∪Rất khó đánh giá số lượng của R loại bỏ bởi phép hợp.
Ở đây chúng ta chỉ đưa ra công thức tính:
S) bằng card(R)+card(S),∪cận trên của card(R
S) bằng max{card(R),card(S)}∪cận dưới của card(R
(giả sử R và S không chứa các bộ lặp).
6. Phép trừ
Cũng như phép hợp ở đây chỉ đưa ra cận trên và cận dưới, cận trên của card(R-S) là card(R), cận dưới là 0.
4.4 Tối ưu hóa trong CSDL phân tán
Ví dụ Xét hai quan hệ trong cơ sở dữ liệu của công ty máy tính: E=NHANVIEN (MANV, TENNV,
CHUCVU) và G=HOSO (MANV, MADA, NHIEMVU, THOIGIAN). Với câu truy vấn “ Cho biết tên các
nhân viên hiện đang quản lý một dự án ”. Ta có câu truy vấn SQL tương ứng là: SELECT TENNV FROM
E, G WHERE E.MANV=G.MANV AND TENNVΠ NHIEMVU=”Quản lý” Hai truy vấn đại số tương
đương với truy vấn trên là: σ TENNV (E MANV ( Π G)) (1) và × E.MANV=G.MANV (E ∧
NHIEMVU=”Quản lý” σ ( NHIEMVU=”Quản lý” G)) (2) Rõ ràng truy vấn (2) tránh được khỏi phải tích
số của E và G, nên dùng ít phép tính tài nguyên hơn truy vấn (1) 4.4 Tối ưu hóa trong CSDL phân tán
Mục đích của tối ưu hoá truy vấn trong CSDL phân tán
Chức năng của tối ưu hoá truy vấn phân tán
Các phương pháp xử lý truy vấn cơ bản
Ý tưởng của thuật toán Ingres. Ví dụ
Sơ đồ phân lớp chung cho cho xử lý truy vấn phân tán
Định vị dữ liệu phân tán-Tối ưu hoá cục bộ
Câu hỏi cuối chương
HẾT CHƯƠNG 4 CHƯƠNG 4: XỬ LÝ TRUY VẤN TRONG CSDL PHÂN TÁN
Chuong 5 CSDL phân tán - Presentation Transcript
CHƯƠNG 5: QUẢN LÝ CÁC GIAO TÁC PHÂN TÁN NỘI DUNG 5.1. Tổng quan về quản lý giao
tác 5.2. Sự hỗ trợ phân tử của các giao tác phân tán 5.2.1 Sự phục hồi trong các hệ thống tập trung 5.2.2
Các sự cố truyền thông trong CDSL phân tán 5.2.3 Khôi phục các giáo tác phân tán 5.2.4. Giao thức ủy
thác 2 pha
CHƯƠNG 5: QUẢN LÝ CÁC GIAO TÁC PHÂN TÁN MỤC ĐÍCH
Nhằm giải quyết một số vấn đề trong quá trình truyền thông của hệ phân tán như:
Độ tin cậy (reliabity)
Điều khiển tương tranh (concurrency control)
Hiệu quả sử dụng các tài nguyên của hệ thống .
Hiểu được việc quản lý giao tác phân tán là điều cần thiết để hiểu được sự liên quan giữa điều khiển tương
tranh, cơ chế phục hồi và cấu trúc của hệ thống.
4.1 GIỚI THIỆU VỀ XỬ LÝ TRUY VẤN
Mục đích của xử lý truy vấn :
Giảm thiểu thời gian xử lý
Giảm vùng nhớ trung gian
Giảm chi phí truyền thông giữa các trạm.
Chức năng của xử lý truy vấn :
Biến đổi một truy vấn ở mức cao thành một truy vấn tương đương ở mức thấp hơn.
Phép biến đổi này phải đạt được cả về tính đúng đắn và hiệu quả
Mỗi cách biến đổi dẫn đến việc sử dụng tài nguyên máy tính khác nhau, nên vấn đề đặt ra là lựa chọn
phương án nào dùng tài nguyên ít nhất .
4.2 XỬ LÝ TRUY VẤN TRONG MÔI TRƯỜNG TẬP TRUNG
Thuật toán INGRES
Ý tưởng thuật toán : Thuật toán tổ hợp hai giai đoạn phân rã và tối ưu hoá .
Đầu tiên phân rã câu truy vấn dạng phép toán quan hệ thành các phần nhỏ hơn. Câu truy vấn được phân rã
thành một chuỗi các truy vấn có một quan hệ chung duy nhất
Sau đó mỗi câu truy vấn đơn quan hệ được xử lí bởi một “ thể xử lý truy vấn một biến ” (one variable
query processor-OVQP)
OVQP tối ưu hoá việc truy xuất đến một quan hệ bằng cách dựa trên vị từ phương pháp truy xuất hữu hiệu
nhất đến quan hệ đó
Trước tiên OVQP sẽ thực hiện các phép toán đơn ngôi và giảm thiểu kích thước của các kết quả trung gian
bằng các tách (detachment) và thay thế (substitution)
q i để chỉ câu truy vấn q được phân rã thành hai câu truy→Kí hiệu q i-1 vấn con q i-1 và q i , trong đó q i-
1 được thực hiện trước và kết quả sẽ được q i sử dụng.
HẾT CHƯƠNG 5 CHƯƠNG 4: XỬ LÝ TRUY VẤN TRONG CSDL PHÂN TÁN