Bài giảng Cấu trúc dữ liệu và giải thuật - Chương 6: Giải thuật sắp xếp - Ngô Công Thắng

Chương 6: Giải thuật sắp xếp

1. Sắp xếp chọn (Selection Sort)

2. Sắp xếp chèn (Insert Sort)

3. Sắp xếp nổi bọt (Bubble Sort)

4. Sắp xếp nhanh (Quick Sort)

5. Sắp xếp vun đống (Heap Sort)

6. Sắp xếp hòa nhập (Merge Sort)

pdf 9 trang yennguyen 6961
Bạn đang xem tài liệu "Bài giảng Cấu trúc dữ liệu và giải thuật - Chương 6: Giải thuật sắp xếp - Ngô Công Thắng", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Bài giảng Cấu trúc dữ liệu và giải thuật - Chương 6: Giải thuật sắp xếp - Ngô Công Thắng

Bài giảng Cấu trúc dữ liệu và giải thuật - Chương 6: Giải thuật sắp xếp - Ngô Công Thắng
CHƯƠNG 6
GIẢI THUẬT SẮP XẾP
GV. Ngô Công Thắng
Bộ môn Công nghệ phần mềm
Khoa Công nghệ thông tin
Website: dse.vnua.edu.vn/ncthang
Email: ncthang@vnua.edu.vn
Chương 6: Giải thuật sắp xếp
1. Sắp xếp chọn (Selection Sort)
2. Sắp xếp chèn (Insert Sort)
3. Sắp xếp nổi bọt (Bubble Sort)
4. Sắp xếp nhanh (Quick Sort)
5. Sắp xếp vun đống (Heap Sort)
6. Sắp xếp hòa nhập (Merge Sort)
Ngô Công Thắng Bài giàng CTDL> - Chương 06 6.2
1. Sắp xếp chọn (Selection Sort)
1.1. Phương pháp
• Giả sử cần sắp xếp tăng dần một dãy khoá 
a1, a2,..., an.
• Ý tưởng của thuật toán như sau:
– Chọn phần tử có khoá nhỏ nhất .
– Đổi chỗ nó với phần tử a1. 
– Sau đó lặp lại thao tác trên với n-1 phần tử 
còn lại, rồi lại lặp lại như trên với n-2 phần tử 
còn lại,..., cho tới khi chỉ còn 1 phần tử.
Ngô Công Thắng Bài giàng CTDL> - Chương 06 6.3
1.1. Phương pháp (tiếp)
• Ví dụ:
Cho dãy khoá ban đầu là: 6, 10, 1, 8, 9
với n=5.
i=1 1, 10, 6, 8, 9
i=2 1, 6, 10, 8, 9
i=3 1, 6, 8, 10, 9
i=4 1, 6, 8, 9, 10
Ngô Công Thắng Bài giàng CTDL> - Chương 06 6.4
1.1. Phương pháp (tiếp)
Procedure Selection_sort(a,n);
For i:= 1 to n-1 Do 
Begin 
{Tìm phần tử nhỏ nhất ở vị trí k }
k:=i; 
For j:=i+1 To n Do 
If a[j] < a[k] then k:=j
{Đổi chỗ phần tử nhỏ nhất k cho phần tử i}
If k ≠ i then a[k]«a[i];
End
Return
Ngô Công Thắng Bài giàng CTDL> - Chương 06 6.5
2.2. Đánh giá giải thuật
Ngô Công Thắng Bài giàng CTDL> - Chương 06
• Với giải thuật trình bày ở trên thì phép toán tích cực 
là phép so sánh (a[j]<a[k]).
• Gọi C là số lượng phép so sánh, C được tính như sau: 
Ở lượt thứ i (i=1, 2, , n-1), để tìm khoá nhỏ nhất 
cần n-i phép so sánh. Số lượng phép so sánh này 
không phụ thuộc vào tình trạng ban đầu của dãy 
khoá. Do đó ta có:
• Vậy, độ phức tạp tính toán là O(n2)
6.6
2. Sắp xếp chèn (Insert Sort)
2.1. Phương pháp
• Phương pháp này được những người chơi bài hay 
dùng.
• Giả sử cần sắp xếp tăng dần dãy khoá a1, a2,..., an. Ý 
tưởng thuật toán như sau:
– Các phần tử được chia thành dãy đích: a1,..., ai-1 (kết quả) 
và dãy nguồn ai,..., an.
– Bắt đầu với i=2, ở mỗi bước phần tử thứ i của dãy nguồn 
được lấy ra và chèn vào vị trí thích hợp trong dãy đích sao 
cho dãy đích vẫn tăng dần. Sau đó i tăng lên 1 và lặp lại.
Ngô Công Thắng Bài giàng CTDL> - Chương 06 6.7
2.1. Phương pháp
• Ví dụ: Cho dãy khoá 6, 10, 1, 7, 4 với n=5 (dãy 
số có 5 phần tử).
Dãy đích Dãy nguồn
6 10, 1, 7, 4
i=2 6, 10 1, 7, 4
i=3 1, 6, 10 7, 4
i=4 1, 6, 7, 10 4
i=5 1, 4, 6, 7, 10
Ngô Công Thắng Bài giàng CTDL> - Chương 06 6.8
Thủ tục chèn
Procedure Insert_sort(a,n)
1) a[0]:=-¥
2) For i:=2 to n Do 
Begin 
tg:=a[i]; j:=i-1;
While tg<a[j] Do
Begin
a[j+1]:=a[j]; j:=j-1;
End;
a[j+1]:=tg; {đưa tg vào đúng vi trí}
End;
Return
Ngô Công Thắng Bài giàng CTDL> - Chương 06 6.9
2.2. Đánh giá thuật toán
• Phép toán tích cực trong thuật toán này là 
phép so sánh (tg<a[j]). Số phép toán so sánh C 
được tính như sau:
– Trường hợp thuận lợi nhất là dãy khoá a1, a2,..., an
đã được sắp, như vậy mỗi lần chỉ cần 1 phép so 
sánh. Do vậy
Ngô Công Thắng Bài giàng CTDL> - Chương 06 6.10
2.2. Đánh giá thuật toán
• Trường hợp xấu nhất nếu dãy khoá sắp theo thứ tự ngược với 
thứ tự sắp xếp thì ở lượt i cần có: C= (i-1) phép so sánh. Do 
vậy
• Trường hợp trung bình: Giả sử mọi giá trị khoá đều xuất hiện 
đồng khả năng thì trung bình phép so sánh ở lượt thứ i là Ci = 
i/2, do đó số phép so sánh trung bình của giải thuật này là:
• O(n2)
Ngô Công Thắng Bài giàng CTDL> - Chương 06 6.11
3. Sắp xếp nổi bọt (Bubble Sort)
3.1. Phương pháp
• Giả sử cần sắp xếp tăng dần dãy khoá a1, a2,..., an. Ý 
tưởng thuật toán như sau:
– Đổi chỗ các phần tử liền kề nhau theo thứ tự tăng 
dần, lần thứ nhất số nhỏ nhất của dãy được đẩy lên vị 
trí đầu tiên (gọi là phần tử được sắp).
– Tiếp tục đổi chỗ các phần tử liền kề của dãy chưa 
sắp, lần thứ 2 ta được số nhỏ nhất của dãy chưa sắp 
được đưa lên đầu dãy chưa sắp.
– Cứ tiếp tục làm tương tự như trên cho đến khi dãy chỉ 
còn 1 phần tử.
Ngô Công Thắng Bài giàng CTDL> - Chương 06 6.12
3.1. Phương pháp (tiếp)
• Ví dụ: Cho dãy khoá ban đầu là: 6, 3, 7, 
10, 1, 8 với n=6.
6, 3, 7, 10, 1, 8
i=1 1, 6, 3, 7, 10, 8 
i=2 1, 3, 6, 7, 8, 10 
i=3 1, 3, 6, 7, 8, 10 
i=4 1, 3, 6, 7, 8, 10 
i=5 1, 3, 6, 7, 8, 10 
Ngô Công Thắng Bài giàng CTDL> - Chương 06 6.13
Thủ tục sắp xếp nổi bọt
Procedure Bubble_sort(a,n)
For i:= 1 to n-1 Do 
For j:= n downto i+1 Do
If a[j]<a[j-1] then
a[j] a[j-1];
Return
Ngô Công Thắng Bài giàng CTDL> - Chương 06 6.14
3.2. Đánh giá thuật toán
• Giải thuật này tương tự như giải thuật sắp xếp bằng 
cách chọn trực tiếp (mục 1), do đó có:
• Nhận xét: Với 3 phương pháp sắp xếp trên, nếu n 
vừa và nhỏ thì phương pháp chèn trực tiếp (insert 
sort) tỏ ra tốt hơn, nếu với n lớn thì cả 3 phương 
pháp đều có cấp O(n2), đây là một chi phí thời gian 
khá cao.
Ngô Công Thắng Bài giàng CTDL> - Chương 06 6.15
4. Sắp xếp nhanh (Quick Sort)
4.1. Phương pháp
• Sắp xếp nhanh (quick sort) còn được sắp xếp phân 
đoạn (partition sort).
• Ý tưởng thuật toán:
– Chọn ngẫu nhiên một phần tử x.
– Duyệt từ bên trái mảng cho tới khi có một phần tử 
ai>=x
– Sau đó duyệt từ bên phải mảng cho tới khi có một 
phần tử aj=<x
– Đổi chỗ ai và aj
– Tiếp tục duyệt và đổi chỗ cho tới khi 2 phía gặp nhau.
Ngô Công Thắng Bài giàng CTDL> - Chương 06 6.16
4.1. Phương pháp (tiếp)
• Kết quả mảng được chia thành 2 phần: 
bên trái là các phần tử < x, bên phải là các 
phần tử > x.
Ngô Công Thắng Bài giàng CTDL> - Chương 06 6.17
Thủ tục sắp xếp nhanh
Procedure Q_sort(L,R);
1) If L>=R then return;
2) i:=L; j:=R ; k:=(L+R) div 2;
3) x:=a[k];
4) Repeat
While a[i] <x Do i:=i+1;
While a[j] >x Do j:=j-1;
If i<j then a[i] « a[j]
Until i=j
5) Call Q_sort(L,j-1); { Thực hiện trên nửa <x }
6) Call Q_sort(j+1,R); { Thực hiện trên nửa >x }
Return
Ngô Công Thắng Bài giàng CTDL> - Chương 06 6.18
4.2. Đánh giá
• Người ta đã chứng minh được thời gian trung 
bình thực hiện giải thuật là:
Ttb= O(nlog2n)
• Như vậy, với n khá lớn Quick sort có hiệu lực 
hơn 3 thuật giải trên.
Ngô Công Thắng Bài giàng CTDL> - Chương 06 6.19
5. Sắp xếp vun đống (Heap Sort)
5.1. Phương pháp
• Một cây nhị phân có chiều cao h được gọi là 
đống khi:
– Là cây nhị phân hoàn chỉnh mà các nút lá ở mức h-
1 phải nằm phía bên trái.
– Khoá ở nút cha bao giờ cũng lớn hơn khoá ở nút 
con.
Ngô Công Thắng Bài giàng CTDL> - Chương 06 6.20
5. Sắp xếp vun đống (Heap Sort)
5.1. Phương pháp
• Thuật toán sắp xếp vun đống chia làm 2 giai 
đoạn.
• Giai đoạn 1: Tạo đống.
Ngô Công Thắng Bài giàng CTDL> - Chương 06 6.21
Ngô Công Thắng Bài giàng CTDL> - Chương 06 6.22
Ngô Công Thắng Bài giàng CTDL> - Chương 06 6.23
Ngô Công Thắng Bài giàng CTDL> - Chương 06 6.24
Ngô Công Thắng Bài giàng CTDL> - Chương 06 6.25
- Lặp lại các bước tương tự cho các cây còn lại. 
Cuối cùng ta thu được dãy đã sắp là s=(11, 23, 42, 58, 65, 
74)
* Giải thuật vun đống:
- Một lá coi như cây con là một đống.
- Thuật toán tiến hành từ đáy lên: Chuyển đổi thành đống 
cho một cây con mà cây con trái và cây con phải của gốc đã 
là một đống.
Cây nhị phân hoàn chỉnh có n nút thì với chỉ số [n/2] trở lên 
có thể là nút cha: [n/2], [n/2 ]-1, . . . , 1.
Ngô Công Thắng Bài giàng CTDL> - Chương 06 6.26
a) Thủ tục vun đống:
Chỉnh lý cây nhị phân con hoàn chỉnh gốc i trên cây nhị 
phân có n nút để trở thành “đống” với điều kiện cây con 
trái và cây con phải có gốc là 2i và 2i+1 đã là đống.
Procedure ADJUST(i,n)
1. { Khởi đầu }
Key:=K[i]; j:=2*i;
2. { Chọn con ứng với khoá lớn nhất trong 2 con của i }
While j<=n Do 
Begin
If (j<n) and (K[j]<K[j+1]) then j:=j+1;
Ngô Công Thắng Bài giàng CTDL> - Chương 06 6.27
a) Thủ tục vun đống:
3. { So sánh khoá cha với khoá lớn nhất }
If Key > K[j] then Begin
K[j/2]:=Key;
Return;
End;
K[j/2]:=K[j]; j:=2*j;
End; {Kết thúc while}
4. { Đưa Key vào vị trí của nó }
K[j/2]:=Key;
5. Return;
Ngô Công Thắng Bài giàng CTDL> - Chương 06 6.28
b) Thủ tục sắp xếp vun đống:
Procedure Heap_Sort(K,n)
1. { Tạo đống ban đầu }
For i:=[n/2] Downto 1 Do 
Call ADJUST(i,n)
2. { Sắp xếp }
For i:= n-1 Downto 1 Do 
Begin
tg:=K[1]; K[1]:=K[i+1];
K[i+1]:=tg;
Call ADJUST(1,i);
End;
3. Return
5.2. Đánh giá
Thời gian thực hiện trung bình của giải thuật này là O(nlog2n).Ngô Công Thắng Bài giàng CTDL> - Chương 06 6.29
6. Sắp xếp kiểu hoà nhập ( MERGE SORT)
6.1. Phép hoà nhập 2 đường
Thực hiện hợp nhất các bản ghi của 2 bảng đã được sắp 
xếp thành 1 bảng được sắp.
a) Phương pháp:
So sánh 2 khoá nhỏ nhất ( hoặc lớn nhất của 2 bảng) để 
đưa vào miền sắp xếp.
Quá trình cứ tiếp tục cho tới khi 2 bảng đã cạn.
b) Giải thuật:
Bảng 1: (xb, ..., xm )
Bảng 2: (xm+1, ..., xn )
Bảng sắp: (zb, ..., zn)
Ví dụ: Bảng 1: (3, 5, 10, 16 )
Bảng 2: (1, 4, 15 )
Bảng sắp: (1, 3, 4, 5, 10, 15, 16)Ngô Công Thắng Bài giàng CTDL> - Chương 06 6.30
* Thủ tục như sau:
Procedure MERGE(X,b,m,n,Z);
1. i:=k:=b; j:=m+1;
2. While (i<=m) and (j<=n) Do 
Begin If x[i]<=x[j] then 
Begin Z[k]:=x[i];
i:=i+1;
End
Else Begin z[k]:=x[j];
j:=j+1;
End;
k:=k+1;
End;Ngô Công Thắng Bài giàng CTDL> - Chương 06 6.31
* Thủ tục như sau:
3. { Một trong 2 bảng con đã cạn }
If i>m then (zk, ..., zn):= (xj, ..., xn)
Else (zk, ..., zn):= (xi, ..., xm)
4. Return
Ngô Công Thắng Bài giàng CTDL> - Chương 06 6.32
6.2. Sắp xếp kiểu hòa nhập trực tiếp (Straight two way 
merge )
* Bảng con đã được sắp gọi là một mạch ( run).
* Mỗi bản ghi coi như 1 mạch có độ dài ( kích thước ) 
là 1. Nếu hoà nhập 2 bảng như vậy ta được 1 mạch 
mới có độ dài =2. Hoà nhập 2 mạch có độ dài là 2 ta 
được một mạch có độ dài là 4, ...
* Thủ tục MPASS thực hiện một bước của sắp xếp 
hoà nhập. Nó hòa nhập từng cặp mạch kề cận nhau, 
có độ dài L, từ bảng X sang bảng Y, n là số lượng 
khoá ( bản ghi ) trong X.
Ngô Công Thắng Bài giàng CTDL> - Chương 06 6.33
Procedure MPASS(X,Y,n,L)
1. i:=1;
2. Hoà nhập cặp mạch có độ dài L }
While i<= n-(2L-1) Do
Begin Call MERGE(X,i,i+L-1,i+2L-1, Y)
i:=i+2L;
End;
3. { Hoà nhập cặp mạch còn lại cuối cùng với tổng 
độ dài <2L}
If i+L-1 <n then Call MERGE(X,i,i+L-1,n,Y)
Else (yi, ..., yn):= (xi, ..., xn);
4. Return
Ngô Công Thắng Bài giàng CTDL> - Chương 06 6.34
Ngô Công Thắng Bài giàng CTDL> - Chương 06 6.35
6.3. Đánh giá
Thời gian thực hiện trung bình của giải thuật 
là:
Ttb = O(nlog2n)
* Nhận xét chung:
- Với n nhỏ có thể dùng các phương pháp: 
chọn trực tiếp, chèn trực tiếp, đổi chỗ trực 
tiếp.
- Với n lớn: Nếu dãy khoá không sắp dùng 
Quick sort, nếu dãy khoá có sắp dùng Heap 
sort.Ngô Công Thắng Bài giàng CTDL> - Chương 06 6.36

File đính kèm:

  • pdfbai_giang_cau_truc_du_lieu_va_giai_thuat_chuong_6_giai_thuat.pdf