Phát triển các phương pháp dự phòng nâng cao độ tin cậy của hệ thống
TÓM TẮT
Độ tin cậy có vai trò then chốt trong sự phát triển kỹ thuật, nâng cao độ tin cậy giúp tránh được các
sự cố có thể xảy đối với hệ thống. Trong lý thuyết về độ tin cậy của hệ thống đã có nhiều phương
pháp khác nhau được đưa ra nhằm giải một bài toán duy nhất – tăng độ tin cậy của một hệ thống từ
những thành phần không tin cậy: dự phòng truyền thống, dự phòng bảo vệ tích cực Trong bài
báo này, chúng tôi đưa ra giải pháp kết hợp hai cấu trúc dự phòng để đem lại độ tin cậy cao hơn
của hệ thống.
Bạn đang xem tài liệu "Phát triển các phương pháp dự phòng nâng cao độ tin cậy của hệ thống", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
Tóm tắt nội dung tài liệu: Phát triển các phương pháp dự phòng nâng cao độ tin cậy của hệ thống
Lê Quang Minh và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 122(08): 59 - 66 59 PHÁT TRIỂN CÁC PHƯƠNG PHÁP DỰ PHÒNG NÂNG CAO ĐỘ TIN CẬY CỦA HỆ THỐNG Lê Quang Minh1, Triệu Xuân Hòa2*, Trần Thanh Thương3 1Viện Công nghệ thông tin – Trường Đại học Công nghệ - Đại học Quốc gia Hà Nội 2Trường Đại học Nông Lâm – ĐH Thái Nguyên, 3Đại học Thái Nguyên TÓM TẮT Độ tin cậy có vai trò then chốt trong sự phát triển kỹ thuật, nâng cao độ tin cậy giúp tránh được các sự cố có thể xảy đối với hệ thống. Trong lý thuyết về độ tin cậy của hệ thống đã có nhiều phương pháp khác nhau được đưa ra nhằm giải một bài toán duy nhất – tăng độ tin cậy của một hệ thống từ những thành phần không tin cậy: dự phòng truyền thống, dự phòng bảo vệ tích cực Trong bài báo này, chúng tôi đưa ra giải pháp kết hợp hai cấu trúc dự phòng để đem lại độ tin cậy cao hơn của hệ thống. Từ khóa: độ tin cậy, dự phòng truyền thống, bảo vệ chủ động tích cực. ĐẶT VẤN ĐỀ* Độ tin cậy là đặc tính then chốt trong sự phát triển kỹ thuật, đặc biệt là khi xuất hiện những hệ thống phức tạp nhằm hoàn thành những chức năng quan trọng trong các lĩnh vực khác nhau. Dựa vào độ tin cậy của hệ thống giúp chúng ta có được kế hoạch bảo trì, dự phòng, nâng cao độ tin cậy tránh được các sự cố có thể xảy ra. Hiện nay, các hệ thống tính toán kỹ thuật đang dần được ứng dụng rộng rãi trong các lĩnh vực hoạt động khác nhau của đời sốngxã hội.Các hệ thốngnày được biết đến trong nhiều lĩnh vực: hệ thống kiểm soát nhà máy điện hạt nhân, hệ thống máy tính trong hệ thống ngân hàng, các công ty chứng khoán, hệ thống máy tính trên máy bay, hệ thống thông tin liên lạc vệ tinh,.. Những hệ thống trên cần phải có khả năng phục hồi và khả năng tồn tại trong suốt thời gian hoạt động của hệ thống. Lý do là vì những thất bại của hệ thống có thể gây tổn thất lớn về kinh tế, để lại những hậu quả nghiêm trọng.. Trong lý thuyết về độ tin cậy của hệ thống đã có nhiều phương pháp khác nhau được đưa ra nhằm giải một bài toán duy nhất – tăng độ tin cậy của một hệ thống từ những thành phần không tin cậy. Tài liệu [3] và [4] đã xét đến * Tel: 0944 550007 các cấu trúc khác nhau của hệ thống với các thành phần dự phòng, nhằm bổ sung độ tin cậy như: cấu trúc dự phòng truyền thống; cấu trúc dự phòng bảo vệ tích cực – còn gọi là cấu trúc dự phòng bảo vệ chủ động. Trong nội dung bài báo này, chúng tôi nghiên cứu đưa ra giải pháp kết hợp hai cấu trúc dự phòng đểđem lại độ tin cậy của hệ thống cao hơn việc sử dụng cấu trúc dự phòng truyền thống. NỘI DUNG Xét một mô hình hệ thống mạng máy tính có cấu trúc dạng cây gồm 3 cấp: ở cấp độ đầu tiên có một bộ vi xử lý kiểm soát, cấp độ thứ hai có hai bộ vi xử lý điều khiển, cấp độ thứ ba có năm bộ vi xử lý dữ liệu như trong hình 1. Hình 1: Mô hình hệ thống mạng máy tính Để thuận lợi cho việc quan sát mô hình máy tính trên, giả định mỗi vị trí bộ vi xử lý dự phòng được coi là một node trên mô hình thực nghiệm. Ký hiệu: : node gốc (vi xử lý của hệ thống) : node dự phòng (vi xử lý dự phòng) Chúng ta xem xét ba phương pháp lựa chọn để cải thiện độ tin cậy của hệ thống “không phục hồi” [2] trong khi duy trì hiệu quả của nó: Lê Quang Minh và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 122(08): 59 - 66 60 1) Sử dụng một biến thể của phần cứng theo phương pháp dự phòng truyền thống. 2) Lựa chọn với sự ra đời của chi nhánh bổ sung trong cấu trúc của hệ thống cho việc tổ chức hoạt động bảo vệ: Dự phòng bảo vệ tích cực (Actice Protection - AP). 3) Sử dụng phương pháp lựa chọn kết hợp. Mô hình bài toán sử dụng dự phòng truyền thống Với mô hình bài toán hệ thống máy tính được trình bày ở trên chúng ta sẽ sử dụng các mô hình dự phòng để đánh giá mức độ tin cậy của hệ thống máy tính. Cấu hình hệ thống tương ứng với tùy chọn nghiên cứu phương pháp dự phòng truyền thống [5] thể hiện trong hình 2. Giả định rằng tất cả các bộ vi xử lý của kiểm soát và xử lý hệ thống là đồng nhất, trùng lặp được tất cả các tải: Ký hiệu: p: khả năng hoạt động không có sự thất bại của mỗi bộ xử lý. q: xác suất thất bại của một bộ xử lý. 1: khả năng phát hiện chính xác xác suất thất bại của các cặp. Theo định nghĩa độ tin cậy của hệ thống [1] ta có: p = p(t); q = 1-p. Với ký hiệu trên biểu hiện cho khả năng của hệ thống, do mỗi cặp có thể coi là một hệ thống gồm hai phần tử độc lập mắc song song X1, X2 với xác suất hoạt động an toàn cùng là p. Khi đó ta có độ tin cậy (sơ cấp và sao lưu) [5] của một cặp vi xử lý sẽ là Ps: P(X1vX2) = P(X1) + Q(X1).P(X2) = p + (1 - p).p = 2p - p2 = 2p(1 - p) + p2 = 2pq + p2 Với 1 là xác suất thất bại của mỗi cặp nên ta có: Ps=2 1pq + p2 (1) Sau khi chuyển đổi (1) ta có: Từ các cấu hình hệ thống với bộ vi xử lý dự phòng biểu thị cho khả năng hoạt động không có sự thất bại hệ thống viết như sau: 1 2 3 4 5 6 7 8 9 Hình 2: Cấu hình hệ thống với dự phòng 1: Cấu hình ban đầu; 2-9: Cấu hình với dự phòng Lê Quang Minh và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 122(08): 59 - 66 61 Trong đó: Pi - xác suất thất bại của phần tử thứ i (bộ xử lý) trong hệ thống N - số lượng các bộ vi xử lý trong hệ thống d - số lượng các cặp vi xử lý bản sao trong hệ thống. Từ biểu thức (2), chúng ta sẽ nhận được biểu thức xác suất hoạt động không có sự thất bại của mỗi một cấu hình của hệ thống cho trên hình 2. ; Mô hình bài toán dự phòng bảo vệ tích cực Cùng với mô hình bài toán hệ thống máy tính trên, chúng ta sẽ sử dụng phương án thứ hai – áp dụng dự phòng bảo vệ tích cực (AP) [5] cho hệ thống. Các cấu hình hệ thống khi áp dụng APđược thể hiện trong hình 3. Chúng ta xem xét một cấu hình thể hiện cho khả năng hoạt động không có sự thất bại của cấu hình số 10, như thể hiện trong hình 3. Số bộ xử lý không dự phòng trong hệ thống mà không được bảo vệ chủ động là 5. Do đó, xác suất thất bại của hệ thống phần này – p5. Tính toán xác suất hoạt động không thất bại cho phần bị bắt bởi lớp AP và bao gồm bốn bộ vi xử lý. Nguyên tắc linh hoạt nhất của AP - tức là bằng cách AP xác định lại bộ vi xử lý kiểm soát và kiểm soát ưu tiên thấp được sử dụng. Rõ ràng khả năng hoạt động không có sự thất bại này là một phần của hệ thống Рh bằng tổng xác suất hoạt động của cả bốn bộ vi xử lý (р4) và xác suất hoạt động của ba trong số bốn bộ vi xử lý. Trong đó: α1AP - phát hiện xác suất thất bại một tầng AP khi xảy ra. Biểu thức cuối cùng biểu thị cho khả năng hoạt động không có sự thất bại của hệ thống với cấu hình số 10 có thể viết như sau: Tương tự như vậy, biểu thức thể hiện cho khả năng hoạt động không có sự thất bại của hệ thống với cấu hình số 11: Giả định α2АP - khả năng phát hiện xác suất thất bại cho hai cấp AP. Hệ thống sau khi thất bại ở hai cấp độ đầu tiên AP sẽ được chuyển thành đơn cấp AP. Ngoài ra, giả định rằng đơn cấp AP là một hệ quả của sự biến đổi trong đó hai cấp AP và ban đầu hai cấp AP được tạo ra với việc sử dụng các nguyên tắc linh hoạt nhất của AP - tức là AP xác định lại bộ vi xử lý kiểm soát và kiểm soát ưu tiên thấp. 10 11 12 14 1615 13 Hình 3: Cấu hình hệ thống với AP Lê Quang Minh và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 122(08): 59 - 66 62 Cho các giả định và ký hiệu chúng ta nhận được biểu thức tính xác suất của khả năng hoạt động của hệ thống không có sự thất bại với cấu hình số 12, 13 như sau: Giả định α3АP - khả năng phát hiện xác suất thất bại cho ba cấp AP. Hệ thống sau khi thất bại ở ba cấp độ đầu tiên AP sẽ được chuyển thành hai cấp AP, khi thất bại ở hai cấp độ AP sẽ được chuyển thành đơn cấp AP. Với các giả định và ký hiệu như trên, ta nhận được biểu thức tính xác suất của khả năng hoạt động của hệ thống không có sự thất bại ở cấu hình 14-16 như sau: Với ; Đề xuất mô hình bài toán kết hợp dự phòng truyền thống và dự phòng bảo vệ tích cực Cấu hình tương ứng với kết hợp xây dựng phương án chịu lỗi hệ thống được hiển thị trong hình 4. 17 19 222120 18 Hình 4: Cấu hình hệ thống với AP và nhân bản Cho các giả định và ký hiệu viết biểu thức tính xác suất của khả năng hoạt động hệ thống không có sự thất bại với cấu hình số 17-23: Với Lê Quang Minh và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 122(08): 59 - 66 63 Tương ứng với các cấu hình hệ thống số 1-22, ta đã xác định đượccác biểu thức xác suất hoạt động không có sự thất bại của hệ thống P[1] – P[22]. Với P[1] – P[9]: biểu thức xác suất hoạt động không có sự thất bại của mỗi một cấu hình hệ thống khi áp dụng phương pháp dự phòng truyền thống; P[10] – P[16]: biểu thức xác suất hoạt động không có sự thất bại của mỗi một cấu hình hệ thống khi áp dụng AP. P[17] – P[22]: biểu thức xác suất hoạt động không có sự thất bại của mỗi một cấu hình hệ thống khi áp dụng kết hợp dự phòng truyền thống và AP. Khi tính toán xác suất P[i] (i = 1 .. 22) đã được sử dụng các đầu vào sau: thời gian hoạt động phân phối xác suất của mỗi bộ vi xử lý trong hệ thống tương ứng với theo cấp số nhân P(t) = exp(-λt); tỷ lệ thất bại λ = 7*10-7 h-1 [2]; α1АP =0,8; α2АP =1-(1- α1АP)2=0,96; α3АP =1-(1- α1АP)3= 0,992; α1=0,8; thời gian hoạt động hệ thống - 61.320 giờ (7 năm). Với các đầu vào như trên, ta có bảng xác suất hoạt động không có sự thất bại của hệ thống tương ứng với mỗi một cấu hình như sau. Cấu hình 1 năm 2 năm 3 năm 4 năm 5 năm 6 năm 7 năm Số 1 0,9521 0,9065 0,8631 0,8218 0,7825 0,7450 0,7094 Số 2 0,9556 0,9133 0,8728 0,8341 0,7971 0,7618 0,7280 Số 3 0,9592 0,9200 0,8825 0,8465 0,8120 0,7789 0,7472 Số 4 0,9627 0,9268 0,8923 0,8591 0,8272 0,7964 0,7668 Số 5 0,9663 0,9337 0,9023 0,8719 0,8426 0,8143 0,7870 Số 6 0,9698 0,9406 0,9123 0,8849 0,8584 0,8326 0,8077 Số 7 0,9734 0,9476 0,9225 0,8981 0,8744 0,8514 0,8290 Số 8 0,9770 0,9546 0,9327 0,9115 0,8907 0,8705 0,8508 Số 9 0,9806 0,9617 0,9431 0,9250 0,9074 0,8901 0,8732 Số 10 0,9649 0,9309 0,8978 0,8656 0,8345 0,8042 0,7749 Số 11 0,9732 0,9467 0,9207 0,8950 0,8697 0,8449 0,8205 Số 12 0,9769 0,9541 0,9316 0,9094 0,8876 0,8662 0,8450 Số 13 0,9795 0,9594 0,9395 0,9198 0,9005 0,8814 0,8625 Số 14 0,9805 0,9613 0,9424 0,9237 0,9054 0,8873 0,8696 Số 15 0,9764 0,9524 0,9280 0,9035 0,8788 0,8540 0,8294 Số 16 0,9901 0,9797 0,9686 0,9568 0,9444 0,9313 0,9177 Số 17 0,9758 0,9500 0,9230 0,8951 0,8666 0,8378 0,8089 Số 18 0,9805 0,9611 0,9420 0,9230 0,9042 0,8856 0,8673 Số 19 0,9841 0,9684 0,9529 0,9375 0,9223 0,9073 0,8924 Số 20 0,9877 0,9754 0,9631 0,9507 0,9383 0,9259 0,9135 Số 21 0,9800 0,9594 0,9384 0,9169 0,8952 0,8732 0,8512 Số 22 0,9938 0,9869 0,9794 0,9711 0,9620 0,9523 0,9418 Phân tích các giá trị trong bảng cho thấy ưu điểm của việc sử dụng AP so với dự phòng truyền thống với cùng một số bộ vi xử lý cần thiết. Ví dụ: cấu hình 4 và cấu hình 12 đều sử dụng 3 bộ vi xử lý dự phòng, độ tin cậy của cấu hình 4 sau 7 năm là 0,7668 trong khi cấu hình 12 đạt độ tin cậy là 0,8450. Có thể nhận thấy, với cùng một số lượng thiết bị dự phòng, AP kiểm soát bao gồm hầu hết các phần của hệ thống (hoặc phát hiện lỗi nhiều khả năng), do đó làm tăng khả năng quan sát của hệ Lê Quang Minh và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 122(08): 59 - 66 64 thống và cung cấp cái gọi là phòng ảo - phòng bộ vi xử lý chính với ít nhất một phần tử dự phòng nâng cao khả năng kiểm soát của hệ thống. Với cấu hình số 12, khi ta áp dụng kết hợp cả dự phòng truyền thống và AP, ta có các cấu hình 18, 20 với độ tin cậy được tăng lên lần lượt là 0,8673 và 0,9135. Hình 5 cho thấy đồ thị của xác suất khả năng hoạt động không có sự thất bại hệ thống với cấu hình số 1, số 4, số 12, số 18, số 20 theo thời gian. Hình 5: Đồ thị xác suất khả năng hoạt động không có sự thất bại của hệ thống với cấu hình số 1, số 4, số 12, số 18, số 20 theo thời gian Tiếp tục xem xét các trường hợp nhân bản ba cấu hình số 20,thể hiện trong hình 6. 23 24 22 Hình 6: Cấu hình hệ thống với AP và nhân bản dự phòng chập ba Biểu thị РТР - xác suất của các bộ vi xử lý ba trong trường hợp dự phòng chập ba; 2- phát hiện xác suất thất bại trong 3 bộ vi xử lý trong trường hợp dự phòngchập ba. Chúng tôi tin rằng sau khi phát hiện sự thất bại của một bộ xử lý trong dự phòng chập ba sẽ được chuyển đến trùng lặp với khả năng phát hiện chính xác của sự thất bại trong một cặp 1. Cho các giả định và ký hiệu, tương tự: Biểu hiện cho khả năng hoạt động không có sự thất bại của hệ thống với cấu hình số 23-24 sẽ tính như sau: Cấu hình số 23, 24 cung cấp khả năng hoạt động không có sự thất bại của hệ thống là 0,9222 và 0,9390. Hình 7 cho thấy đồ thị của xác suất hoạt động không có sự thất bại hệ thống với cấu hình số 1, số 20, số 23, số 24. Lê Quang Minh và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 122(08): 59 - 66 65 Hình 7: Đồ thị xác suất khả năng hoạt động không có sự thất bại của hệ thống với cấu hình số 1, số 20, số 23, số 24 theo thời gian So với cấu hình ban đầu, hệ thống sau khi dự phòng với AP kết hợp nhân bản (cấu hình số 20, số 22, số 23, số 24) có độ tin cậy tăng từ 28,78% - 32,77%. Hiệu quả hơn so với việc chỉ áp dụng dự phòng truyền thống hoặc dự phòng bảo vệ tích cực. KẾT LUẬN Bài báo đã đưa ra phương pháp tiếp cận hợp lý nhất để nâng cao độ tin cậy của hệ thống là sử dụng phương pháp dự phòng truyền thống và phương pháp dự phòng tích cực (nhân bản ba) ở bộ vi xử lý kiểm soát kết hợp với bộ vi xử lý bảo mật dữ liệu hoạt động cấp độ cao. Kết quả đánh giá cho thấy xác suất độ tin cậy của hệ thống trong suốt 7 năm không nhỏ hơn 0,9 đảm bảo độ tin cậy hệ thống:So với cấu hình ban đầu (cấu hình 1, độ tin cậy của hệ thống sau 7 năm chỉ đạt: 0,7094), hệ thống sau khi dự phòng (cấu hình số 16, số 20, số 23, số 24, số 22) có độ tin cậy đạt trong khoảng 0,9177 – 0,9418 (tăng từ 28,78% - 32,77%). Hiệu quả hơn so với việc chỉ áp dụng dự phòng truyền thống hoặc dự phòng bảo vệ tích cực. Việc phân tích hiệu quả độ tin cậy của hệ thống và ứng dụng phương pháp bảo vệ chủ động nhằm chống lại những thất bại trong việc kiểm soát phân cấp các hệ thống tính toán thời gian thực - thể hiện cho khả năng hoạt động không có sự thất bại của hệ thống với các cấu hình khác nhau. TÀI LIỆU THAM KHẢO 1. Phan Văn Khôi (2001), Cơ sở đánh giá độ tin cậy, Nhà xuất bản Khoa học và Kỹ thuật. 2. Nguyễn Duy Việt (4/2011), “Tính độ tin cậy của hệ thống không phục hồi”, tạp chí Khoa học Giao thông Vận tải, tr2-4. 3. Шубинский И.Б. и др. «Активная защита от отказов управляющих модульных вычислительных систем» //СПб.:Наука, 1993, -284с. 4. Иыуду К.А. «Расчет надежности вычислительных и управляющих машин и систем летательных аппаратов» // М.: МАИ, 1978, - 55с. 5. Le Quang Minh, Романовский А.С., к.т.н., доц, (2007) “ОЦЕНКА ЭФФЕКТИВНОСТИ ПРИМЕНЕНИЯ МЕТОДОВ АКТИВНОЙ ЗАЩИТЫ ОТ ОТКАЗОВ В ИЕРАРХИЧЕСКИХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ” Lê Quang Minh và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 122(08): 59 - 66 66 SUMMARY DEVELOPMENT OF PROVISION METHOD TO ENHANCE SYSTEM RELIABILITY Le Quang Minh1, Trieu Xuan Hoa2*, Tran Thanh Thuong3 1College of Engineering and Technology – VNU, 2College of Agriculture and Forestry – TNU, 3Thai Nguyen University Reality plays an important role in technical development, enhancing reality can prevent some problems in the system. In theory of system reality, lots of solutions have been proposed to enhance reality of a system from unreality components: traditional standby, active protection standby... In this article, both standby solutions are combined to get an optimal reality system. Keywords: Reliability, Traditional Standby, Active Protection Ngày nhận bài:12/7/2014; Ngày phản biện:26/7/2014; Ngày duyệt đăng: 25/8/2014 Phản biện khoa học: TS. Vũ Đức Thái – Trường Đại học Công nghệ Thông tin & Truyền thông - ĐHTN * Tel: 0944 550007
File đính kèm:
- phat_trien_cac_phuong_phap_du_phong_nang_cao_do_tin_cay_cua.pdf