Bài giảng Lý thuyết thông tin
Chƣơng 1: Khái niệm chung.
Chƣơng này giới thiệu những khái niệm và các vấn đề cơ bản trong lý thuyết truyền
tin nhƣ thông tin, tín hiệu, mô hình của hệ thống truyền tin gồm những thành phần nào và
các tham số cơ bản của hệ thống là gì. Mặt khác chƣơng này cũng nhắc lại phƣơng pháp
rời rạc hóa một nguồn tin liên tục thành nguồn rời rạc. Cuối chƣơng đƣa ra khái niệm về độ
đo thông tin và nhắc lại những cơ sở toán học cần thiết cho việc khảo sát các hệ thống
truyền tin.
Chƣơng 2: Thông tin
Chƣơng này trình bày những vấn đề về định lƣợng thông tin của nguồn tin nhƣ
lƣợng tin riêng, lƣợng tin trung bình, lƣợng tin tƣơng hỗ, lƣợng tin có điều kiện (vì tín hiệu
truyền trên kênh bị nhiễu tác động nên khi thu đƣợc tín hiệu ta phải tìm khả năng đầu phát
đã phát đi tín hiệu nào vì vậy chƣơng này liên quan nhiều đến xác suất. Cụ thể là xác suất
riêng, xác suất đồng thời và xác suất có điều kiện và mối liên hệ chúng). Sau đó tập trung
giải quyết các vấn đề về entropy để đo lƣợng tin không chắc chắn của một sự kiện hay
phân phối ngẫu nhiên cũng nhƣ các tính chất của nó. Khi tín hiệu đƣợc truyền đi trên kênh
nên chƣơng này cũng đƣa ra các loại kênh truyền và các tham số kỹ thuật của kênh đồng
thời xác định độ không chắc chắn khi nhận đƣợc một tin cụ thể đã bị nhiễu phá hủy một
phần trên kênh từ đó tính toán dung lƣợng C của kênh truyền để xác định giới hạn trên của
tốc độ mà ta có thể truyền không lỗi.
Phần cuối của chƣơng sẽ đề cập đến việc giải mã (tức nhận đƣợc một tin ta phải đi
tìm tin nào đã đƣợc truyền đi ở bên phát). Sau đó tính các xác suất truyền sai một từ mã và
xác suất truyền sai trung bình.
Chƣơng 3: Mã hiệu.
Chƣơng này ta tập trung vào các khả năng và các định nghĩa về mã cũng nhƣ các
điều kiện và yêu cầu đối với mã hiệu, tức là đƣa ra các phƣơng pháp để lựa chọn, kiểm tra
một bộ mã là phân tách đƣợc và khi nào thì có thể giải mã (độ chậm giải mã). Phần cuối
của chƣơng nói về việc lập một bộ mã hệ thống.
Chƣơng 4: Mã hóa nguồn.
Chƣơng này nghiên cứu các vấn đề mã hóa nguồn trên cơ sở mô hình toán học của
nguồn và các khả năng về lƣợng tin đã xét. Cụ thể chƣơng này đề cập đến 3 phƣơng pháp
mã hóa để loại bỏ sự dƣ thừa của thông tin. Ba phƣơng pháp đó là:
Phƣơng pháp mã hóa Shannon.
Phƣơng pháp mã hóa Fano.
Phƣơng pháp mã hóa Huffman.
Mỗi phƣơng pháp đều đƣa ra phƣơng pháp chuyển các tin thành các từ mã dựa vào
xác suất xuất hiện của nó (tức là các tin có xác suất xuất hiện bé thì mã hóa bằng từ mã có
chiều dài lớn và các tin có xác suất xuất hiện lớn thì mã hóa bằng từ mã có chiều dài nhỏ)
và sau đó tính hiệu suất lập mã.
Tóm tắt nội dung tài liệu: Bài giảng Lý thuyết thông tin
TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT HƯNG YÊN KHOA ĐIỆN-ĐIỆN TỬ BÀI GIẢNG LÝ THUYẾT THÔNG TIN Hưng Yên 2015 (Tài liệu lưu hành nội bộ) TỔNG QUAN VỀ MÔN HỌC Chƣơng 1: Khái niệm chung. Chƣơng này giới thiệu những khái niệm và các vấn đề cơ bản trong lý thuyết truyền tin nhƣ thông tin, tín hiệu, mô hình của hệ thống truyền tin gồm những thành phần nào và các tham số cơ bản của hệ thống là gì. Mặt khác chƣơng này cũng nhắc lại phƣơng pháp rời rạc hóa một nguồn tin liên tục thành nguồn rời rạc. Cuối chƣơng đƣa ra khái niệm về độ đo thông tin và nhắc lại những cơ sở toán học cần thiết cho việc khảo sát các hệ thống truyền tin. Chƣơng 2: Thông tin Chƣơng này trình bày những vấn đề về định lƣợng thông tin của nguồn tin nhƣ lƣợng tin riêng, lƣợng tin trung bình, lƣợng tin tƣơng hỗ, lƣợng tin có điều kiện (vì tín hiệu truyền trên kênh bị nhiễu tác động nên khi thu đƣợc tín hiệu ta phải tìm khả năng đầu phát đã phát đi tín hiệu nào vì vậy chƣơng này liên quan nhiều đến xác suất. Cụ thể là xác suất riêng, xác suất đồng thời và xác suất có điều kiện và mối liên hệ chúng). Sau đó tập trung giải quyết các vấn đề về entropy để đo lƣợng tin không chắc chắn của một sự kiện hay phân phối ngẫu nhiên cũng nhƣ các tính chất của nó. Khi tín hiệu đƣợc truyền đi trên kênh nên chƣơng này cũng đƣa ra các loại kênh truyền và các tham số kỹ thuật của kênh đồng thời xác định độ không chắc chắn khi nhận đƣợc một tin cụ thể đã bị nhiễu phá hủy một phần trên kênh từ đó tính toán dung lƣợng C của kênh truyền để xác định giới hạn trên của tốc độ mà ta có thể truyền không lỗi. Phần cuối của chƣơng sẽ đề cập đến việc giải mã (tức nhận đƣợc một tin ta phải đi tìm tin nào đã đƣợc truyền đi ở bên phát). Sau đó tính các xác suất truyền sai một từ mã và xác suất truyền sai trung bình. Chƣơng 3: Mã hiệu. Chƣơng này ta tập trung vào các khả năng và các định nghĩa về mã cũng nhƣ các điều kiện và yêu cầu đối với mã hiệu, tức là đƣa ra các phƣơng pháp để lựa chọn, kiểm tra một bộ mã là phân tách đƣợc và khi nào thì có thể giải mã (độ chậm giải mã). Phần cuối của chƣơng nói về việc lập một bộ mã hệ thống. Chƣơng 4: Mã hóa nguồn. Chƣơng này nghiên cứu các vấn đề mã hóa nguồn trên cơ sở mô hình toán học của nguồn và các khả năng về lƣợng tin đã xét. Cụ thể chƣơng này đề cập đến 3 phƣơng pháp mã hóa để loại bỏ sự dƣ thừa của thông tin. Ba phƣơng pháp đó là: Phƣơng pháp mã hóa Shannon. Phƣơng pháp mã hóa Fano. Phƣơng pháp mã hóa Huffman. Mỗi phƣơng pháp đều đƣa ra phƣơng pháp chuyển các tin thành các từ mã dựa vào xác suất xuất hiện của nó (tức là các tin có xác suất xuất hiện bé thì mã hóa bằng từ mã có chiều dài lớn và các tin có xác suất xuất hiện lớn thì mã hóa bằng từ mã có chiều dài nhỏ) và sau đó tính hiệu suất lập mã. §Ò c-¬ng bµi gi¶ng M«n: Lý thuyÕt th«ng tin 2 Chƣơng 5. Mã phát hiện lỗi và sửa lỗi Trong chƣơng 4 ta nghiên cứu các phƣơng pháp để giảm chiều dài trung bình của một bộ mã dựa vào xác suất xuất hiện của từng lớp tin thì trong chƣơng này ta lại thêm vào một số bít kiểm tra để phát hiện sai và sửa sai để đảm bảo chất lƣợng. Cụ thể ta nghiên cứu đến 4 loại mã là: Mã khối tuyến tính. Mã Hamming Mã vòng. Mã chập. Mỗi loại mã đều đƣa ra phƣơng pháp lập mã và giải mã. Để học tốt về chƣơng này sinh viên cần có kiến thức về nhân chia đa thức và các phép biến đổi sơ cấp về ma trận. Chƣơng 6: Mã mật. Chƣơng 4 đƣợc nghiên cứu với mục đích đảm bảo tính hữu hiệu của hệ thống truyền tin thì chƣơng 5 đƣợc nghiên cứu với mục đích đảm bảo chất lƣợng và chƣơng 6 sẽ đảm bảo tính an toàn. Trong chƣơng này ta sẽ nghiên cứu một số hệ thống mật mã đơn giản để có cách nhìn sơ lƣợc về mã mật và sau đó tập trung vào trình bày các cách thức tấn công vào một hệ thống mật mã. §Ò c-¬ng bµi gi¶ng M«n: Lý thuyÕt th«ng tin 3 CHƢƠNG 1: KHÁI NIỆM CHUNG 1.1 Khái niệm chung về hệ thống thông tin và truyền tin. 1.1.1. Thông tin. - Hai ngƣời nói chuyện với nhau. Cái mà họ trao đổi gọi là thông tin. - Một ngƣời xem tivi/nghe đài/đọc báo, ngƣời đó đang nhận thông tin từ đài phát/báo. - Quá trình giảng dạy trong lớp. Nhận xét: + Thông tin là cái đƣợc truyền từ đối tƣợng này sang đối tƣợng khác để báo một “điều” gì đó. Thông tin ch có ý nghĩa khi “điều” đó bên nhận chƣa biết. + Thông tin xuất hiện dƣới nhiều dạng nhƣ âm thanh, hình ảnh + Ngữ nghĩa của thông tin ch có thể hiểu đƣợc khi bên nhận hiểu đƣợc cách biểu diễn ngữ nghĩa của bên phát. + Một trong các phƣơng tiện để diễn đạt thông tin là ngôn ngữ. + Có hai trạng thái của thông tin: Truyền và lƣu trữ. Môi trƣờng truyền/lƣu trữ đƣợc gọi chung là môi trƣờng chứa tin hay kênh tin. Định nghĩa: Thông tin là sự cảm hiểu của con ngƣời về thế giới xung quanh (thông qua sự tiếp xúc với nó). 1.1.2. Tín hiệu. Thông tin là một hiện tƣợng vật lý, nó thƣờng tồn tại và đƣợc truyền đi dƣới dạng vật chất nào đó. Những dạng vật chất dùng để mang thông tin đƣợc gọi là tín hiệu. Định nghĩa: Tín hiệu là biểu diễn vật lý của thông tin. Ví dụ: Các tín hiệu nhìn thấy là các song ánh sang mang thông tin tới mắt của chúng ta. Các tín hiệu nghe thấy là các sự biến đổi của áp suất không khí truyền thông tin tới tai chúng ta. Chú ý: Không phải bản thân quá trình vật lý là tín hiệu, mà sự biến đổi các tham số riêng của quá trình vật lý mới là tín hiệu. Các đặc trƣng vật lý có thể là dòng điện, điện áp, ánh sáng, âm thanh, trƣờng điện từ. 1.2 Mô hình của hệ thống truyền tin. Sự truyền tin (transmission): Là sự dịch chuyển thông tin từ điểm này đến điểm khác trong một môi trƣờng xác định. §Ò c-¬ng bµi gi¶ng M«n: Lý thuyÕt th«ng tin 4 Hệ thống thông tin (hệ thống truyền tin) là hệ thống thực hiện việc chuyển tin từ nguồn đến đích. Ta xét một hệ thống thông tin tổng quát nhƣ hình vẽ dƣới đây. Ba phần tử cơ bản nhất của bất cứ hệ thống thông tin nào cũng phải có đó là máy phát, máy thu và kênh truyền. Mỗi phần tử có một vai trò nhất định trong việc truyền dẫn tín hiệu. Máy phát xử lý tín hiệu đầu vào và tạo ra tín hiệu có những đặc tính thích hợp với kênh truyền dẫn. Quá trình xử lý tín hiệu để truyền dẫn chủ yếu là điều chế và mã hóa (modulation and coding). Kênh truyền là môi trƣờng giữa điểm phát và điểm thu. Kênh truyền có thể là cáp song hành, cáp đồng trục, cáp quang hay môi trƣờng vô tuyến. Mọi kênh truyền đều gây ra độ suy hao hay là độ tổn thất truyền dẫn. Vì thế cƣờng độ tín hiệu bị suy giảm dần theo khoảng cách. Máy thu lấy tín hiệu đầu ra từ kênh truyền để xử lý và tái tạo ngƣợc lại tín hiệu ở đầu phát. Các hoạt động của máy thu bao gồm khuếch đại để bù vào tổn hao truyền dẫn, và giải điều chế và giải mã tín hiệu đã đƣợc điều chế và mã hóa ở máy phát. 1.3. Các yêu cầu cơ bản của hệ thống truyền tin. 1.3.1. Tính hữu hiệu. Thể hiện trên các mặt sau: - Tốc độ truyền tin cao. - Truyền đƣợc đồng thời nhiều tin khác nhau. - Chi phí cho một bit thông tin thấp. 1.3.2. Độ tin cậy. Đảm bảo độ chính xác của việc thu nhận tin cao, xác suất thu sai thấp (BER – Bit Error Rate). Hai ch tiêu trên mâu thuẫn nhau. Giải quyết mâu thuẫn trên là nhiệm vụ của Nguồn tin Bộ phát Kênh truyền Bộ thu Ngƣời dùng Nhiễu §Ò c-¬ng bµi gi¶ng M«n: Lý thuyÕt th«ng tin 5 lý thuyết thông tin. 1.3.3. An toàn. - Bí mật: + Không thể khai thác thông tin trái phép. + Ch có ngƣời nhận hợp lệ mới hiểu đƣợc thông tin. - Xác thực: Gắn trách nhiệm của bên gửi – bên nhận với bản tin (chữ ký số). - Toàn vẹn: + Thông tin không bị bóp méo (cắt xén, xuyên tạc, sửa đổi). + Thông tin đƣợc nhận phải nguyên vẹn cả về nội dung và hình thức. - Khả dụng: Mọi tài nguyên và dịch vụ của hệ thống phải đƣợc cung cấp đầy đủ cho ngƣời dùng hợp pháp. 1.4. Độ đo thông tin. Các mục về sau chúng ta sẽ khảo sát lƣợng đo thông tin một cách chi tiết hơn, ở đây chúng ta ch nêu một khái niệm ban đầu về lƣợng tin để có thể so sánh định lƣợng các thông tin với nhau. Từ đó giúp cho chúng ta dễ nhận thức hơn những ch tiêu chất lƣợng đề ra khi xây dựng các phƣơng pháp xử lý thông tin. Một tin tức đối với ngƣời nhận đều mang hai đặc tính: Độ bất ngờ của tin và ý nghĩa của tin. Để so sánh giữa các tin với nhau ngƣời ta có thể dùng một trong hai đặc tính trên hoặc dùng cả hai đặc tính trên làm thƣớc đo. Tuy nhiên những nội dung mang tính ý nghĩa của tin không ảnh hƣởng đến các vấn đề cơ bản của hệ thống thông tin (hệ thống thông tin đòi hỏi hai vấn đề cơ bản đó là tốc độ truyền tin và độ chính xác). Trong khi đó độ bất ngờ của tin lại liên quan đến những vấn đề đó. Một tin có xác suất xuất hiện càng nhỏ thì độ bất ngờ càng lớn (càng bất ngờ) thì khi xuất hiện tác động càng mạnh lên giác quan của con ngƣời, và chúng ta cho rằng lƣợng tin của chúng càng lớn. Xét một tin x có xác suất xuất hiện là p(x) thì chúng ta có thể xem tin này nhƣ là một tin trong một tập có 1/p(x) tin với các tin có xác suất xuất hiện nhƣ nhau. Nếu p(x) càng nhỏ thì 1/p(x) càng lớn và vì vậy “lƣợng tin” khi nhận đƣợc tin này cũng sẽ càng lớn. Vậy “lƣợng tin” của một tin t lệ thuận với số khả năng của một tin và t lệ nghịch với xác suất xuất hiện của tin đó. §Ò c-¬ng bµi gi¶ng M«n: Lý thuyÕt th«ng tin 6 Định nghĩa lƣợng tin: Lƣợng đo thông tin của một tin đƣợc đo bằng logarit độ bất ngờ của tin hay nghịch đảo xác suất xuất hiện của tin đó. n i iap xp xI 1 )(log )( 1 log)( Đơn vị lƣợng tin: Cơ số 2: đơn vị là Bit. Cơ số e: đơn vị là Nat Cơ số 10: đơn vị là Hartley. 1.5. Số hóa nguồn tin liên tục. Rời rạc hoá thƣờng bao gồm hai loại: Rời rạc hoá theo trục thời gian, còn đƣợc gọi là lấy mẫu (sampling) và rời rạc hoá theo biên độ, còn đƣợc gọi là lượng tử hoá (quantize). 1.5.1 Lấy mẫu (Sampling). Lấy mẫu là bƣớc đầu tiên trong quá trình biến đổi tín hiệu tƣơng tự sang số. Mục đích của bƣớc lấy mẫu này là từ tín hiệu tƣơng tự tạo nên một dãy xung rời rạc theo thời gian (thực chất là việc nhân tín hiệu thoại đầu vào với một chuỗi xung nhịp f s = t 1 Ví dụ: x a (t) là một hàm theo thời gian, t là biến thì lẫy mẫu là rời rạc hóa biến t. Định lý lấy mẫu: Nếu ta muốn khôi phục tín hiệu tƣơng tự thì tín hiệu lấy mẫu một cách trung thành thì tần số lấy mẫu lớn hơn hoặc bằng hai lần bề rộng phổ của tín hiệu (bề rộng của băng tần cơ bản). Fs 2B B Ts 2 1 Fs Tần số lấy mẫu. Ts Chu kỳ lấy mẫu. B Bề rộng phổ tín hiệu. Nếu Fs = 2B thì tần số lấy mẫu này gọi là tần số Nyquist. §Ò c-¬ng bµi gi¶ng M«n: Lý thuyÕt th«ng tin 7 1.5.2 Lƣợng tử hóa (Quantizing) Lƣợng tử hóa tức là rời rạc hóa hàm a (t) hay nói cách khác chia dải động tín hiệu thành M mức (mức biên độ chuẩn đã đƣợc định nghĩa sẵn trong một dải biên độ tín hiệu cho trƣớc. ) sau đó thực hiện làm tròn các xung lấy mẫu về các mức gần nhất. Việc lƣợng tử hoá sẽ biến đổi hàm s(t) ban đầu thành một hàm s’(t) có dạng hình bậc thang. Sự khác nhau giữa s(t) và s’(t) đƣợc gọi là sai số lƣợng tử. Sai số lƣợng tử càng nhỏ thì s’(t) biểu diễn càng chính xác s(t). 1.5.3 Mã hóa (Coding) Quá trình mã hóa biến đổi các mức lƣợng tử hóa thành các từ mã, thông thƣờng là từ mã nhị phân. Trong tín hiệu nhị phân, “0” và “1” đƣợc thể hiện bằng hai mức điện áp khác nhau. §Ò c-¬ng bµi gi¶ng M«n: Lý thuyÕt th«ng tin 8 CHƢƠNG 2: THÔNG TIN 2.1 Lƣợng tin nguồn rời rạc 2.1.1 Khái niệm nguồn tin rời rạc - Nguồn rời rạc: nguồn tạo ra một chuỗi các biến ngẫu nhiên, rời rạc - Ký hiệu: Phần tử nhỏ nhất chứa thông tin. VD các ký tự trong bộ chữ cái - Bộ ký hiệu: Tập tất cả các ký hiệu [X]={x1,x2,xn} - Từ: Tập hợp hữu hạn các ký hiệu trong bộ ký hiệu - Bộ từ: Tập hợp tất cả các từ mà bộ ký tự có thể tạo ra - Nguồn rời rạc không nhớ: Xác suất xuất hiện của một ký hiệu không phụ thuộc vào các ký hiệu trƣớc đó. - Nguồn rời rạc có nhớ: Xác suất xuất hiện một ký tự phụ thuộc vào một hoặc nhiều các ký tự xuất hiện trƣớc đó 2.1.2 Lƣợng tin nguồn rời rạc Lƣợng tin riêng: Mỗi lớp tin xi trong nguồn tin X đều có một lƣợng tin riêng đƣợc xác định theo công thức: )(log )( 1 log)( in i ni xp xp xI Đơn vị lƣợng tin: - Cơ số n = 2: Bit (Binary – nhị phân) - Cơ số n = e: Nat (đọc là nit – nature) - Cơ số n = 10: Harley. Trong môn học này tập trung trình bày mã nhị phân nên mặc định n = 2. Trong hệ thống thông tin, việc truyền tin từ nguồn tin X đến nơi nhận Y đƣợc coi nhƣ một phép biến đổi (ánh xạ) từ một không gian X tới một không gian Y. Do tác động của nhiễu nên ánh xạ này không phải là ánh xạ 1-1. Nói cách khác, việc nhận đƣợc một lớp tin yj cụ thể ở nơi nhận ch cho chúng ta biết khả năng tin tức của nguồn tin X truyền đi lớp tin xi, điều này theo quan điểm thống kê có thể xác định đƣợc xác suất có điều kiện về sự xuất hiện các lớp tin xi ở nguồn với điều kiện nơi nhận nhận đƣợc lớp tin yj. Xác suất này đƣợc gọi là xác suất có điều kiện, ký hiệu là p(xi/yj). p(xi/yj): xác suất có điều kiện về sự xuất hiện các lớp tin xi ở nguồn với điều kiện nơi nhận nhận đƣợc lớp tin yj p(yj/xi):xác suất có điều kiện về sự xuất hiện các lớp tin yj ở nơi nhận tin với điều kiện nguồn tin phát đi lớp tin xi §Ò c-¬ng bµi gi¶ng M«n: Lý thuyÕt th«ng tin 9 Ngoài ra ta còn xác định đƣợc xác suất xuất hiện đồng thời các lớp tin xi ở nguồn và yi ở nơi nhận là p(xi,yi) Theo quy luật phân bố xác suất có điều kiện ta có: m i ij n j ji xyp yxp 1 1 1)/( 1)/( Để giải quyết bài toán truyền tin đặt ra khi nhận đƣợc một lớp tin yj của tập của tập YM, hãy xác định lớp tin tƣơng ứng của tập XN ở đầu vào. Ở đây ta không thể xác định đƣợc chính xác duy nhất một lớp tin xi ở đầu vào mà ch đƣa ra các khả năng có thể xảy ra ở nguồn. Lƣợng tin tƣơng hỗ: Là lƣợng tin về một tin bất kỳ xi trong nguồn tin XN chứa trong một tin bất kỳ yj của nơi nhận tin YM đƣợc gọi là lƣợng tin tƣơng hỗ giữa xi và yj bằng lƣợng tin ban đầu của xi trừ đi lƣợng tin còn lại của xi sau khi đã nhận đƣợc yj. )|()(),( jii yxIxIyjxiI )|(log)(log),( jii yxPxPyjxiI )( )|( log),( i ji xP yxP yjxiI Lƣợng tin có điều kiện: Lƣợng tin còn lại của xi sau khi đã nhận đƣợc yj đƣợc gọi là lƣợng tin có điều kiện của xi với điều kiện nơi nhận nhận đƣợc yj )|(log)|( jiji yxpyxI Lƣợng tin còn lại này chính là lƣợng tin do nhiễu phá hủy không đến đƣợc nơi nhận 2.2 Entropi nguồn rời rạc 2.2.1 Định nghĩa Lƣợng tin trung bình đƣợc hiểu là lƣợng tin trung bình trong một tin bất kỳ của nguồn tin đã cho. Khi nhận đƣợc một tin, ta sẽ nhận đƣợc một lƣợng tin trung bình, đồng thời độ bất ngờ của tin cũng đƣợc giải thoát, do vậy độ bất ngờ của tin và lƣợng tin về ý nghĩa vật lý trái ngƣợc nhau nhƣng về số đo lại bằng nhau. Độ bất ngờ của lớp tin xi trong nguồn tin XN đƣợc tính bằng entropy riêng của lớp tin xi trong nguồn tin XN §Ò c-¬ng bµi gi¶ng M«n: Lý thuyÕt th«ng tin 10 Entropy là một đại lƣợng toán học dùng để đo lƣợng tin không chắc (hay lƣợng ngẫu nhiên) của một sự kiện hay của phân phối ngẫu nhiên cho trƣớc - Uncertainty Measure (độ bất ngờ) hay là lƣợng tin không chắc chắn Entropy riêng của của lớp tin i: H ... hững đƣờng có khoảng cách nhỏ gọi là đƣờng sống sót. Đây chính là đƣờng mã cần tìm. Giả sử đầu ra ta thu đƣợc từ mã 11 10 00 10 11, ta tiến hành so sánh các giá trị đầu ra thu đƣợc với các giá trị đầu ra trên lƣới. Tính các khoảng cách Hamming giữa hai từ mã. Sau đó tìm đƣờng mã sao cho khoảng cách mã là nhỏ nhất t1 t2 t3 t4 t5 t62 1 0 1 2 00 10 01 11 Trạng thái n-k thanh g i cuối 0 1 2 1 0 0 1 0 1 2 1 0 2 1 2 1 1 2 1 1 0 1 0 1 2 11 10 00 10 11Gía trị t u được Gía trị đầu vào 1 0 1 0 0 §Ò c-¬ng bµi gi¶ng M«n: Lý thuyÕt th«ng tin 51 Giả sử đầu ra ta thu đƣợc từ mã 11 11 10 01 00, ta tiến hành so sánh các giá trị đầu ra thu đƣợc với các giá trị đầu ra trên lƣới. Tính các khoảng cách Hamming giữa hai từ mã. Sau đó tìm đƣờng mã sao cho khoảng cách mã là nhỏ nhất 11 11 10 01 00Gía trị t u được Gía trị đầu vào 1 1 1 0 1 t1 t2 t3 t4 t5 t62 2 1 1 0 00 10 01 11 Trạng thái n-k thanh g i cuối 0 0 1 1 0 1 0 2 1 1 1 2 1 2 0 1 2 0 1 0 2 1 1 1 0 §Ò c-¬ng bµi gi¶ng M«n: Lý thuyÕt th«ng tin 52 CHƢƠNG 6: M MẬT 6.1 Giới thiệu chung về các hệ thống mật mã Mong muốn đƣợc trao đổi thông tin một cách bí mật là một trong những đòi hỏi của con ngƣời xuất hiên từ rất sớm trong lịch sử. Vì thế lịch sử của việc trao đổi thông tin mật rất phong phú và bao gồm những phát minh độc đáo. Ngành học nghiên cứu cách thức che dấu thông tin đối với những đối tƣợng không mong muốn đƣợc gọi là mật mã học. Phân loại các hệ thống mật mã. Xét cách thức tiến hành mã hóa ta có thể chia quá trình mật mã thành hai loại: Mã hóa khối: Dữ liệu trƣớc khi mã hóa sẽ bị chia nhỏ thành từng khối có độ dài cố định, sau đó mỗi khối đƣợc mã hóa một cách độc lập. Do đó, §Ò c-¬ng bµi gi¶ng M«n: Lý thuyÕt th«ng tin 53 nếu sử dụng cùng khóa thì việc mã hóa các các khối văn bản gốc giống nhau sẽ cho ta các khối văn bản mã hóa giống nhau. Mã hóa chuỗi dữ liệu: Tƣơng tự nhƣ mã chập, độ dài không cố định. Mỗi bít của văn bản gốc m đƣợc mã hóa bằng thành phần thứ i của chuỗi ký hiệu đƣợc hình thành từ từ khóa. Xét về mối quan hệ giữa mã hóa và giải mã ta có thể chia quá trình mật mã thành hai loại: Hệ thống mật mã đối xứng (bí mật): Là hệ thống sử dụng một khóa duy nhất cho cả mã hóa và giải mã. Hệ thống mật mã không đối xứng (công khai): Có hai khóa, một khóa dùng cho lập mã và có thể công bố rộng rãi, khóa còn lại dùng để giải mã đƣợc giữ bí mật 6.2 Một số hệ thống mật mã. Bảng chữ cái. Ví dụ: §Ò c-¬ng bµi gi¶ng M«n: Lý thuyÕt th«ng tin 54 Ma trận vuông Polybius: Bảng chữ cái đƣợc xếp thành một ma trận 5x5 (chữ i và chữ J đƣợc gộp lại nhƣ một chữ) 1 2 3 4 5 1 A B C D E 2 F G H IJ K 3 L M N O P 4 Q R S T U 5 V W X Y Z Mã lũy tiến Đây là một ví dụ của mã hóa bản chữ cái bội Hàng 0: A B C D E F G H I J K L M N O P Q R S T U V W X Y Z Hàng 1: B C D E F G H I J K L M N O P Q R S T U V W X Y Z A Hàng 2: C D E F G H I J K L M N O P Q R S T U V W X Y Z A B ........................................................................................................... Hàng 25:Z A B C D E F G H I J K L M N O P Q R S T U V W X Y Phƣơng pháp sử dụng bản chữ cái này là chữ đầu tiên mã hóa ở hàng 1, chữ thứ 2 mã hóa ở hàng 2 và cứ nhƣ thế tiếp tục. 6.3. Những cách thức tấn công vào một hệ thống mật mã. Hệ thống tấn công có thể có một trong bốn khả năng tấn công một hệ thống mật mã tùy thuộc vào những thông tin có thể thu thập đƣợc. Ch biết bản tin mật mã: Trong trƣờng hợp này hệ thống tấn công ch có trong tay các bản tin mật mã. Quá trình phân tích phải dựa trên tính chất thống kê, phân bố và các tính chất khác của bản tin mật mã – những điều đƣợc truyền công khai trên kênh truyền. §Ò c-¬ng bµi gi¶ng M«n: Lý thuyÕt th«ng tin 55 Biết đầy đủ hoặc một phần bản tin gốc và bản tin mật mã tƣơng ứng: Trong trƣờng hợp này hệ thống phân tích may mắn hoặc tình cờ có đƣợc bản tin gốc cùng với bản tin mật mã tƣơng ứng. Chẳng hạn, những thông báo ngoại giao hoặc pháp lý th nh thoảng đƣợc công bố và đồng thời hệ thống phân tích lại thu đƣợc cả bản tin mật mã trên kênh truyền. Gọi C là bản tin mật mã, P là bản tin gốc, E là thuật toán mã hóa. D là thuật toán giải mã thì C = E(P). Hệ thống phân tích có đƣợc C, P và cố gắng tìm ra E hoặc D. Những cấu trúc cố định của các mẫu văn bản kinh tế, ngoại giao cũng nhƣ những cấu trúc của các ngôn ngữ lập trình thƣờng cung cấp những thông tin về văn bản gốc để hệ thống tấn công thực hiện dạng tấn công loại này. Biết bản tin mật mã của bất cứ bản tin gốc nào: Trong một số trƣờng hợp hệ thống phân tích có thể thâm nhập vào hệ thống gửi để có thể mã hóa và gửi đi một bản tin theo ý muốn. Tấn công loại này còn đƣợc gọi là tấn công lựa chọn bản tin gốc. Chẳng hạn hệ thống phân tích có thể chèn hoặc xóa các bản ghi trong một cơ sở dữ liệu rồi quan sát những thay đổi xảy ra đối với bản tin mật mã. Cách tấn công này rất hay đƣợc các hệ thống phân tích tận dụng. Mặc dù việc tấn công biết trƣớc văn bản gốc không phải lúc nào cũng thực hiện đƣợc nhƣng tần suất của nó đủ để cho một hệ thống không thể coi là an toàn trừ khi hệ thống đó chống lại đƣợc kiểu tấn công này. Biết bản tin gốc và thuật toán: Hệ thống phân tích cũng có thể có đƣợc thuật toán mật mã cùng với các bản tin mật mã thu đƣợc trên kênh truyền. Hệ thống phân tích có thể tấn công bằng cách đơn giản là thử mã hóa một số lƣợng rất lớn các bản tin gốc có thể cho đến khi nhận đƣợc bản tin mật mã thu đƣợc trên kênh. Mục đích của quá trình thử là xác định khóa đang sử dụng để có thể sử dụng cho giải mã các bản tin trong tƣơng lai. §Ò c-¬ng bµi gi¶ng M«n: Lý thuyÕt th«ng tin 56 MỤC LỤC CHƢƠNG 1: KHÁI NIỆM CHUNG .....................................................................................3 1.1 Khái niệm chung về hệ thống thông tin và truyền tin. .................................................3 1.1.1. Thông tin. .............................................................................................................3 1.1.2. Tín hiệu.................................................................................................................3 1.2 Mô hình của hệ thống truyền tin. .................................................................................3 1.3. Các yêu cầu cơ bản của hệ thống truyền tin. ..............................................................4 1.3.1. Tính hữu hiệu. ......................................................................................................4 1.3.2. Độ tin cậy. ............................................................................................................4 1.3.3. An toàn. ................................................................................................................5 1.4. Độ đo thông tin. ..........................................................................................................5 1.5. Số hóa nguồn tin liên tục. ...........................................................................................6 1.5.1 Lấy mẫu (Sampling). .............................................................................................6 1.5.2 Lƣợng tử hóa (Quantizing) ....................................................................................7 1.5.3 Mã hóa (Coding)....................................................................................................7 CHƢƠNG 2: THÔNG TIN ....................................................................................................8 2.1 Lƣợng tin nguồn rời rạc ................................................................................................8 2.1.1 Khái niệm nguồn tin rời rạc ...................................................................................8 2.1.2 Lƣợng tin nguồn rời rạc .........................................................................................8 2.2 Entropi nguồn rời rạc ....................................................................................................9 2.2.1 Định nghĩa .............................................................................................................9 2.2.2 Tính chất của Entropy .........................................................................................10 2.3 Kênh rời rạc. ..............................................................................................................10 2.3.1 Định nghĩa. ..........................................................................................................10 2.3.2 Entropy đồng thời. ...............................................................................................11 2.3.3 Entropi có điều kiện. ............................................................................................12 2.3.4 Quan hệ giữa lƣợng tin tƣơng hỗ trung bình và entropy. ....................................14 2.3.5 Các dạng kênh truyền ........................................................................................156 2.3.6Lƣợc đồ giải mã tối ƣu .........................................................................................16 2.4 Entropy của nguồn liên tục. ........................................................................................17 2.5 Vấn đề phối hợp nguồn kênh. .....................................................................................17 CHƢƠNG 3: M HIỆU.......................................................................................................19 3.1 Khái niệm và định nghĩa. ............................................................................................19 3.1.1 Các khái niệm: .....................................................................................................19 3.1.2 Các thông số cơ bản của một bộ mã: ...................................................................19 3.2 Các phƣơng pháp biểu diễn mã ..................................................................................20 3.2.1 Các bảng mã ........................................................................................................20 3.2.2 Đồ hình mã ..........................................................................................................21 3.2.3 Hàm cấu trúc mã..................................................................................................22 3.3 Điều kiện phân tách của mã hiệu. ...............................................................................22 3.3.1 Điều kiện chung đối với một bảng mã phân tách đƣợc. ......................................22 3.3.2 Bảng thử mã.........................................................................................................23 §Ò c-¬ng bµi gi¶ng M«n: Lý thuyÕt th«ng tin 57 3.3.3 Bất đẳng thức Kraft............................................................................................. 24 3.3.4 Thủ tục tạo mã phân tách đƣợc dựa vào độ dài đã biết của các từ mã ............... 24 3.4 Mã hệ thống. .............................................................................................................. 25 3.4.1 Mã hệ thống tổng quát. ....................................................................................... 25 3.4.2 Mã hệ thống có tính prefix. ................................................................................. 26 CHƢƠNG 4: M H A NGU N ....................................................................................... 27 4.1 Mô hình toán học của nguồn thông tin. ..................................................................... 27 4.1.1 Định lý giới hạn dƣới về độ dài trung bình của các từ mã. ................................ 27 4.1.2 Định lý giới hạn trên về độ dài trung bình của các từ mã. .................................. 28 4.2 Mã hóa nguồn rời rạc. ................................................................................................ 28 4.2.1 Phƣơng pháp mã hóa Shannon ........................................................................... 28 4.2.2 Phƣơng pháp mã hóa Fano ................................................................................. 29 4.2.3 Phƣơng pháp mã hóa Huffman ........................................................................... 30 CHƢƠNG 5: M H A K NH........................................................................................... 33 5.1 Mã khối tuyến tính (Block code) ............................................................................... 33 5.1.1 Các khái niệm: ................................................................................................... 33 5.1.2 Ma trận sinh. ....................................................................................................... 34 5.1.3 Mã khối tuyến tính hệ thống. .............................................................................. 36 5.1.4 Giải mã................................................................................................................ 37 5.2. Mã Hamming (Hamming Code) ............................................................................... 40 5.2.1. Khái niệm. .......................................................................................................... 40 5.2.2 Phƣơng pháp tạo mã. .......................................................................................... 40 5.2.3 Giải mã................................................................................................................ 41 5.3 Mã vòng (Xyclic code) .............................................................................................. 42 5.3.1 Khái niệm............................................................................................................ 42 5.3.2 Đa thức sinh và ma trận sinh. ............................................................................. 42 5.3.3. Mã vòng hệ thống .............................................................................................. 44 5.3.4. Phƣơng pháp giải mã. ........................................................................................ 45 5.4 Mã chập (Convolution code) ..................................................................................... 46 5.4.1 Khái niệm............................................................................................................ 46 5.4.2 Biểu diễn bộ lập mã chập .................................................................................... 46 5.4.3 Giải mã chập ....................................................................................................... 50 CHƢƠNG 6: M MẬT....................................................................................................... 52 6.1 Giới thiệu chung về các hệ thống mật mã ................................................................. 52 6.2 Một số hệ thống mật mã. ........................................................................................... 53 6.3. Những cách thức tấn công vào một hệ thống mật mã. ............................................. 54
File đính kèm:
- bai_giang_ly_thuyet_thong_tin.pdf