Bài giảng Nhập môn chương trình dịch - Bài 5: Phân tích ngữ nghĩa - Hoàng Anh Việt

Tổng kết bài 4

• Trước đây: tự viết bộ phân tích cú pháp

• Hiện nay: sử dụng các trình sinh bộ phân tích

cú pháp. VD: yacc, cup, bison

• Ưu điểm:

– Sử dụng phương pháp phân tích LALR(1)

– Cho phép khai báo thứ tự ưu tiên, kết hợp của các

phép toán

– Tự động sinh code phân tích cú pháp (kể cả bảng

phân tích LALR(1))

pdf 24 trang yennguyen 4280
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Nhập môn chương trình dịch - Bài 5: Phân tích ngữ nghĩa - Hoàng Anh Việt", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Bài giảng Nhập môn chương trình dịch - Bài 5: Phân tích ngữ nghĩa - Hoàng Anh Việt

Bài giảng Nhập môn chương trình dịch - Bài 5: Phân tích ngữ nghĩa - Hoàng Anh Việt
1Bài 5. 
PHÂN TÍCH NGỮ NGHĨA
Hoàng Anh Việt 
Viện CNTT&TT - ĐHBKHN
Tổng kết bài 4
• Trước đây: tự viết bộ phân tích cú pháp
• Hiện nay: sử dụng các trình sinh bộ phân tích 
cú pháp. VD: yacc, cup, bison
• Ưu điểm:
– Sử dụng phương pháp phân tích LALR(1)
– Cho phép khai báo thứ tự ưu tiên, kết hợp của các 
phép toán
– Tự động sinh code phân tích cú pháp (kể cả bảng 
phân tích LALR(1))
2
3Nội dung
1. Những vấn đề của ngữ nghĩa
2. Kiểm tra kiểu
– Hệ thống kiểu trong ngôn ngữ lập trình
3. Bảng ký hiệu
Phân tích ngữ nghĩa
Phân tích từ vựng
Phân tích cú pháp
Phân tích ngữ nghĩa
Lỗi từ vựng
Lỗi cú pháp
Lỗi ngữ nghĩa
Chương trình đúng: 
cây cú pháp điều 
khiển
cây cú pháp
dãy từ tố
Chương trình nguồn
1. Những vấn đề của ngữ nghĩa
• Tìm ra các lỗi sau giai đoạn phân tích cú pháp
– Kiểm tra sự tương ứng về kiểu
– Kiểm tra sự tương ứng giữa việc sử dụng hàm, 
biến với khai báo của chúng.
– Xác định phạm vi ảnh hưởng của các biến trong 
chương trình
• Phân tích ngữ nghĩa thường sử dụng cây cú 
pháp
5
2. Kiểm tra kiểu
• Kiểm tra xem chương trình có tuân theo các 
luật về kiểu của ngôn ngữ không
• Trình biên dịch quản lý thông tin về kiểu
• Việc kiểm tra kiểu được thực hiện bởi bộ kiểm 
tra kiểu (type checker), một bộ phận của trình 
biên dịch
6
Ví dụ kiểm tra kiểu
• Toán tử % của C chỉ thực hiện khi các toán hạng là số 
nguyên
• Chỉ có mảng mới có chỉ số và kiểu của chỉ số phải là số 
nguyên
• Một hàm phải có một số lượng tham số nhất định và các 
tham số phải đúng kiểu
• Các phép toán đòi hỏi các toán hạng phải phù hợp kiểu
• Các hàm đòi hỏi tham số phù hợp kiểu
• Lệnh return phải trả về đúng kiểu trả về của hàm
• Lệnh gán đòi hỏi kiểu của vế phải phù hợp với kiểu của 
vế trái
• Lệnh khai báo kiểu: typedef, class
7
2. Kiểm tra kiểu
• Có hai phương pháp tĩnh và động
• Phương pháp áp dụng trong thời gian dịch là tĩnh 
• Trong các ngôn ngữ như C hay Pascal, kiểm tra kiểu
là tĩnh và được dùng để kiểm tra tính đúng đắn của 
chương trình trước khi nó được thực hiện
• Kiểm tra kiểu tĩnh cũng được sử dụng khi xác định 
dung lượng bộ nhớ cần thiết cho các biến
• Bộ kiểm tra kiểu được xây dựng dựa trên:
– Các biểu thức kiểu của ngôn ngữ
– Bộ luật để định kiểu cho các cấu trúc
8
2.1 Biểu thức kiểu
• Biểu diễn kiểu của một cấu trúc ngôn ngữ
• Một biểu thức kiểu là một kiểu dữ liệu chuẩn 
hoặc được xây dựng từ các kiểu dữ liệu khác 
bởi cấu trúc kiểu (Type Constructor).
– Kiểu dữ liệu chuẩn (int, real, boolean, char) là biểu 
thức kiểu
– Biểu thức kiểu có thể liên hệ với một tên. Tên kiểu 
là biểu thức kiểu
– Cấu trúc kiểu được ứng dụng vào các biểu thức 
kiểu tạo ra biểu thức kiểu
9
2.1 Biểu thức kiểu
• Mỗi ngôn ngữ lập trình có hệ thống kiểu riêng
• Mỗi kiểu là một giới hạn dữ liệu
• VD: int = [-231, 231], char = [-128, 127]
• Các kiểu dữ liệu phức hợp được tạo từ các 
kiểu đơn giản bởi các biểu thức kiểu (type 
expressions, type contructors)
• VD: int, string, Array[int], Object
Ví dụ: C++
• Kiểu cơ bản: int, char, 
• Kiểu phức hợp: 
int[100], struct {int a, char b}
• Biểu thức kiểu:
T là kiểu
T[ ] là kiểu với mọi T
Định nghĩa kiểu
• Một số ngôn ngữ cho phép người lập trình tự 
định nghĩa kiểu
• VD: C++
typedef int int_array[ ];
class cView {  };
• int_array là một kiểu giống với int[ ]
• Có thể có nhiều định nghĩa kiểu của cùng một 
kiểu
Biểu thức kiểu: Mảng
• Mỗi ngôn ngữ có một cách định nghĩa mảng
• Mảng không giới hạn:
– C/C++: T[ ]
• Mảng có giới hạn
– C/C++/Java: T[L] – L phần tử kiểu T
• Mảng có giới hạn trên, dưới
– Pascal: T[L, U] – đánh chỉ số từ L đến U
• Mảng nhiều chiều
– C/C++/Java/Pascal
Biểu thức kiểu: Cấu trúc
• Là biểu thức kiểu khá phức tạp
• Biểu thức kiểu có dạng {id1: T1, id2: T2, } 
với id và T là tên và kiểu của các trường
• Ví dụ
– C/C++: struct { int a; float b; } tương ứng với biểu 
thức kiểu {a: int, b: float}
• Các kiểu lớp (Class) là mở rộng của kiểu struct 
(cho phép thành viên là hàm)
Biểu thức kiểu: Hàm
• Hàm cho phép nhận nhiều tham số và trả về 
giá trị
• Tham số thứ i có kiểu Ti, kiểu trả là T
• Biểu thức kiểu: T1 x T2 x  Tn T
• Ví dụ: int f(int, char) tương ứng với biểu thức 
kiểu int x char int
• Trong C++/Java, cần mở rộng biểu thức kiểu 
của hàm để có thể trả lại ngoại lệ
2.1 Biểu thức kiểu
(a) Mảng (Array).Nếu T là biểu thưc kiểu thì
array(I,T) là biểu thức kiểu biểu diễn một mảng
với các phần tử kiểu T và chỉ số trong miền I.
– Ví dụ : array [10] of integer có kiểu array(1..10,int);
(b) Tích Descarter. Nếu T1và T2 là các biểu thức
kiểu thì tích Descarter T1 T2 là biểu thức kiểu.
(c) Bản ghi (Record) Tương tự như tích Descarter
nhưng chứa các tên khác nhau cho các kiểu khác
nhau
16
2.1 Biểu thức kiểu
• Ví dụ:
struct
{
double r;
int i;
}
Có kiểu ((r x double) x (i x char)) 
(e) Hàm Nếu D là miền xác định và R là miền giá trị 
của hàm thì kiểu của nó được biểu diễn là: D : R.
Ví dụ hàm của C
int f(char a, b)
Có kiểu: char char : int.
17
2.2 Hệ thống kiểu
• Hệ thống kiểu là một bộ sưu tập các quy tắc để 
gán các biểu thức kiểu vào các phần của một 
chương trình. 
• Được định nghĩa thông qua dịch trực tiếp cú 
pháp
• Bộ kiểm tra kiểu cài đặt một hệ thống kiểu. 
18
2.3 Đặc tả bộ kiểm tra kiểu
• Văn phạm sau sinh ra một chương trình, biểu diễn bởi 
một ký hiệu chưa kết thúc P chứa một chuỗi các khai 
báo D và một biểu thức đơn giản E.
• Các kiểu cơ sở: char, integer và type-error
• Mảng bắt đầu từ 1. Chẳng hạn array[256] of char là 
biểu thức kiểu (1...256, char)
• Kiểu con trỏ ↑T là một biểu thức kiểu pointer(T). 19
Kiểm tra kiểu của định danh
20
Kiểm tra kiểu của biểu thức
21
Kiểm tra kiểu của lệnh
22
Kiểm tra kiểu của hàm
23
Thảo luận
24

File đính kèm:

  • pdfbai_giang_nhap_mon_chuong_trinh_dich_bai_5_phan_tich_ngu_ngh.pdf