Bài giảng Nguyên lý ngôn ngữ lập trình - Chương V: Dịch trực tiếp cú pháp
Nội dung chính:
Khi viết một chương trình bằng một ngôn ngữ lập trình nào đó, ngoài việc quan tâm
đến cấu trúc của chương trình (cú pháp – văn phạm), ta còn phải chú ý đến ý nghĩa của
chương trình. Như vậy, khi thiết kế một trình biên dịch, ta không những chú ý đến văn
phạm mà còn chú ý đến cả ngữ nghĩa. Chương 5 trình bày các cách biểu diễn ngữ
nghĩa của một chương trình. Mỗi ký hiệu văn phạm kết hợp với một tập các thuộc tính
– các thông tin. Mỗi luật sinh kết hợp với một tập các luật ngữ nghĩa – các quy tắc xác
định trị của các thuộc tính. Việc đánh giá các luật ngữ nghĩa được sử dụng để thực
hiện một công việc nào đó như tạo ra mã trung gian, lưu thông tin vào bảng ký hiệu,
xuất các thông báo lỗi, v.v. Ta sẽ thấy rõ việc đánh giá này ở các chương sau: 6, 8, 9.
Hai cách để kết hợp các luật sinh với các luật ngữ nghĩa được trình bày trong chương
là: Định nghĩa trực tiếp cú pháp và Lược đồ dịch. Ở mức quan niệm, bằng cách sử
dụng định nghĩa trực tiếp cú pháp hoặc lược đồ dịch, ta phân tích dòng thẻ từ, xây
dựng cây phân tích cú pháp và duyệt cây khi cần để đánh giá các luật ngữ nghĩa tại các
nút của cây.
Mục tiêu cần đạt:
Sau khi học xong chương này, sinh viên phải nắm được:
• Các cách kết hợp các luật sinh với các luật ngữ nghĩa: Định nghĩa trực tiếp cú
pháp và Lược đồ dịch.
• Biết cách thiết kế chương trình – bộ dịch dự đoán - thực hiện một công việc nào
đó từ một lược đồ dịch hay từ một định nghĩa trực tiếp cú pháp xác định.
Tóm tắt nội dung tài liệu: Bài giảng Nguyên lý ngôn ngữ lập trình - Chương V: Dịch trực tiếp cú pháp
CHƯƠNG V DỊCH TRỰC TIẾP CÚ PHÁP Nội dung chính: Khi viết một chương trình bằng một ngôn ngữ lập trình nào đó, ngoài việc quan tâm đến cấu trúc của chương trình (cú pháp – văn phạm), ta còn phải chú ý đến ý nghĩa của chương trình. Như vậy, khi thiết kế một trình biên dịch, ta không những chú ý đến văn phạm mà còn chú ý đến cả ngữ nghĩa. Chương 5 trình bày các cách biểu diễn ngữ nghĩa của một chương trình. Mỗi ký hiệu văn phạm kết hợp với một tập các thuộc tính – các thông tin. Mỗi luật sinh kết hợp với một tập các luật ngữ nghĩa – các quy tắc xác định trị của các thuộc tính. Việc đánh giá các luật ngữ nghĩa được sử dụng để thực hiện một công việc nào đó như tạo ra mã trung gian, lưu thông tin vào bảng ký hiệu, xuất các thông báo lỗi, v.v. Ta sẽ thấy rõ việc đánh giá này ở các chương sau: 6, 8, 9. Hai cách để kết hợp các luật sinh với các luật ngữ nghĩa được trình bày trong chương là: Định nghĩa trực tiếp cú pháp và Lược đồ dịch. Ở mức quan niệm, bằng cách sử dụng định nghĩa trực tiếp cú pháp hoặc lược đồ dịch, ta phân tích dòng thẻ từ, xây dựng cây phân tích cú pháp và duyệt cây khi cần để đánh giá các luật ngữ nghĩa tại các nút của cây. Mục tiêu cần đạt: Sau khi học xong chương này, sinh viên phải nắm được: • Các cách kết hợp các luật sinh với các luật ngữ nghĩa: Định nghĩa trực tiếp cú pháp và Lược đồ dịch. • Biết cách thiết kế chương trình – bộ dịch dự đoán - thực hiện một công việc nào đó từ một lược đồ dịch hay từ một định nghĩa trực tiếp cú pháp xác định. Tài liệu tham khảo: [1] Compilers : Principles, Technique and Tools - Alfred V.Aho, Jeffrey D.Ullman - Addison - Wesley Publishing Company, 1986. [2] Modern Compiler Implementation in C - Andrew W. Appel - Cambridge University Press, 1997. I. ÐỊNH NGHĨA TRỰC TIẾP CÚ PHÁP Ðịnh nghĩa trực tiếp cú pháp là sự tổng quát hóa một văn phạm phi ngữ cảnh, trong đó mỗi ký hiệu văn phạm kết hợp với một tập các thuộc tính. Cây phân tích cú pháp có trình bày giá trị các thuộc tính tại mỗi nút gọi là cây chú thích . 1. Khái niệm về định nghĩa trực tiếp cú pháp Trong một định nghĩa trực tiếp cú pháp, mỗi luật sinh A → α kết hợp một tập luật ngữ nghĩa có dạng b := f (c1, c2,..., ck) trong đó f là một hàm và : 116 1- b là một thuộc tính tổng hợp của A và c1, c2,..., ck là các thuộc tính của các ký hiệu văn phạm của luật sinh. Hoặc 2- b là một thuộc tính kế thừa của một trong các ký hiệu văn phạm trong vế phải của luật sinh và c1, c2,..., ck là các thuộc tính của các ký hiệu văn phạm của luật sinh. Ta nói b phụ thuộc c1, c2,..., ck. 1. Thuộc tính tổng hợp • Là thuộc tính mà giá trị của nó tại mỗi nút trên cây phân tích cú pháp được tính từ giá trị thuộc tính tại các nút con của nó. • Ðịnh nghĩa trực tiếp cú pháp chỉ sử dụng các thuộc tính tổng hợp gọi là định nghĩa S _ thuộc tính. • Cây phân tích cú pháp của định nghĩa S_ thuộc tính có thể được chú thích từ dưới lên trên. Ví dụ 5.1: Xét định nghĩa trực tiếp cú pháp Luật sinh Luật ngữ nghĩa L Æ En E Æ E1 + T E Æ T T Æ T1 * F T Æ F F Æ (E) F Æ digit print(E.val) E.val := E1.val + T.val E.val := T.val T.val := T1.val * F.val T.val := F.val F.val := E.val F.val := digit.lexval Hình 5.1 - Ðịnh nghĩa trực tiếp cú pháp cho một máy tính tay đơn giản Định nghĩa này kết hợp một thuộc tính tổng hợp có giá trị nguyên val với từng ký hiệu chưa kết thúc E, T và F. Token digit có một thuộc tính tổng họp lexval với giả sử rằng giá trị của thuộc tính này được cung cấp bởi bộ phân tích từ vựng. Ðây là một định nghĩa S_thuộc tính. Với biểu thức 3 * 5 + 4n (n là ký hiệu newline) có cây chú thích như sau: L E.val = 15 T.val = 4 + T val = 15 F.val = 4 T.val = 3 * F.val = 3 F val = 5 digit.lexval = 3 digit.lexval = 5 digit.lexval = 4 E.val = 19 n 117 Hình 5.2- Cây chú thích cho biểu thức 3* 5+4n 2. Thuộc tính kế thừa • Là một thuộc tính mà giá trị của nó được xác định từ giá trị các thuộc tính của các nút cha hoặc anh em của nó. • Nói chung ta có thể viết một định nghĩa trực tiếp cú pháp thành một định nghĩa S_ thuộc tính. Nhưng trong một số trường hợp, việc sử dụng thuộc tính kế thừa lại thuận tiện vì tính tự nhiên của nó. Ví dụ 5.2: Xét định nghĩa trực tiếp cú pháp sau cho sự khai báo kiểu cho biến: Luật sinh Luật ngữ nghĩa D Æ TL T Æ int T Æ real L Æ L1, id L Æ id L.in := T.type T.type := integer T.type := real L1.in := L.in; addtype (id.entry, L.in) addtype (id.entry, L.in) Hình 5.3 - Ðịnh nghĩa trực tiếp cú pháp với thuộc tính kế thừa L.in type là thuộc tính tổng hợp kết hợp với ký hiệu chưa kết thúc T, giá trị của nó được xác định bởi từ khóa trong khai báo. Bằng cách sử dụng thuộc tính kế thừa in kết hợp với ký hiệu chưa kết thúc L chúng ta xác định được kiểu cho các danh biểu và dùng thủ tục addtype đưa kiểu này vào trong bảng ký hiệu tương ứng với danh biểu. Ví dụ 5.3: Xét phép khai báo: real id1, id2, id3. Ta có cây chú thích: D T type = real real L.in = real L in = real , id3 L in real id1 , id2 Hình 5.4- Cây phân tích cú pháp với thuộc tính kế thừa in tại mỗi nút được gán nhãnL 118 3. Ðồ thị phụ thuộc • Ðồ thị phụ thuộc là một đồ thị có hướng mô tả sự phụ thuộc giữa các thuộc tính tại mỗt nút của cây phân tích cú pháp. • Cho một cây phân tích cú pháp thì đồ thị phụ thuộc tương ứng được xây dựng theo giải thuật sau: FOR mỗi một nút n trong cây phân tích cú pháp DO FOR với mỗi một thuộc tính a của ký hiệu văn phạm tại n DO Xây dựng một nút trong đồ thị phụ thuộc cho a FOR với mỗi một nút n trên cây phân tích cú pháp DO FOR với mỗi một luật ngữ nghĩa dạng b = f(c1, c2,..., ck) kết hợp với luật sinh được dùng tại nút n DO FOR i:=1 TO k DO Xây dựng một cạnh từ nút cho ci đến nút cho b Ví dụ 5.4: Với định nghĩa S_ thuộc tính E Æ E1 + E2 E.val := E1.val + E2.val Ta có đồ thị phụ thuộc: E E1 + E2 val val val Hình 5.5- E.val được tổng hợp từ E1.val và E2.val Ví dụ 5.5: Dựa vào định nghĩa trực tiếp cú pháp trong ví dụ 5.2, ta có đồ thị phụ thuộc của khai báo real id1, id2, id3 Hình 5.6- Ðồ thị phụ thuộc cho cây phân tích cú pháp trong hình 5.4 D T real 5 in L 4 L 7 in , id3 L 9 in id1 , id210 1 entry 8 3 entry 6 2 entry 119 Chú ý: Với luật ngữ nghĩa dạng b = f( c1, c2, ..., ck) có chứa lời gọi thủ tục thì chúng ta tạo ra một thuộc tính tổng hợp giả. Trong ví dụ của chúng ta là nút 6, 8, 10. II. XÂY DỰNG CÂY CÚ PHÁP • Cây cú pháp (syntax - tree) là dạng rút gọn của cây phân tích cú pháp dùng để biểu diễn cấu trúc ngôn ngữ. • Trong cây cú pháp các toán tử và từ khóa không phải là nút lá mà là các nút trong. Ví dụ với luật sinh S ( if B then S1 else S2 được biểu diễn bởi cây cú pháp: if - then - else B S1 S2 • Một kiểu rút gọn khác của cây cú pháp là chuỗi các luật sinh đơn được rút gọn lại. Chẳng hạn ta có: + E 4 5 3 được rút gọn từ E T + T F * T F id * id id 1. Xây dựng cây cú pháp cho biểu thức Tương tự như việc dịch một biểu thức thành dạng hậu tố. Xây dựng cây con cho biểu thức con bằng cách tạo ra một nút cho toán hạng và toán tử. Con của nút toán tử là gốc của cây con biểu diễn cho biểu thức con toán hạng của toán tử đó. Mỗi một nút có thể cài đặt bằng một mẩu tin có nhiều trường. Trong nút toán tử, có một trường chỉ toán tử như là nhãn của nút, các trường còn lại chứa con trỏ, trỏ tới các nút toán hạng. Ðể xây dựng cây cú pháp cho biểu thức chúng ta sử dụng các hàm sau đây: 1. mknode(op, left, right): Tạo một nút toán tử có nhãn là op và hai trường chứa con trỏ, trỏ tới con trái left và con phải right. 120 2. mkleaf(id, entry): Tạo một nút lá với nhãn là id và một trường chứa con trỏ entry, trỏ tới ô trong bảng ký hiệu. 3. mkleaf(num,val): Tạo một nút lá với nhãn là num và trường val, giá trị của số. Ví dụ 5.6: Ðể xây dựng cây cú pháp cho biểu thức: a - 4 + c ta dùng một dãy các lời gọi các hàm nói trên. (1): p1 := mkleaf(id, entrya) (4): p4 := mkleaf(id, entryc) (2): p2 := mkleaf(num,4) (5): p5 := mknode(‘+’, p3, p4) (3): p3 := mknode(‘-‘, p1, p2) Cây được xây dựng từ dưới lên entrya là con trỏ, trỏ tới ô của a trong bảng ký hiệu entryc là con trỏ, trỏ tới ô của c trong bảng ký hiệu + id - id num 4 entrya entryc Hình 5.7- Cây cú pháp cho biểu thức a - 4 + c 2. Xây dựng cây cú pháp từ định nghĩa trực tiếp cú pháp Căn cứ vào các luật sinh văn phạm và luật ngữ nghĩa kết hợp mà ta phân bổ việc gọi các hàm mknode và mkleaf để tạo ra cây cú pháp. Ví dụ 5.7: Ðịnh nghĩa trực tiếp cú pháp giúp việc xây dựng cây cú pháp cho biểu thức là: Luật sinh Luật ngữ nghĩa E Æ E1 + T E Æ E1 - T E Æ T T Æ (E) T Æ id T Æ num E.nptr := mknode(‘+’, E1.nptr, T.nptr) E.nptr := mknode(‘-’, E1.nptr, T.nptr) E.nptr := T.nptr T.nptr := E.nptr T. nptr := mkleaf(id, id.entry) T.nptr := mkleaf(num, num.val) Hình 5.8 - Ðịnh nghĩa trực tiếp cú pháp để tạo cây cú pháp cho biểu thức Các nút trên cây phân tích cú pháp có nhãn là các ký hiệu chưa kết thúc E và T sử dụng thuộc tính tổng hợp nptr để lưu con trỏ trỏ tới một nút trên cây cú pháp. 121 Với biểu thức a - 4 + c ta có cây phân tích cú pháp (biểu diễn bởi đường chấm) tronh hHình 5.9. 122 E.nptr entrya E.nptr E.npt + T.nptr - T.nptr num T.nptr id id - + id num 4 id entryc Hình 5.9 - Xây dựng cây cú pháp cho a - 4 + c Luật ngữ nghĩa cho phép tạo ra cây cú pháp. Cây cú pháp có ý nghĩa về mặt cài đặt còn cây phân tích cú pháp chỉ có ý nghĩa về mặt logic. 3. Ðồ thị có hướng không tuần hoàn cho biểu thức (Directed Acyclic Graph - DAG) DAG cũng giống như cây cú pháp, tuy nhiên trong cây cú pháp các biểu thức con giống nhau được biểu diễn lặp lại còn trong DAG thì không. Trong DAG, một nút con có thể có nhiều “cha”. Ví dụ 5.8: Cho biểu thức a + a * (b - c) + (b - c) * d. Ta có cây cú pháp và DAG: a d + + * a - b c * - b c d + - * a * + b c Cây cú pháp DAG Hình 5.10 - Cây cú pháp và DAG của một biểu thức 123 Ðể xây dựng một DAG, trước khi tạo một nút phải kiểm tra xem nút đó đã tồn tại chưa, nếu đã tồn tại thì hàm tạo nút (mknode, mkleaf) trả về con trỏ của nút đã tồn tại, nếu chưa thì tạo nút mới. Cài đặt DAG: Người ta thường sử dụng một mảng mẩu tin , mỗi mẩu tin là một nút. Ta có thể tham khảo tới nút bằng chỉ số của mảng. Ví dụ 5.9: Lệnh gán DAG Biểu diễn := + i 10 id entry i num 10 + 1 2 := 1 3 1 2 3 4 i := i + 10 Hình 5.11- Minh họa cài đặt DAG Nút 1: có nhãn là id, con trỏ trỏ tới entry i. Nút 2: có nhãn là num, giá trị là 10. Nút 3: có nhãn là +, con trái là nút 1, con phải là nút 2. Nút 4: có nhãn là :=, con trái là nút 1, con phải là nút 3. Giải thuật: Phương pháp số giá trị (value – number) để xây dựng một nút trong DAG. Giả sử rằng các nút được lưu trong một mảng và mỗi nút được tham khảo bởi số giá trị của nó. Mỗi một nút toán tử là một bộ ba Input: Nhãn op, nút l và nút r. Output: Một nút với Phương pháp: Tìm trong mảng một nút m có nhãn là op con trái là l, con phải là r. Nếu tìm thấy thì trả về m, ngược lại tạo ra một nút mới n, có nhãn là op, con trái là l, con phải là r và trả về n. III. ÐÁNH GIÁ DƯỚI LÊN ÐỐI VỚI ÐỊNH NGHĨA S_THUỘC TÍNH 1. Sử dụng Stack Như đã biết, định nghĩa S_ thuộc tính chỉ chứa các thuộc tính tổng hợp do đó phương pháp phân tích dưới lên là phù hợp với định nghĩa trực tiếp cú pháp này. Phương pháp phân tích dưới lên sử dụng một STACK để lưu trữ thông tin về cây con đã được phân tích. Chúng ta có thể mở rộng STACK này để lưu trữ giá trị thuộc tính tổng hợp. STACK được cài đặt bởi một cặp mảng state và val. Giả sử luật ngữ nghĩa A.a := f ( X.x, Y.y, Z.z ) kết hợp với luật sinh A → XYZ. Trước khi XYZ được rút gọn thành A thì val[top] = Z.z, val[top - 1] = Y.y, val[top - 2] 124 = X.x. Sau khi rút gọn, top bị giảm 2 đơn vị, A nằm trong state[top] và thuộc tính tổng hợp nằm trong val[top]. Stack top Mỗi ô trong stack là một con trỏ trỏ tới bảng phân tích LR(1). Nếu phần tử thứ I của stack là ký hiệu A thì val[i] là giá trị thuộc tính kết hợp với A. State val ... ... X X.x Y Y.y Z Z.z Hình 5.12 - Stack phân tích cú pháp vào một trường lưu giữ thuộc tính tổng hợp 2. Ví dụ Ví dụ 5.10: Xét định nghĩa trực tiếp cú pháp: Luật sinh Luật ngữ nghĩa L Æ En E Æ E1 + T E Æ T T Æ T1 * F T Æ F F Æ (E) F Æ digit print(E.val) E.val := E1.val + T.val E.val := T.val T.val := T1.val * F.val T.val := F.val F.val := E.val F.val := digit.lexval Với biểu thức 3 * 5 + 4 n ta có cây chú thích: E.val = 19 E.val = 15 T.val = 4 + T.val = 15 F.val = 4 T.val = 3 * F.val = 3 F.val = 5 digit.lexval = 3 digit.lexval = 5 digit.lexval = 4 L n 125 Hình 5.13 – Cây chú thích cho biểu thức 3 * 5 + 4 n Cây chú thích này có thể được đánh giá bằng một bộ phân tích cú pháp LR từ dưới lên trên. Chú ý rằng bộ phân tích đã nhận biết giá trị thuộc tính digit.lexval. Khi digit được đưa vào stack thì token digit được đưa vào state[top] và giá trị thuộc tính của nó được đưa vào val[top]. Chúng ta có thể sử dụng kỹ thuật trong mục VI của chương IV để xây dựng bộ phân tích LR. Ðể đánh giá các thuộc tính chúng ta thay đổi bộ phân tích cú pháp để thực hiện đoạn mã sau: Luật sinh Luật ngữ nghĩa L Æ En E Æ E1 + T E Æ T T Æ T1 * F T Æ F F Æ (E) F Æ digit print(val[top]) val[ntop] := val[top - 2] + val[top] val[ntop] := val[top - 2] * val[top] val[ntop] := val[top - 1] Hình 5.14- Cài đặt một máy tính tay sử dụng bộ phân tích cú pháp LR Khi một luật sinh với r ký hiệu bên vế phải được rút gọn thì ntop = top - r + 1. Sau khi một đoạn mã thực hiện thì đặt top = ntop Bảng sau trình bày quá trình thực hiện của bộ phân tích cú pháp Input State Val Luật sinh được dùng 3 * 5 + 4 n * 5 + 4 n * 5 + 4 n *5 + 4 n 5 + 4 n + 4 n + 4 n + 4 n + 4 n 4 n n n n _ 3 F T T* T * 5 T * F T E E + E + 4 E + F E + T _ 3 3 3 3 - 3 - 5 3 - 5 15 15 15 - 15 - 4 15 - 4 15 - 4 F Æ digit T Æ F F Æ digit T Æ T * F E Æ T F Æ digit T Æ F 126 n E E n L 19 19 - 19 E Æ E + T L Æ En Hình 5.15- Các phép chuyển được tạo ra bởi bộ thông dịch trên chuỗi nhập 3* 5+4n IV. ÐỊNH NGHĨA L_THUỘC TÍNH 1. Ðịnh nghĩa L_thuộc tính. Mỗi định nghĩa trực tiếp cú pháp là một định nghĩa L thuộc tính nếu mỗi một thuộc tính kế thừa của Xi (1 <= i <= n) trong vế phải của luật sinh A → X1X2...Xn phụ thuộc chỉ vào: 1. Các thuộc tính của X1, X2,..., Xi - 1 2. Các thuộc tính kế thừa của A. Ví dụ 5.11: Cho định nghĩa trực tiếp cú pháp: Luật sinh Luật ngữ nghĩa A Æ L M A Æ Q R L.i := l(A.i) M.i := m(L.s) A.s := f(M.s) R.i := r(A.i) Q.i := q(R.s) A.s := f(Q.r) Hình 5.16 - Ðịnh nghĩa trực tiếp cú pháp không phải là định nghĩa L_thuộc tính Ðây không phải là một định nghĩa L_thuộc tính vì thuộc tính kế thừa Q.i phụ thuộc vào thuộc tính R.s của ký hiệu bên phải nó trong luật sinh. 2. Lược đồ dịch Lược đồ dịch là một văn phạm phi ngữ cảnh trong đó các thuộc tính được kết hợp với các ký hiệu văn phạm và các hành vi ngữ nghĩa nằm trong cặp dấu { } được xen vào bên phải của luật sinh. Ví dụ 5.12: Lược đồ dịch một biểu thức trung tố với phép cộng và trừ thành dạng hậu tố: E Æ T R R Æ addop T { print ( addop.lexeme) } R1 | ε T Æ num { print ( num.val) } Với biểu thức 9 - 5 + 2 ta có cây phân tích cú pháp (hình 5.16) Ðể xây dựng một lược đồ dịch, chúng ta xét hai trường hợp sau đây: Trường hợp 1: Chỉ chứa thuộc tính tổng hợp: 127 Với mỗi một luật ngữ nghĩa, ta tạo một hành vi ngữ nghĩa và đặt hành vi này vào cuối vế phải luật sinh. Ví dụ 5.13: Luật sinh Luật ngữ nghĩa T Æ T1 * F T.val := T1.val * F.val Ta có lược đồ dịch: T Æ T1 * F { T.val := T1.val * F.val} Trường hợp 2: Có cả thuộc tính tổng hợp và kế thừa phải thỏa mãn 3 yêu cầu sau đây: 1. Thuộc tính kế thừa của một ký hiệu trong vế phải của luật sinh phải được xác định trong hành vi nằm trước ký hiệu đó. 2. Một hành vi không được tham khảo tới thuộc tính tổng hợp của một ký hiệu nằm bên phải hành vi đó. 3. Thuộc tính tổng hợp của ký hiệu chưa kết thúc trong vế trái chỉ có thể được xác định sau khi tất cả các thuộc tính mà nó tham khảo đã được xác định. Hành vi xác định các thuộc tính này luôn đặt cuối vế phải của luật sinh. Với một định nghĩa trực tiếp cú pháp L_thuộc tính ta có thể xây dựng lược đồ dịch thỏa mãn 3 yêu cầu nói trên. E 9 { print(‘9’) } R R R ε T T - { print(‘-’) } 5 { print(‘5’) } + T { print(‘+’) } 2 { print(‘2’) } Hình 5.17 - Cây phân tích cú pháp của các hoạt động biểu diễn 9-5+2 Ví dụ 5.14: Bộ xử lý các công thức toán học – EQN - có thể xây dựng các biểu thức toán học từ các toán tử sub (subscripts) và sup (superscripts). Chẳng hạn: input output BOX sub box BOX box a sub {i sup 2 } 2ia 128 Ðể xác định chiều rộng và chiều cao của các hộp ta có định nghĩa L_thuộc tính như sau: Luật sinh Luật ngữ nghĩa S Æ B B Æ B1B2 B Æ B1 sub B2 B Æ text B.ps := 10 S.ht := B.ht BB1.ps := B.ps BB2.ps := B.ps B.ht := max(B1.ht, B2.ht) BB1.ps := B.ps BB2.ps := shrink(B.ps) B.ht := disp(B1.ht, B2.ht) B.ht := text.h * B.ps Hình 5.18 - Ðịnh nghĩa trực tiếp cú pháp xác định kích thước và chiều cao của các hộp Trong đó: - Ký hiệu chưa kết thúc B biểu diễn một công thức. - Luật sinh B → BB biểu diễn sự kề nhau của hai hộp. - Luật sinh B → B sub B biểu diễn sự sắp đặt, trong đó hộp chỉ số thứ 2 có kích thước nhỏ hơn, nằm thấp hơn hộp thứ nhất. - Thuộc tính kế thừa ps (point size - kích thước điểm) phản ánh độ lớn của công thức. - Luật sinh B → text ứng với luật ngữ nghiã B.ht:= text.h * B.ps lấy chiều cao thực của text (h) nhân với kích thước điểm của B để có được chiều cao của hộp. - Luật sinh B → B1B2 được áp dụng thì B1, B2 kế thừa kích thước điểm của B bằng luật copy. Ðộ cao của B bằng giá trị lớn nhất trong độ cao của B1, B2. - Khi luật sinh B → B1 sub B2 được áp dụng thì hàm shrink sẽ giảm kích thước điểm của B2 còn 30% và hàm disp đẩy hộp B2 xuống. Ðây là một định nghĩa L_thuộc tính vì chỉ có duy nhất một thuộc tính kế thừa ps và thuộc tính này chỉ phụ thuộc vào vế trái của luật sinh. Dựa vào 3 yêu cầu nói trên, ta xen các hành vi ngữ nghĩa tương ứng với luật ngữ nghĩa vào vế phải của mỗi luật sinh để được lược đồ dịch. S Æ {B.ps := 10 } B {S.ht := B.ht } B Æ { B1.ps := B.ps } B1 {BB2.ps := B.ps } B2 {B.ht := max(B1.ht, B2.ht ) } 129 B Æ {B1.ps := B.ps } B1 sub {BB2.ps := shrink(B.ps) } B2 {B.ht := disp(B1.ht, B2.ht ) } B Æ text {B.ht := text.h * B.ps } Hình 5.19 - Lược đồ dịch được tạo ra từ hình 5.18 Chú ý: Ðể dễ đọc mỗi ký hiệu văn phạm trong luật sinh được viết trên một dòng và hành vi được viết vào bên phải. Chẳng hạn: S Æ {B.ps := 10 } B {S.ht := B.ht } Ðược viết thành S Æ {B.ps := 10 } B {S.ht := B.ht } V. DỊCH TRÊN XUỐNG 1. Loại bỏ đệ qui trái Vấn đề loại bỏ đệ qui trái của một văn phạm đã được trình bày trong mục III của chương IV. Ở đây chúng ta giải quyết vấn đề chuyển một lược đồ dịch của văn phạm đệ quy trái thành một lược đồ dịch mới không còn đệ quy. Giả sử, ta có lược đồ dịch dạng A Æ A1 Y {A.a := g(A1.a, Y.y) } A Æ X {A.a := f(X.x) } Ðây là một văn phạm đệ quy trái, áp dụng giải thuật khử đệ qui trái ta được văn phạm không đệ quy trái A Æ X R R Æ Y R | ε Bổ sung hành vi ngữ nghĩa cho văn phạm ta được lược đồ dịch: A Æ X { R.i := f(X.x) } R {A.a := R.s } R Æ Y {R1.i := g(R.i, Y.y) } R1 {R.s := R1.s } R Æ ε {R.s := R.i } Ví dụ 5.15: Xét lược đồ dịch của văn phạm đệ quy trái cho biểu thức. E Æ E1 + T {E.val := E1.val + T.val } E Æ E1 - T {E.val := E1.val - T.val } E Æ T {E.val := T.val } 130 T Æ (E) {T.val := E.val } T Æ num {T.val := num.val } Hình 5.20 - Lược đồ dịch của một văn phạm đệ quy trái Vận dụng ý kiến trên ta khử đệ quy trái để được lược đồ dịch không đệ quy trái E Æ T {R.i := T.val } R {E.val := R.s } R Æ + T {R1.i := R.i + T.val } R1 {R.s := R1.s } R Æ - T {R1.i := R.i - T.val } R1 {R.s := R1.s } R Æ ε {R.s := R.i } T Æ ( E ) {T.val := E.val } T Æ num { T.val := num.val } Hình 5.21 - Lược đồ dịch đã được chuyển đổi có văn phạm đệ quy phải Chẳng hạn đánh giá biểu thức 9 - 5 + 2 E T.val = 9 Hình 5.22 - Xác định giá trị của biểu thức 9-5+2 Ví du 5.16: Xét lược đồ dịch xây dựng cây cú pháp cho biểu thức E Æ E1 + T {E.nptr := mknode(‘+’, E1.nptr, T.nptr) } E Æ E1 - T {E.nptr := mknode(‘-’, E1.nptr, T.nptr) } E Æ T {E.nptr := T.nptr } T Æ (E) {T.nptr := E.nptr } T Æ id {T.nptr := mkleaf(id, id.entry) } R.i = 6 num.val = 9 R.i = 9 + T.val = 5 num.val = 5 R.i = 4 T.val = 2 num.val = 2 - ε 131 T Æ num {T.nptr := mkleaf(num, num.val) } Áp dụng quy tắc khử đệ quy trái trên với E ≈ A, +T, -T ≈ Y và T ≈ X ta có lược đồ dịch E Æ T {R.i := T.nptr } R {E.nptr := R.s } R Æ + T {R1.i := mknode(‘+’, R.nptr, T.nptr) } R1 {R.s := R1.s } R Æ - T {R1.i := mknode(‘-’, R.nptr, T.nptr) } R1 {R.s := R1.s } R Æ ε {R.s := R.i } T Æ ( E ) {T.nptr := E.nptr } T Æ id {T.nptr := mkleaf(id, id.entry) } T Æ num { T.nptr := mkleaf(num, num.val) } Hình 5.23 - Lược đồ dịch được chuyển đổi để xây dựng cây cú pháp 2. Thiết kế bộ dịch dự đoán Giải thuật: Xây dựng bộ dịch trực tiếp cú pháp dự đoán (Predictive - Syntax - Directed Translation) Input: Một lược đồ dịch cú pháp trực tiếp với văn phạm có thể phân tích dự đoán. Output: Mã cho bộ dịch trực tiếp cú pháp. Phương pháp: 1. Với mỗi ký hiệu chưa kết thúc A, xây dựng một hàm có các tham số hình thức tương ứng với các thuộc tính kế thừa của A và trả về giá trị của thuộc tính tổng hợp của A. 2. Mã cho ký hiệu chưa kết thúc A quyết định luật sinh nào được dùng cho ký hiệu nhập hiện hành. 3. Mã kết hợp với mỗi luật sinh như sau: chúng ta xem xét token, ký hiệu chưa kết thúc và hành vi bên phải của luật sinh từ trái sang phải i) Ðối với token X với thuộc tính tổng hợp x, lưu giá trị của x vào trong biến được khai báo cho X.x. Sau đó phát sinh lời gọi để hợp thức (match) token X và dịch chuyển đầu đọc. 132 ii) Ðối với ký hiệu chưa kết thúc B, phát sinh lệnh gán C := B(b1, b2, ..., bk) với lời gọi hàm trong vế phải của lệnh gán, trong đó b1, b2,..., bk là các biến cho các thuộc tính kế thừa của B và C là biến cho thuộc tính tổng hợp của B. iii) Ðối với một hành vi, chép mã vào trong bộ phân tích cú pháp, thay thế mỗi tham chiếu tới một thuộc tính bởi biến cho thuộc tính đó. Ví dụ 5.17: Xét lược đồ dịch cho việc xây dựng cây cú pháp cho biểu thức. Ta thấy đó là một văn phạm LL(1) nên phù hợp cho phân tích trên xuống. Với 3 ký hiệu chưa kết thúc E, R, T ta xây dựng 3 hàm tương ứng: function E: ↑ syntax - tree - node; /* E không có thuộc tính kế thừa */ function R (i : ↑ syntax - tree - node) : ↑ syntax - tree - node function T : ↑ syntax - tree - node; Dùng token addop biểu diễn cho + và - ta có thể kết hợp hai luật sinh thành một luật sinh mới. R Æ addop T {R1.i := mknode(addop.lexeme, R.i, T.nptr) } R1 {R.s := R1.s } R Æ ε {R.s := R.i } Ta có hàm R như sau: function R(i : ↑ syntax_ tree_node) : ↑ syntax_tree_node; var nptr, i1, s1, s : ↑ syntax_tree_node; addoplexeme : char; begin if lookahead = addop then begin /* luật sinh R → addop TR */ addoplexeme := lexval; match(addop); nptr := T; i1 := mknode(addoplexeme, i, nptr); s1 := R(i1); s := s1; end else s := i; /* Luật sinh R → ε */ return s; end; Hình 5.24 - Xây dựng cây cú pháp đệ quy giảm 133 BÀI TẬP CHƯƠNG V 5.1. Xây dựng một cây phân tích cú pháp chú thích cho biểu thức số học sau: (4 * 7+ 1) * 2 5.2. Xây dựng một cây phân tích cú pháp và cây cú pháp cho biểu thức ((a) + (b)) theo: a) Ðịnh nghĩa trực tiếp cú pháp cho biểu thức số học. b) Lược đồ dịch cho biểu thức số học. 5.3. Xây dựng một DAG cho các biểu thức sau đây: a) a + a + ( a+ a + a + ( a+ a+ a+ a)) b) x *( 3 *x + x * x) 5.4. Văn phạm sau đây sinh ra các biểu thức có được khi áp dụng một toán tử số học + cho các hằng số nguyên và số thực. Khi 2 số nguyên được công lại, kiểu kết quả là kiểu nguyên, ngược lại nó là kiểu số thực. E → E + T | T T → num • num | num a) Ðưa ra một định nghĩa trực tiếp cú pháp xác định kiểu của mỗi biểu thức con. b) Mở rộng định nghĩa trực tiếp cú pháp trên để dịch các biểu thức thành ký pháp hậu tố và xác định các kiểu. Dùng toán tử một ngôn inttoreal để chuyển một giá trị nguyên thành giá trị thực tương đương mà nhờ đó cả hai toán hạng của + ở dạng hậu tố có cùng kiểu. 5.5. Giả sử các khai báo sinh bởi văn phạm sau: D → id L L → , id L | : T T → integer | real a) Xây dựng một lược đồ dịch để nhập kiểu của mỗi định danh vào bảng danh biểu. b) Xây dựng chương trình dịch dự đoán từ lược đồ dịch trên. 134 5.6. Cho văn phạm sinh ra các dòng text như sau: S → L L → L B | B B → B sub F | F F → { L } | text a) Xây dựng một định nghĩa trực tiếp cú pháp cho văn phạm. b) Chuyển định nghĩa trực tiếp cú pháp trên thành lược đồ dịch. c) Loại bỏ đệ quy trái trong lược đồ dịch vừa xây dựng. 135
File đính kèm:
- bai_giang_nguyen_ly_ngon_ngu_lap_trinh_chuong_v_dich_truc_ti.pdf