Bài giảng Nhập môn chương trình dịch - Bài 6: Sinh mã trung gian - Hoàng Anh Việt
Ngôn ngữ trung gian
• Là ngôn ngữ cho một loại máy trừu tượng
• Cho phép sinh mã không phụ thuộc vào máy
đích
• Cho phép tối ưu mã trước khi sinh mã máy thật
sự
Cây cú pháp
thông tin điều khiển
Pentium
Java bytecode
AMD
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Nhập môn chương trình dịch - Bài 6: Sinh mã trung gian - Hoàng Anh Việt", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
Tóm tắt nội dung tài liệu: Bài giảng Nhập môn chương trình dịch - Bài 6: Sinh mã trung gian - Hoàng Anh Việt
1Bài 6.
SINH MÃ TRUNG GIAN
Hoàng Anh Việt
Viện CNTT&TT - ĐHBKHN
Mô tả các bước dịch (1)
Mã nguồn (dãy các kí tự)
If (a == 0) min = a; Phân tích từ vựng
Phân tích cú pháp
Phân tích ngữ nghĩa
Dãy các từ tố (token)
Cây cú pháp
Cây cú pháp điều khiển
If ( Id:a == 0 ) Id:min = Id:a ;
if
== = ;
a 0 min a
if
== = ;
a 0 min aint int int
lvalue
int
intboolean
Mô tả các bước dịch (2)
if
== = ;
a 0 min aint int int
lvalue
int
intboolean Sinh mã trung gian
Sinh mã assembly
Tối ưu mã
SEQ(CJUMP(TEMP(a) == 0, L1, L2),
LABEL(L1),
TEMP(min) = TEMP(a)
LABEL(L2))
cmp rb, 0
jnz L2
L1: mov ra, rb
L2:
cmp ecx, 0
cmovz edx,ecx
Ngôn ngữ trung gian
• Là ngôn ngữ cho một loại máy trừu tượng
• Cho phép sinh mã không phụ thuộc vào máy
đích
• Cho phép tối ưu mã trước khi sinh mã máy thật
sự
Cây cú pháp
+
thông tin điều khiển
Pentium
Java bytecode
AMD
Ngôn ngữ trung gian
• Dễ sinh ra từ cây cú pháp
• Dễ sinh mã máy
• Số lượng lệnh nhỏ, gọn
– Dễ tối ưu mã
– Dễ chuyển sang loại mã máy khác
Cây cú pháp (>40 nút)
Mã trung gian (13 nút)
Pentium (>200 lệnh)
Ngôn ngữ trung gian
• Một dạng thể hiện của chương trình nằm giữa
cây cú pháp điều khiển và mã máy
• Sử dụng
– Lệnh nhảy
– Thanh ghi
– Vị trí trên bộ nhớ
Cây cú pháp
+
thông tin điều khiển
Pentium
Java bytecode
AMD
Mã trung
gian
Tối ưu mã
Một ngôn ngữ trung gian
• IR (Intermediate Representation) là một cây thể
hiện các lệnh của một loại máy trừu tượng
• Nút lệnh không trả lại giá trị, được thực hiện theo
thứ tự nhất định
– Ví dụ: MOVE, SEQ, CJUMP
• Nút biểu thức trả lại giá trị, các nút con có thể thực
hiện theo thứ tự bất kì
– Ví dụ: ADD, SUB
– Cho phép tối ưu mã
Mô tả các nút biểu thức của IR
• CONST(i): hằng số nguyên i
• TEMP(t): thanh ghi t, máy trừu tượng có vô hạn thanh ghi.
• OP(e1, e2): các phép toán
– Số học: ADD, SUB, MUL, DIV, MOD
– Logic: AND, OR, XOR, LSHIFT, RSHIFT
– So sánh: EQ, NEQ, LT, GT, LEQ, GEQ
• MEM(e): giá trị bộ nhớ ở vị trí e
• CALL(f, a0, a1, ): giá trị của hàm f với các tham số a0, a1,
• NAME(n): địa chỉ của lệnh hoặc dữ liệu có tên là n
• ESEQ(s, e): giá trị của e sau khi lệnh s được thực hiện
CONST
• Nút CONST đại diện cho hằng số
• Giá trị của nút là i
CONST(i)
TEMP
• Nút TEMP đại diện cho một thanh ghi
trong số vô hạn các thanh ghi của máy
trừu tượng
• Các biến cục bộ và các biến tạm
• Để dễ viết, ký hiệu FP = TEMP(FP) là
địa chỉ bắt đầu bộ nhớ của hàm
• Giá trị của nút là giá trị của thanh ghi
tại thời điểm tính toán
TEMP(t)
Toán tử
• Máy trừu tượng có nhiều phép toán
• Tính giá trị của e1 và e2, sau đó áp dụng phép toán với
các giá trị này
• e1 và e2 phải là hai nút có giá trị
• Có thể tính giá trị e1 và e2 theo thứ tự bất kì
OP
e1 e2
OP(e1, e2)
MEM
• Nút MEM đại diện cho một vị trí trong bộ nhớ
• Giá trị của nút là giá trị tại vị trí e trong bộ nhớ
MEM
e
MEM(e)
CALL
• Nút CALL đại diện cho một lời gọi hàm
• Không định nghĩa cách cài đặt việc truyền
tham số, quản lý ngăn xếp
• Giá trị của nút là giá trị của hàm
CALL
ef
CALL(ef, e0, e1,)
e0e1e2
Địa chỉ của hàm Tham số
NAME
• Nút NAME đại diện cho địa chỉ của một tên
trên bộ nhớ
• VD: địa chỉ của một nhãn nhảy
NAME(n)
ESEQ
• Nút ESEQ tính toán giá trị của biểu thức e sau
khi thực hiện lệnh s
ESEQ
s e
ESEQ(s, e)
Mô tả các nút lệnh của IR
• MOVE(dest, e): chuyển giá trị của e vào dest
• EXP(e): tính toán giá trị của e, không cần lưu lại kết
quả
• SEQ(s1, s2, sn): thực hiện các lệnh theo thứ tự
• JUMP(e): nhảy đến địa chỉ e
• CJUMP(e, l1, l2): nhảy đến l1 hoặc l2 tuỳ thuộc vào
giá trị của e là true hoặc false
• LABEL(n): tạo ra nhãn có tên n
Ví dụ n = 0;
while (n < 10)
{
n = n + 1;
}
SEQ(
MOVE(TEMP(n), CONST(0)),
LABEL(HEAD),
CJUMP(LT(TEMP(n), CONST(10)), NAME(BODY), NAME(END)),
LABEL(BODY),
MOVE(TEMP(n), ADD(TEMP(n), CONST(1))),
JUMP(NAME(HEAD)),
LABEL(END)
)
SEQ
MOVE LABEL(HEAD)CJUMP LABEL(BODY)MOVE LABEL(END)JUMP
TEMP(n) CONST(0) LT NAME(BODY)
TEMP(n) CONST(10)
NAME(END)
TEMP(n) ADD
TEMP(n) CONST(1)
NAME(HEAD)
Cấu trúc của IR
• Gốc của cây là một nút lệnh
• Các nút biểu thức nằm dưới nút lệnh
• Chỉ có nút biểu thức ESEQ có nút lệnh nằm
dưới
• Có thể duyệt cây IR để chạy chương trình
Sinh cây IR (mã trung gian)
• Kỹ thuật: phương pháp dịch sử dụng cú pháp
điều khiển (giống kiểm tra kiểu)
• Chuyển cây cú pháp điều khiển thành cây IR
• Mỗi cây con của cây cú pháp được chuyển
thành một cây con dạng IR có cùng giá trị
Sinh cây IR
• Giống kiểm tra kiểu: thêm một phương thức
vào nút tương ứng trong cây cú pháp
abstract class ASTNode {
IRNode translate(SymTab A) { }
}
• Cài đặt kiểu đệ quy
• Vấn đề: giống như kiểm tra kiểu, cần mô tả
chính xác cách viết hàm translate()
Biểu thức
• Các nút của cây cú pháp thể hiện biểu thức
được chuyển thành nút IR tương ứng
• Kí hiệu [e] là biểu diễn IR của nút e trong cây
cú pháp
ADD
[e1] [e2]
+
e1 e2
Câu lệnh
• Dãy các lệnh được biểu diễn bằng nút SEQ
trong biểu diễn IR
• Nếu [s1] và [s2] là biểu diễn IR của nút s1 và s2
• thì SEQ([s1], [s2]) là biểu diễn IR của s1; s2
SEQ
[s1] [s2]
s1; s2
Biến
• Biến cục bộ v chuyển thành nút TEMP(v)
• Tham số thứ i nằm ở vị trí
MEM(ADD(FP,4*i+4))
v
TEMP(v)
MEM
ADD
FP CONST(4*i+4)
arg n-1
arg 1
arg 0
return
addr
FP
SS
Stack
Phép gán
• Phép gán v = e chuyển thành nút MOVE(dest,
[e]) với dest là địa chỉ của v, [e] là biểu diễn IR
của e
• Ví dụ
x = 2
MOVE
CONST(2)MEM
ADD
FP CONST(8)
Phép gán
• Cách dịch
• Vấn đề: nút MOVE không có giá trị, làm thế
nào để dịch x = (y = 2)?
e1 = e2 MOVE
[e2][e1]
ESEQ
[e1]
e1 = e2
MOVE
[e2][e1]
Phép gán
• Như vậy, [e1] phải chạy 2 lần, cần lưu lại giá
trị của [e1]
e1 = e2
MOVE
[e2]TEMP(te)
ESEQ
TEMP(te)SEQ
MOVE
TEMP(te)[e1]
Thảo luận
27
File đính kèm:
bai_giang_nhap_mon_chuong_trinh_dich_bai_6_sinh_ma_trung_gia.pdf

