Nghiên cứu ứng dụng mạng neural nhân tạo để dự đoán tốc độ ăn mòn carbon dioxide (CO2) trong đường ống dẫn dầu khí

Ăn mòn trong đường ống do tác nhân Carbon Dioxide (CO2) là vấn đề đáng

quan tâm trong công nghiệp dầu khí. Trong nghiên cứu này, nhóm tác giả

đề xuất phương pháp tiếp cận mới để dự đoán tốc độ ăn mòn do Carbon

Dioxide (CO2) trong đường ống, ứng dụng phương pháp máy học, cụ thể là

mạng Neural nhân tạo (ANN). Sau khi tiến hành thu thập, chọn lọc đặc

trưng, tiền xử lý dữ liệu, tập dữ liệu phục vụ cho nghiên cứu bao gồm 40

điểm dữ liệu với 9 đặc trưng (features). Mô hình mạng ANN đã được xây

dựng với 2 lớp ẩn có kích thước lần lượt là 18 node và 9 node; với hàm kích

hoạt lần lượt là ReLU và Sigmoid. Nhóm tác giả sử dụng các thuật toán

Early Stopping và RMSprop để tăng độ chính xác của mô hình ANN, giảm

ảnh hưởng của bộ dữ liệu nhỏ. Mô hình dự đoán theo tiêu chuẩn Norsok M-

506 cũng được áp dụng để so sánh hiệu quả với mô hình mạng neural nhân

tạo. Các chỉ tiêu bao gồm căn bậc hai sai số bình phương trung bình

(RMSE), sai số tuyệt đối trung bình (MAE), hệ số xác định (R2). Kết quả

nghiên cứu cho thấy dự đoán của mô hình mạng neural nhân tạo đạt các

chỉ tiêu R2 = 0.938, RMSE = 0,014, MAE = 0,011 tốt hơn nhiều so với mô hình

thực nghiệm theo tiêu chuẩn Norsok M-506.

pdf 9 trang yennguyen 3920
Bạn đang xem tài liệu "Nghiên cứu ứng dụng mạng neural nhân tạo để dự đoán tốc độ ăn mòn carbon dioxide (CO2) trong đường ống dẫn dầu khí", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Nghiên cứu ứng dụng mạng neural nhân tạo để dự đoán tốc độ ăn mòn carbon dioxide (CO2) trong đường ống dẫn dầu khí

Nghiên cứu ứng dụng mạng neural nhân tạo để dự đoán tốc độ ăn mòn carbon dioxide (CO2) trong đường ống dẫn dầu khí
90 Tạp chí Khoa học Kỹ thuật Mỏ - Địa chất Tập 60, Kỳ 1 (2019) 90 - 98 
Nghiên cứu ứng dụng mạng neural nhân tạo để dự đoán tốc độ 
ăn mòn carbon dioxide (CO2) trong đường ống dẫn dầu khí 
Nguyễn Phùng Hưng *, Lê Đức Vinh, Triệu Hùng Trường 
Khoa Dầu khí, Trường Đại học Mỏ - Địa chất, Việt Nam 
THÔNG TIN BÀI BÁO 
TÓM TẮT 
Quá trình: 
Nhận bài 08/11/2018 
Chấp nhận 05/01/2019 
Đăng online 28/02/2019 
 Ăn mòn trong đường ống do tác nhân Carbon Dioxide (CO2) là vấn đề đáng 
quan tâm trong công nghiệp dầu khí. Trong nghiên cứu này, nhóm tác giả 
đề xuất phương pháp tiếp cận mới để dự đoán tốc độ ăn mòn do Carbon 
Dioxide (CO2) trong đường ống, ứng dụng phương pháp máy học, cụ thể là 
mạng Neural nhân tạo (ANN). Sau khi tiến hành thu thập, chọn lọc đặc 
trưng, tiền xử lý dữ liệu, tập dữ liệu phục vụ cho nghiên cứu bao gồm 40 
điểm dữ liệu với 9 đặc trưng (features). Mô hình mạng ANN đã được xây 
dựng với 2 lớp ẩn có kích thước lần lượt là 18 node và 9 node; với hàm kích 
hoạt lần lượt là ReLU và Sigmoid. Nhóm tác giả sử dụng các thuật toán 
Early Stopping và RMSprop để tăng độ chính xác của mô hình ANN, giảm 
ảnh hưởng của bộ dữ liệu nhỏ. Mô hình dự đoán theo tiêu chuẩn Norsok M-
506 cũng được áp dụng để so sánh hiệu quả với mô hình mạng neural nhân 
tạo. Các chỉ tiêu bao gồm căn bậc hai sai số bình phương trung bình 
(RMSE), sai số tuyệt đối trung bình (MAE), hệ số xác định (R2). Kết quả 
nghiên cứu cho thấy dự đoán của mô hình mạng neural nhân tạo đạt các 
chỉ tiêu R2 = 0.938, RMSE = 0,014, MAE = 0,011 tốt hơn nhiều so với mô hình 
thực nghiệm theo tiêu chuẩn Norsok M-506. 
© 2019 Trường Đại học Mỏ - Địa chất. Tất cả các quyền được bảo đảm. 
Từ khóa: 
Ăn mòn CO2 
Đường ống 
Mạng neural nhân tạo 
Tốc độ ăn mòn 
Norsok M-506 
1. Mở đầu 
Ăn mòn kim loại trong và ngoài đường ống 
dầu khí là một trong những vấn đề lớn cần giải 
quyết của ngành công nghiệp dầu khí. Ước tính 
rằng hư hỏng do ăn mòn chiếm tới 30-33% tổng 
số hư hỏng ghi nhận được trên toàn tuyến ống 
trên thế giới (Bersani et al., 2010), và là nguyên 
nhân gây ra rò rỉ hoặc vỡ ống. Trên thế giới cũng 
như trong nước đã có nhiều nghiên cứu về ăn mòn 
trong và ngoài đường ống. Trong điều kiện chất 
lưu vận chuyển chỉ là các hydro cácbon, đường 
ống hầu như không bị ăn mòn trong. Sự xuất hiện 
của các tác nhân hóa học: nước, hơi nước ngưng 
tụ, các khí hòa tan (H2S, CO2, O2 ), chất rắn hòa 
tan, phân tán, muối NaCl, MgCl2 kết hợp với các 
tác nhân vật lý: nhiệt độ, áp suất, chế độ dòng chảy 
 gây nên các phản ứng điện hóa dẫn đến ăn mòn 
và phá hủy đường ống (Pierre, 2002). Trong đó ăn 
mòn trong do cacbon dioxide (CO2) là dạng ăn 
mòn thường gặp nhất. 
Quá trình ăn mòn trong đường ống được 
đánh giá thông qua chỉ số tốc độ ăn mòn 
_____________________ 
*Tác giả liên hệ 
E - mail: nph5680@gmail.com 
 Nguyễn Phùng Hưng và nnk./Tạp chí Khoa học Kỹ thuật Mỏ - Địa chất 60 (1), 90 - 98 91 
(mm/năm). Việc dự đoán chính xác tốc độ ăn mòn 
trong đường ống giúp giải quyết hàng loạt các vấn 
đề về kỹ thuật dầu khí: từ thiết kế, xây dựng tuyến 
ống; tối ưu chi phí vận hành: chống ăn mòn, lên kế 
hoạch và thực hiện kiểm tra, bảo dưỡng, sửa chữa, 
thay thế một phần; ngăn chặn rò rỉ dầu và khí gây 
tổn hại tới môi trường. 
Hiện nay, phương pháp phổ biến nhất để 
đánh giá ăn mòn trong và các khuyết tật cho toàn 
bộ đường ống dẫn dầu khí là dùng thiết bị kiểm tra 
bên trong đường ống (ILI: in-line inspection), dựa 
trên kỹ thuật từ thông rò rỉ (MFL: Magnetic Flux 
Leakage) hoặc kỹ thuật sóng siêu âm nén giãn 
(Ultrasonic Compression Wave) (Kexi Liao et al., 
2012; NACE SP0102, 2010). Các tiêu chuẩn (NACE 
SP0110, 2010; NACE SP0116, 2016; NACE 
SP0206-SG, 2016) của Hiệp hội các quốc gia về 
chống ăn mòn (NACE) đề xuất cách tiếp cận để 
tính toán tốc độ ăn mòn trên toàn bộ tuyến ống 
dựa trên kết quả khảo sát bên trong của một đoạn 
đường ống (ILI) căn cứ vào các mô hình dự đoán 
tốc độ ăn mòn đã được thế giới công nhận như: 
NORSOK model (Statoil, Saga, Hydro), de Waard 
model (Shell), Cassandra (BP), HYDROCOR 
(Shell), CORPLUS (Total), Tulsa model (Đại học 
Tulsa), ULL model (Đại học Louisiana Lafayette) 
Các mô hình trên thu được nhờ các phương 
pháp tính toán lý thuyết, thí nghiệm, bán thực 
nghiệm và dữ liệu thực tế; là kết quả nghiên cứu 
của các tổ chức, công ty dầu khí, các trung tâm 
nghiên cứu lớn trên thế giới. Tuy nhiên, kết quả dự 
đoán của các mô hình đôi khi không phù hợp với 
giá trị tốc độ ăn mòn thực tế và rất khác nhau, do 
các mô hình có đối tượng nghiên cứu khác nhau, 
được tính toán trên bộ tham số khác nhau. Roft 
Nyborg nhận định không mô hình thực nghiệm 
nào có độ tin tưởng ± 50% khi áp dụng trên điều 
kiện dữ liệu rộng và chứng minh bằng việc so sánh 
mô hình Norsok M-506 với mô hình de Waard 
trên đoạn ống 10km, với nhiệt độ đầu vào 90oC và 
đầu ra 20 oC (Roft Nyborg, 2005, 2009). 
Do không thể có một hàm số chính xác hoặc 
phù hợp để liên kết những thông số đầu vào tới 
những thông số đầu ra, vì vậy phương pháp học 
máy xuất hiện như ứng viên phù hợp để nhận 
được những mối liên hệ hàm số giữa những thông 
số đó và kết quả mong muốn (Mohaghegh, 1995). 
Trong những năm gần đây, nhiều phương pháp 
máy học máy và thống kê đã được phát triển để dự 
đoán tốc độ ăn mòn trong do CO2: mạng neural 
nhân tạo, thuật toán tiến hóa, mạng neural mờ, 
logic mờ, phương pháp Monte Carlo (Mohamed 
Layouni, 2014; Bassam, 2009) . Obaseki M. xây 
dựng mạng neural nhân tạo cho bộ dữ liệu 60 
điểm với 13 đặc trưng đầu vào để dự đoán tốc độ 
ăn mòn trên đường ống vùng Niger Delta ở 
Nigeria và đạt được kết quả tốt so với kết quả 
phần mềm mô phỏng được sử dụng tại 6 công ty 
dầu khí Niegera (Obaseki et al., 2017). Kexi Liao 
sử dụng các thuật toán tối ưu để xây dựng 3 mô 
hình neural nhân tạo 1 lớp ẩn 14 nodes cho tập dữ 
liệu 116 điểm dữ liệu, với 7 đặc trưng dữ liệu đầu 
vào có hệ số tương quan cao hơn 0,7 để dự đoán 
tốc độ ăn mòn trong đường ống dẫn khí có hơi 
nước. Kết quả chỉ ra rằng mô hình mạng neural 
networks cho kết quả dự đoán tốt hơn mô hình de 
Waard, và mô hình Top - of - Line (Kexi Liao et al., 
2012). Tuy nhiên cả hai công trình nêu trên đều 
đánh giá hiệu quả mô hình trên giá trị sai số tuyệt 
đối và giá trị sai số tương đối, theo nhóm nghiên 
cứu là 2 chỉ tiêu đó chưa đủ để đánh giá tính hiệu 
quả của mô hình dự đoán. Mazura Mat Din sử 
dụng trực tiếp dữ liệu đầu vào là các kết quả của 
thiết bị kiểm tra bên trong đường ống (In line 
Inspection): độ sâu, chiều dài, chiều rộng, hướng 
và hành trình, để xây dựng mạng neural nhân tạo 
với ba lớp ẩn. Kết quả thu được rất tốt với các chỉ 
tiêu hệ số xác định R2 = 0,9988, sai số tuyệt đối 
trung bình MAE = 0,0016, căn bậc hai sai số bình 
phương trung bình RMSE = 0,003 (Mazura Mat 
Din et al., 2015). Giulia De Masi sử dụng tập dữ liệu 
10 đặc trưng đầu vào: 8 đặc trưng cho dòng chảy 
và thông số vận chuyển, và 2 đặc trưng là kết quả 
dự đoán tốc độ ăn mòn bởi mô hình Norsok và de 
Waard. Một mô hình neural nhân tạo khớp 
(Fitting Neural Network) một lớp ẩn 2 nodes được 
xây dựng, kết quả thu được có các giá trị chỉ tiêu 
chưa thực sự cao: hệ số tương quan R = 0,66, căn 
bậc hai của sai số phần trăm trung bình RMSPE = 
52, trung bình sai số phần trăm tuyệt đối MAPE = 
31 (Giulia De Masi et al., 2014). Hiện nay, chưa có 
một công trình nghiên cứu nào ứng dụng phương 
pháp học máy để dự đoán tốc độ ăn mòn được 
công bố tại Việt Nam. 
Trong nghiên cứu này, nhóm tác giả trình bày 
phương pháp phát triển một mô hình mạng neural 
nhân tạo (Artificial Neural Network) để dự đoán 
tốc độ ăn mòn trên đường ống dẫn dầu và khí. 
Phương pháp thực nghiệm theo tiêu chuẩn 
Norsok M-506 được áp dụng để so sánh hiệu quả 
92 Nguyễn Phùng Hưng và nnk./Tạp chí Khoa học Kỹ thuật Mỏ - Địa chất 60 (1), 90 - 98 
với mô hình mạng neural đã phát triển. 
2. Phương pháp nghiên cứu 
Trong nghiên cứu này, phương pháp máy học 
với thuật toán hồi quy phi tuyến tính thông qua 
mạng neural nhân tạo được sử dụng để dự đoán 
tốc độ ăn mòn. Các bước tiến hành bao gồm: chuẩn 
bị dữ liệu đầu vào; chia tập dữ liệu ra thành các 
thành phần với tỷ lệ: bộ dữ liệu huấn luyện, bộ dữ 
liệu xác thực, bộ dữ liệu kiểm tra; xây dựng mạng 
neural nhân tạo dự đoán tốc độ ăn mòn; đánh giá 
hiệu quả của mạng neural nhân tạo. Kết quả dự 
đoán của mô hình mạng neural được sẽ được so 
sánh với kết quả tính toán theo tiêu chuẩn Norsok 
M-506. 
Để đánh giá hiệu quả của quá trình huấn 
luyện và kiểm tra so sánh giữa các mô hình, các 
tiêu chuẩn đánh giá được sử dụng bao gồm: căn 
bậc hai của sai số bình phương trung bình RMSE 
(Root Mean Square Error), sai số tuyệt đối trung 
bình (Mean Absolute Error), hệ số xác định R2 
(coefficient of determination). Giá trị RMSE biểu 
thị độ lớn trung bình của sai số. RMSE và MAE nằm 
trong khoảng (0, +∞), có giá trị lý tưởng khi bằng 
0. Hệ số xác định R2 là thông số độ lệch thống kê 
đơn giản biểu thị sự phù hợp với dữ liệu của một 
phép hồi quy. R2 của một phép hồi quy tuyến tính 
thường nằm trong khoảng (0,1). Lý tưởng nhất 
khi R2 = 1 nghĩa là mô hình hồi quy cho giá trị dự 
đoán hoàn toàn phù hợp với dữ liệu mà không có 
sai số. Khi R2 = 0, mô hình hồi quy không giải thích 
được bất cứ dữ liệu nào. R2 cũng có thể đạt giá trị 
âm, khi mà mô hình hồi quy cho kết quả tổng các 
độ lệch bình phương phần dư lớn hơn tổng các độ 
lệch bình phương toàn bộ, nghĩa là mô hình không 
phù hợp để dự đoán xét trên quan điểm thống kê. 
𝑅𝑀𝑆𝐸 = √
1
𝑛
∑ (𝑦𝑖 − �̂�𝑖)2
𝑛
𝑖=1 
𝑀𝐴𝐸 = 
1
𝑛
∑ |𝑦𝑖 − �̂�𝑖|
𝑛
𝑖=1 
𝑅2 = 1 −
 ∑ (𝑦𝑖 − �̂�𝑖)
2𝑛
𝑖=1
∑ (𝑦𝑖 − �̅�𝑖)2
𝑛
𝑖=1
Trong đó: yi - giá trị thực tế thứ i của n điểm 
dữ liệu; ŷ - giá trị dự đoán; y̅ - giá trị trung bình. 
2.1. Mô hình dự đoán tốc độ ăn mòn theo tiêu 
chuẩn Norsok M-506 
Đây là mô hình thực nghiệm được xây dựng 
bởi các công ty dầu khí Na Uy: Statoil, Norsk Hydro 
và Saga Petroleum và thuộc sở hữu của Norway 
Petroleum Industry (Norsok M-506, 2017). Mô 
hình này dựa trên các kết quả từ phòng thí 
nghiệm. So với các mô hình thực nghiệm khác, mô 
hình này có ưu thế khi có thể dự đoán cho khoảng 
nhiệt độ rộng từ 5 ÷ 150oC. Ngoài ra mô hình cũng 
hơn các mô hình khác khi tính đến tác dụng chống 
ăn mòn của lớp film phủ ở nhiệt độ cao, và độ pH 
cao. Trong phần mềm tính toán theo phiên bản 
tiêu chuẩn M- 506 mới nhất 2017, giới hạn để 
chương trình tính toán được là áp suất thành phần 
H2S lớn hơn 0,05 bar, tỷ số áp suất thành phần CO2 
trên áp suất thành phần H2S nhỏ hơn 20, một bước 
tiến so với phiên bản 2005 khi áp suất thành phần 
H2S phải lớn hơn 0,5 bar. Tuy nhiên mô hình này 
tương đối nhạy với sự thay đổi của pH. Khi tổng tỷ 
lệ của axit hữu cơ vượt qua 100ppm và áp suất 
thành phần CO2 nhỏ hơn 0,5 bar, mô hình dự đoán 
có thể không chính xác. 
Công thức tính toán theo mô hình tiêu chuẩn 
Norsok M-506 như sau: 
𝐶𝑅𝑡 = 𝐾𝑡 × (𝑓𝐶𝑂2)
0,62 
× (
𝑆
19
)
(0,146+0,0324×𝑙𝑜𝑔 (𝑓𝐶𝑂2))
× 𝑓(𝑝𝐻)𝑡 
CRt - tốc độ ăn mòn (mm/năm) tại nhiệt độ T 
(oC); Kt - hằng số cân bằng tại nhiệt độ T, fCO2 - độ 
loãng (fugacity) của CO2 (bar); f(pH)t - hệ số tác 
nhân pH tại nhiệt độ T; S - ứng suất ma sát lên 
thành (wall shear stress) đơn vị Pascal (Pa) 
2.2 Mô hình mạng neural nhân tạo dự đoán tốc 
độ ăn mòn 
Mạng neural nhân tạo là một thuật toán học máy 
(machine learning) xử lý thông tin được thiết kế 
mô phỏng chức năng và sự phức tạp của hệ thống 
neural sinh học (Robert, 1997). Neural sinh học là 
một khối cơ sở của hệ thống neural bao gồm 3 
phần chính: thân neural (soma), sợi nhánh 
(dendrite) và sợi trục (axon). Thông tin ở dạng tín 
hiệu điện được nhận bởi các nhánh, được xử lý bởi 
thân neural sau đó truyền qua sợi trục. Mô hình 
mạng neural nhân tạo được sử dụng rộng rãi nhất 
là mô hình mạng neural đa lớp MLP (Multi Layers 
Perceptron) sử dụng thuật toán lan truyền ngược 
(back propagation). 
Kiến trúc cơ bản một mạng neural đa lớp có 
cấu trúc bao gồm: 1 lớp đầu vào, n lớp ẩn (n>1) và 
1 lớp đầu ra. Quá trình học của một mạng neural 
(1) 
(2) 
(3) 
(4) 
 Nguyễn Phùng Hưng và nnk./Tạp chí Khoa học Kỹ thuật Mỏ - Địa chất 60 (1), 90 - 98 93 
nhân tạo nói trên thông thường bao gồm các 
bước: lan truyền tiến (feedforward), lựa chọn và 
tối ưu hóa hàm mất mát (loss function) thông qua 
việc tính đạo hàm hàm mất mát nhờ thuật toán lan 
truyền ngược dựa theo quy tắc chuỗi đạo hàm của 
hàm hợp (Robert, 1997; Geofrey, 2014) 
Mô phỏng neural sinh học, tiến trình lan 
truyền tiến diễn ra như sau: qua những đầu vào 
(input), mỗi đầu vào được nhân bởi một hàm 
trọng số trước khi đi vào node (unit, neural). Tại 
các node, diễn ra quá trình xử lý: tất cả dữ liệu đầu 
vào được nhân với trọng số (weight), cộng với hệ 
số bias và xử lý tổng qua một hàm kích hoạt 
(activation function) trước khi truyền thông tin 
tới những node của lớp tiếp theo và cứ như vậy 
đến lớp đầu ra. Các hàm kích hoạt thường được sử 
dụng là: ReLU, Sigmoid, Tanh. Hàm mất mát được 
lựa chọn cần thể hiện sự chênh lệch giữa hai đại 
lượng: giá trị được dự đoán và giá trị thực tế sao 
cho đơn giản hóa việc tính đạo hàm. Trong quá 
trình đào tạo, trọng số và bias được thay đổi bởi 
thuật toán tối ưu cho tới khi giá trị của hàm mất 
mát đủ nhỏ. 
2.2.1 Chuẩn bị dữ liệu đầu vào 
Để thực hiện nghiên cứu này, nhóm tác giả sử 
dụng tập dữ liệu được Obaseki M. dùng trong 
nghiên cứu (Obaseki et al., 2017) đã nêu ở trên và 
tiến hành tiền xử lý dữ liệu. Việc tiền xử lý dữ liệu 
là cần thiết nhằm mục đích: lựa chọn các thông số 
đặc trưng cho mô hình, lọc các mẫu dữ liệu 
(instants); làm sạch - xóa bỏ các điểm dữ liệu 
nhiễu, dữ liệu bất thường, chuẩn hóa dữ liệu... Kết 
quả của bước tiền xử lý dữ liệu, nhóm tác giả sử 
dụng tập hợp 40 điểm dữ liệu với 9 đặc trưng sau 
làm dữ liệu đầu vào cho mô hình ANN: đường kính 
(mm), tuổi (năm), nhiệt độ (oC), áp suất thành 
phần CO2 (bar), tốc độ dòng chảy chất lưu (m/s), 
áp suất chất lưu (bar), tỷ trọng riêng chất lưu 
(kg/m3), độ nhớt động lực học (cP), độ pH (pH). 
Dữ liệu sử dụng cho nghiên cứu được tóm tắt dưới 
dạng biểu đồ hộp như trong Hình 1. 
Hình 1 tóm tắt các đặc trưng dữ liệu sử dụng 
cho nghiên cứu này với: đường kính ống dao động 
từ 192,7 mm đến 914 mm, tuổi ống từ 6 đến 41 
năm, nhiệt độ chất lưu từ 28oC đến 70oC, áp suất 
từ 30 bar đến 70 bar, tốc độ dòng chảy chất lưu từ 
0,76 m/s đến 3,5 m/s, áp suất thành phần CO2 từ 
2 bar đến 6 bar, tỷ trọng riêng chất lưu từ 816,88 
kg/m3 đến 842,4 kg/m3, độ nhớt động học chất 
lưu từ 9,65 cP đến 54,3 cP; tốc độ ăn mòn từ 0,02 
mm/năm đến 0,24 mm/năm. 
Hệ số tương quan Pearson (Pearson 
correlation coefficient) giữa các đặc trưng dữ liệu 
đầu vào được tính toán và xác định trong bảng 1. 
Các giá trị trong bảng 2 cho thấy các đặc trưng đầu 
vào hầu hết có mối tương quan thấp với nhau, 
ngoại trừ 2 cặp đặc trưng tỷ trọng riêng - độ nhớt 
động lực học, tỷ trọng riêng - nhiệt độ vốn là các 
đại lượng vật lý có mối tương quan cao, hoàn toàn 
tuân theo các phương trình vật lý. Trong tập dữ 
liệu đang xét, hệ số tương quan giữa tuổi ống và 
tốc độ ăn mòn là R = 0,55, vì thế có thể xác định 
tuổi ống là một đặc trưng không thể bỏ qua khi xây 
dựng mô hình dự đoán tốc độ ăn mòn. 
2.2.2. Chuẩn hóa dữ liệu đầu vào cho mạng neural 
nhân tạo 
Do các điểm dữ liệu trên với 9 đặc trưng khác 
nhau, đơn vị đo khác nhau, giá trị chênh lệch nhau 
quá lớn, nhóm nghiên cứu chuẩn hóa dữ liệu 
(feature normalization) sử dụng min-max scaler: 
Hình 1. Tóm tắt bộ dữ liệu sử dụng cho nghiên cứu. 
94 Nguyễn Phùng Hưng và nnk./Tạp chí Khoa học Kỹ thuật Mỏ - Địa chất 60 (1), 90 - 98 
Tương quan 
Đường 
kính 
Tuổi ống Nhiệt độ Áp suất Vận tốc 
Áp suất thành 
phần CO2 
pH Tỷ trọng Độ nhớt 
Đường kính 1.00 0.35 0.08 0.29 -0.68 0.07 -0.09 -0.08 -0.09 
Tuổi 0.35 1.00 -0.02 0.16 -0.17 0.13 -0.09 0.02 0.04 
Nhiệt độ 0.08 -0.02 1.00 0.04 -0.28 0.04 -0.15 -1.00 -0.95 
Áp suất 0.29 0.16 0.04 1.00 -0.23 -0.05 0.10 -0.04 -0.08 
Vận tốc -0.68 -0.17 -0.28 -0.23 1.00 0.12 0.04 0.28 0.37 
Áp suất thành 
phần CO2 
0.07 0.13 0.04 -0.05 0.12 1.00 -0.19 -0.04 0.05 
pH -0.09 -0.09 -0.15 0.10 0.04 -0.19 1.00 0.14 0.04 
Tỷ trọng -0.08 0.02 -1.00 -0.04 0.28 -0.04 0.14 1.00 0.95 
Độ nhớt -0.09 0.04 -0.95 -0.08 0.37 0.05 0.04 0.95 1.00 
x′= (x - min(x)) / (max(x)-min(x)) 
trong đó x là giá trị ban đầu, x′ là giá trị sau khi 
chuẩn hóa. Giá trị cực tiểu min(x), giá trị cực đại 
max(x) được tính trên toàn bộ dữ liệu ở cùng một 
đặc trưng. Kết quả là các giá trị các đặc trưng nằm 
trong khoảng [-1,1]. Qua đó, giúp việc huấn luyện 
mô hình dễ dàng hơn và chính xác hơn, ít phụ 
thuộc vào độ lớn và đơn vị của từng đặc trưng của 
điểm dữ liệu. 
2.2.3. Xây dựng mô hình mạng neural nhân tạo. 
Mô hình mạng neural nhân tạo dự đoán tốc 
độ ăn mòn được nghiên cứu thuộc về dạng học có 
giám sát dạng hồi quy phi tuyến. Để tránh hiện 
tượng mô hình mạng quá khớp (overfitting) hoặc 
chưa khớp (underfitting) với tập huấn luyện và 
nâng cao chất lượng mô hình mạng ANN, dữ liệu 
ban đầu được phân chia làm 3 phần: đào tạo 
(training), xác thực (validation), và kiểm tra 
(testing). Tỷ lệ lần lượt là: phần dữ liệu huấn luyện 
chiếm 62,5% (25 điểm dữ liệu), bộ dữ liệu xác 
thực có 12,5% (5 điểm dữ liệu), bộ dữ liệu kiểm 
tra chiếm 25% (10 điểm dữ liệu). Do lượng dữ liệu 
thu thập được còn ít, nhóm tác giả sử dụng hàm 
ReLU, thuật toán Earnly Stopping, RMSprop tăng 
chất lượng dự đoán của mô hình, giảm độ phụ 
thuộc vào số lượng dữ liệu đầu vào. 
Số lớp ẩn, số lượng node (unit), các hàm kích 
hoạt, lựa chọn hàm mất mát (loss function, hay 
còn gọi là hàm giá trị - cost function) thuật toán tối 
ưu lan truyền ngược, là các lựa chọn quan trọng 
trong đào tạo mạng neural nhân tạo, giúp tăng độ 
chính xác và giảm thời gian tính toán. Số lớp ẩn và 
số lượng node trong mỗi lớp ẩn cần vừa đủ để đạt 
được độ chính xác cần thiết. Việc sử dụng nhiều 
lớp ẩn hơn, hoặc nhiều node trong mỗi lớp hơn chỉ 
tăng thời gian tính toán mà không cải thiện độ 
chính xác. Qua nhiều thử nghiệm và liên tục tối ưu, 
nhóm tác giả sử dụng 18 node (unit) cho lớp ẩn 
đầu tiên và 9 node (unit) cho lớp ẩn thứ 2 như 
Hình 2. 
Trong nghiên cứu này, nhóm tác giả sử dụng 
hàm ReLU (Rectified Linear Unit) (Hahnloser et 
al., 2000) cho lớp ẩn thứ nhất và hàm Sigmoid 
(Han et al., 1995) cho lớp ẩn tiếp theo. Hàm ReLU 
đã được chứng minh là giúp việc huấn luyện học 
máy và học sâu (deep learning) nhanh hơn rất 
nhiều, nguyên do đạo hàm của nó bằng 0 với x ≤ 0, 
và bằng 1 khi x>0. Công thức của hàm ReLU và 
hàm Sigmoid lần lượt như (6), (7). 
RELU: 
f(x) = max (0,x) 
(f(x) = 0 với x ≤ 0, f(s) = x với x >0) 
Sigmoid: 
𝑓(𝑥) = 
1
1+𝑒−𝑥
Đồ thị của 2 hàm như Hình 3 
Hàm mất mát được sử dụng là hàm sai số bình 
phương trung bình, có công thức như (8). 
𝑚𝑠𝑒 = 
1
𝑛
∑ (𝑦𝑖 − �̂�𝑖)
2𝑛
𝑖=1 
Một vài thuật toán tối ưu đào tạo lan truyền 
ngược thường được sử dụng Gradient Decent 
(đạo hàm đi ngược), Stochastic Gradient Descent 
(SGD), thuật toán Levenberg- Marquardt 
Algorithm (LMA), Scaled Conjugate Gradient 
(SCG), Pola-Ribiere conjugate gradient (PCG), 
Adadelta (Matthew, 2012), Adam, Adagrad và 
Bảng 1. Kết quả phân tích tương quan giữa các đặc trưng đầu vào. 
(5) 
(6) 
(7) 
(8) 
 Nguyễn Phùng Hưng và nnk./Tạp chí Khoa học Kỹ thuật Mỏ - Địa chất 60 (1), 90 - 98 95 
 những thuật toán khácNhóm tác giả sử dụng 
thuật toán RMSprop (Geoffrey, 2014). Thuật toán 
này có ưu điểm tốc độ học (learning rate) tự động 
điều chỉnh, thay đổi lớn với các dữ liệu khác biệt 
nhiều và các thay đổi nhỏ cho các dữ liệu ít khác 
biệt; và nhanh chóng đạt được giá trị cực tiểu toàn 
cục. 
Kỹ thuật Early stopping - dừng thuật toán 
trước khi hàm mất mát quá nhỏ, giúp tránh hiện 
tượng quá khớp (overfitting) cũng được áp dụng 
trong nghiên cứu này. Các thiết lập Early stopping 
gồm: chỉ tiêu đánh giá là sai số tuyệt đối trung 
bình, và số epoch tối đa bằng 50 (epoch - số lần 
duyệt qua tất cả các điểm dữ liệu) trước khi giá trị 
chỉ tiêu đánh giá của bộ dữ liệu xác thực có chiều 
hướng tăng lên. 
3. Kết quả nghiên cứu và thảo luận 
Với mô hình mạng neural nhân tạo được xây
 dựng như mục trên, tập dữ liệu huấn luyện và xác 
thực được sử dụng để đào tạo mạng. Cùng với việc 
áp dụng kỹ thuật Early Stopping, quá trình đào tạo 
kết thúc với số lần lặp (epoch) bằng 1293. Sự thay 
đổi của chỉ tiêu - sai số tuyệt đối trung bình của tập 
huấn luyện và tập xác thực trong Hình 4. 
Bảng 2 cho thấy mô hình mạng neural nhân 
tạo cho kết quả dự báo khá tốt với giá trị hệ số xác 
định của tập dữ liệu kiểm tra R2=0,868. Chỉ số R2 
của tập dữ liệu kiểm tra thấp hơn tập dữ liệu huấn 
luyện và xác thực là do số lượng các điểm dữ liệu 
còn ít. Các chỉ số đánh giá của mô hình mạng 
neural nhân tạo dự đoán tốc độ ăn mòn trên toàn 
bộ tập dữ liệu lần lượt có giá trị RMSE = 0,014, 
MAE = 0,011, R2 = 0,938. Ảnh hưởng của từng 
thông số đầu vào (áp suất CO2, độ pH, tuổi ) lên 
tốc độ ăn mòn chưa được xét đến và sẽ đề cập đến 
trong những nghiên cứu sau. Các kết quả dự đoán 
tốc độ ăn mòn của trên bộ dữ liệu được so sánh
Hình 2. Mô hình mạng neural nhân tạo dự đoán tốc độ ăn mòn. 
Hình 3. Đồ thị hàm số Sigmoid và ReLU. 
96 Nguyễn Phùng Hưng và nnk./Tạp chí Khoa học Kỹ thuật Mỏ - Địa chất 60 (1), 90 - 98 
 với thực tế và được minh họa trong Hình 5. 
Sử dụng mô hình thực nghiệm dự đoán ăn 
mòn CO2 theo tiêu chuẩn Norsok M-506 để tính 
toán bộ dữ liệu, nhóm tác giả thu được các chỉ số 
đánh giá RMSE = 0,064, MAE = 0,048, R2 = -0,364. 
Hệ số xác định âm cho thấy kết quả dự đoán mô 
hình Norsok M-506 chưa mô phỏng được thực tế 
bộ dữ liệu trên. Mạng neural nhân tạo cho thấy 
khả năng dự đoán vượt trội hơn so với mô hình 
thực nghiệm theo tiêu chuẩn Norsok M-506. Bảng 
3 so sánh hiệu suất của các mô hình dự đoán tốc 
độ ăn mòn. Hình 6 minh họa giá trị tốc độ ăn mòn 
dự đoán của các mô hình so với tốc độ ăn mòn 
thực tế. 
Tập dữ liệu RMSE MAE R2 
Huấn luyện và xác thực 0,010 0,008 0,962 
Kiểm tra 0,020 0,017 0,868 
Mô hình RMSE MAE R2 
Tiêu chuẩn Norsok M-506 0,064 0,048 -0,364 
Mô hình mạng neural nhân tạo 0,014 0,011 0,938 
Hình 4. Early stopping: sai số tuyệt đối trung bình của tập huấn luyện và tập xác thực. 
Bảng 2. Các chỉ tiêu của mạng neural nhân tạo dự đoán tốc độ ăn mòn. 
Hình 5. Đồ thị hồi quy của mạng neural nhân tạo dự đoán tốc độ ăn mòn. 
Bảng 3. Hiệu suất của các mô hình dự đoán tốc độ ăn mòn. 
 Nguyễn Phùng Hưng và nnk./Tạp chí Khoa học Kỹ thuật Mỏ - Địa chất 60 (1), 90 - 98 97 
4. Kết luận 
Tốc độ ăn mòn là một thông số quan trọng để 
xác định sự phát triển ăn mòn trong đường ống. 
So sánh các phương pháp dự đoán tốc độ ăn mòn 
bằng mô hình mạng neural nhân tạo và mô hình 
thực nghiệm Norsok M - 506 cho thấy sự vượt trội 
của phương pháp mới: thông qua các chỉ số như: 
hệ số xác định (R2), sai số bình phương trung bình 
(MSE), căn bậc hai sai số bình phương trung bình. 
Điều đó đã chứng minh mô hình mới có thể là công 
cụ dự đoán khá chính xác tốc độ ăn mòn. Phương 
pháp này có thể sử dụng trong nghiên cứu cũng 
như trong thực tế đánh giá tốc độ ăn mòn trong do 
CO2 tùy thuộc vào điều kiện cụ thể tuyến ống. 
Tài liệu tham khảo 
Bassam, A., Toledo, D. O., Hernandez, J. A., 2009. 
Artificial neural network for the evaluation of 
CO2 corrosion in a pipeline steel. J. Solid State 
Electrochem 13, 773-780. 
Bersani, C., Citro L., Gagliardi, R. V., Sacile, R., & 
Tomasoni, A. M., 2010. Accident occurence 
evaluation in the pipeline transport dangerous 
goods. Chemical Engineering Transactions. 
Geoffrey Hinton, 2014. CSC321 - Introduction to 
Neural Networks and Machine Learning. 
Giulia De Masi, Roberta Vichi, Manuela Gentile, 
2014. A Neural Network Predictive Model of 
Pipeline Internal Corrosion Profile. 2014 First 
International Conference on Systems 
Informatics. Modelling and Simulation. 
Hahnloser, R.; Sarpeshkar, R.; Mahowald, M. A.; 
Douglas, R. J.; Seung, H. S, 2000. "Digital 
selection and analogue amplification coexist in 
a cortex-inspired silicon circuit". Nature. 
Han, Jun; Morag, Claudio, 1995. The influence of 
the sigmoid function parameters on the speed 
of backpropagation learning. In Mira, José; 
Sandoval, Francisco. From Natural to Artificial 
Neural Computation. 195-201 
IYASELE, Edgar Omondiale, OYATOGUN Modupe 
Grace, 2018. Development of a Computer 
Software for Determining the Corrosion Rate 
of Oil Pipelines in CO2 Environment Using 
Modified NORSOK M-506 Model. International 
Journal of Scientific & Engineering Research. 
Kexi Liao, Quanke Yao, Xia Wu and Wenlong Jia, 
2012. A Numerical Corrosion Rate Prediction 
Method for Direct Assessment of Wet Gas 
Gathering Pipelines Internal Corrosion. 
Energies. 
Matthew D. Zeiler, 2012. ADADELTA: an adaptive 
learning rate method. Google Inc. 
https://arxiv.org/abs/1212.5701 
Mazura Mat Din Norafida Ithnin, Azlan Md. Zain, 
Norhazilan Md Noor, Maheyzah Md Siraj and 
Rosilawati Md. Rasol. 2015. An artificial neural 
network modeling for pipeline corrosion 
growth prediction, ARPN Journal of 
Engineering and Applied Sciences. 
Hình 6. Đồ thị hồi quy các mô hình dự đoán tốc độ ăn mòn. 
98 Nguyễn Phùng Hưng và nnk./Tạp chí Khoa học Kỹ thuật Mỏ - Địa chất 60 (1), 90 - 98 
Mohaghegh S, 1995. Neural network: What it can 
do for petroleum engineers. Society of 
Petroleum Engineers. 
Mohamed Layouni, 2014. A Survey on the 
Application of Neural Networks in the Safety 
Assessment of Oil and Gas Pipelines. IEEE 
Symposium on Computational Intelligence for 
Engineering Solutions (CIES). 
NACE SP0102, 2010. Standard Practice - In-Line 
Inspection of Pipelines. NACE International 
Publishing. Houston, TX, USA, 2010 
NACE SP0110, 2010. Wet Gas Internal Corrosion 
Direct Assessment Methodology for Pipelines. 
NACE International Publishing. 
NACE SP0116, 2016. Multiphase Flow Internal 
Corrosion Direct Assessment (MP-ICDA) 
Methodology for Pipelines. NACE International 
Publishing. 
NACE SP0206, 2016-SG, 2016, Internal Corrosion 
Direct Assessment Methodology for Pipelines 
Carrying Normally Dry Natural Gas (DG-ICDA). 
NACE International Publishing. 
NORSOK STANDARD M-506, Edition 3, June 2017. 
“CO2 corrosion rate calculation model”. 
duktkatalogen/Produktpresentasjon/?Produc
tID=923800 
Obaseki M, Nwankwojike B. N và Abam, F.I, 2017, 
Artificial Neural Network Simulation Model for 
Predicting Oil and Gas Pipeline Corrosion Rate 
in Nigerian Niger Delta, FUPRE Journal of 
Scientific and Industrial Research. 
Pierre R. Roberge, 2002. Handbook of corrosion 
engineering. Mc Graw Hill. 
Robert J Schalkoff, 1997. Artificial Neural 
Networks, Vol.1, McGraw-Hill New York. 
Roft Nyborg, 2005. Controlling Internal Corrosion 
in Oil and Gas Pipelines. Institute for Energy 
Technology (IFE). 
Roft Nyborg. 2009. Guidelines for prediction of 
CO2 corrosion in oil and gas production 
systems. Institute for Energy Technology. Na 
Uy. 
ABSTRACT 
Applying artificial neural networks to predict carbon dioxide (CO2) 
corrosion rate in oil and gas pipeline 
Hung Phung Nguyen, Vinh Duc Le, Truong Hung Trieu 
Faculty of Oil and Gas, Hanoi University of Mining and Geology, Vietnam 
Carbon dioxide (CO2) corrosion is one of the major concerns in oil and gas industry. This work 
attempted to apply Machine Learning method - Artificial Neural Network (ANN) to predict CO2 corrosion 
rate in pipeline. After collecting, selecting features, pre-processing, a dataset of 40 data with 9 features of 
pipeline operating parameters has been used for research. Applying newest optimizer RMSprop with 
algorithm Early-Stopping increases accuracy and reduces the effect of small dataset. An Artificial Neural 
Network is developed, which has 2 hidden layers with 18 nodes and 9 nodes with activate functions ReLU 
and Sigmoid in sequence. The empirical model Norsok M-506 was applied to compare performances of 
models. Root Mean Squared Error (RMSE), Mean Absolute Error (MAE), coefficient of determination (R2) 
were used as evaluating indicators. The predicted corrosion rates of artificial neural network model R2 = 
0.938, RMSE = 0,014, MAE = 0,011 provided higher performance than empirical model Norsok M-506. 

File đính kèm:

  • pdfnghien_cuu_ung_dung_mang_neural_nhan_tao_de_du_doan_toc_do_a.pdf