Vai trò của khai phá dữ liệu trong lĩnh vực kiểm toán và dịch vụ đảm bảo
Dữ liệu do con người tạo ra ngày càng nhiều hơn về số lượng, tăng nhanh về khối lượng, phát triển mạnh về quy mô khiến việc phân loại, lựa chọn, khai phá, sử dụng gặp những khó khăn nhất định. Mục tiêu bài viết nhằm tổng quan các ứng dụng của kỹ thuật khai phá dữ liệu trong lĩnh vực kiểm toán. Ứng dụng khai phá dữ liệu trong lĩnh vực kiểm toán
liên quan đến dịch vụ đảm bảo và tính tuân thủ (phát hiện gian lận, tình hình tài chính) và kế toán điều
tra. Qua đó, giúp hiểu hơn về vai trò của khai phá dữ liệu và rộng hơn là dữ liệu lớn (big data), cũng như
cơ hội cho các nghiên cứu ứng dụng trong tương lai.
Bạn đang xem tài liệu "Vai trò của khai phá dữ liệu trong lĩnh vực kiểm toán và dịch vụ đảm bảo", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
Tóm tắt nội dung tài liệu: Vai trò của khai phá dữ liệu trong lĩnh vực kiểm toán và dịch vụ đảm bảo
NGHIEÂN CÖÙU TRAO ÑOÅI NGHIÊN CỨU KHOA HỌC KIỂM TOÁN30 Số 119 - tháng 9/2017 VAI TrOØ CUÛA KHAI pHAÙ DÖÕ LIEÄU TrONG LÓNH VÖÏC KIEÅM TOAÙN VAØ DÒCH VUÏ ÑAÛM BAÛO ThS. NGUYỄN VĩNH KHươNG* ThS. PHÙNG ANH THư* *Trường Đại học Kinh tế-Luật_ĐHQG HCM; Đại học Nguyễn Tất Thành Dữ liệu do con người tạo ra ngày càng nhiều hơn về số lượng, tăng nhanh về khối lượng, phát triển mạnh về quy mô khiến việc phân loại, lựa chọn, khai phá, sử dụng gặp những khó khăn nhất định. Mục tiêu bài viết nhằm tổng quan các ứng dụng của kỹ thuật khai phá dữ liệu trong lĩnh vực kiểm toán. Ứng dụng khai phá dữ liệu trong lĩnh vực kiểm toán liên quan đến dịch vụ đảm bảo và tính tuân thủ (phát hiện gian lận, tình hình tài chính) và kế toán điều tra. Qua đó, giúp hiểu hơn về vai trò của khai phá dữ liệu và rộng hơn là dữ liệu lớn (big data), cũng như cơ hội cho các nghiên cứu ứng dụng trong tương lai. Từ khóa: khai phá dữ liệu; kiểm toán. The role of data mining in the audit arrangement and assurance service Man-made data is becoming more and more quantitatively, rapidly growing in volume, and growing in scale which has made the classification, selection, exploration and use relatively difficult. The article objective is to review the application of data mining techniques in the field of auditing. Application of data mining in the field of audit related to assurance services and compliance (fraud detection, financial situation) and forensic accounting. Thereby, the article provides better understanding of the role of data mining and, more broadly, the big data, as well as opportunities for future application research. keywords: Data mining, auditing 1. Giới thiệu Trong kỷ nguyên của nền kinh tế toàn cầu hoá, thị trường cạnh tranh cao, các tổ chức cần tăng tính cạnh tranh thông qua việc chấp nhận hoặc thực hiện nhiều triết lý kinh doanh và ứng dụng các công nghệ thông tin tiên tiến (Dorsch và Yasin, 1998). Đặc biệt, trí tuệ nhân tạo (AI) rất quan trọng đối với tương lai của ngành kế toán (Elliott, 1992) và các hệ thống thông minh đã tăng cường nhiều khả năng phân tích và tăng hiệu quả của các quy trình kế toán (Granlund, 2011). Do đó, có những lời kêu gọi rõ ràng rằng trí tuệ nhân tạo xứng đáng được chú ý hơn (Debreceny, 2011). Khai phá dữ liệu là một trong những ứng dụng quan trọng nhất trong phân tích nghiệp vụ và các công cụ hỗ trợ quyết định. Điều này được xác nhận bởi các tổ chức, Hiệp hội nghề nghiệp về kế toán. Viện Kế toán Công chứng Hoa Kỳ (AICPA) đã xác định khai phá dữ liệu là một trong mười công nghệ hàng đầu cho tương lai, và Viện Kiểm toán Nội bộ Hoa Kỳ (IIA) đã liệt kê khai phá dữ liệu là một trong bốn ưu tiên nghiên cứu (Koh và Low, 2004). Ngoài ra, Viện Kế toán Quản trị Công chứng Anh (CGMA) đã báo cáo rằng hơn 50% các nhà lãnh đạo doanh nghiệp xếp hạng dữ liệu lớn và khai phá dữ liệu trong số các đầu mười ưu tiên của công NGHIÊN CỨU KHOA HỌC KIỂM TOÁN 31Số 119 - tháng 9/2017 ty, là nền tảng của kỷ nguyên dữ liệu trong kinh doanh (CGMA, 2013). Khai phá dữ liệu đã được định nghĩa là quá trình xác định các mẫu dữ liệu có giá trị, có tiềm năng và khuôn mẫu mới nhất (Pujari, 2001). Khai phá dữ liệu còn được gọi là quá trình khai phá hoặc khai phá kiến thức từ những dữ liệu lớn (Han và cộng sự, 2006) để cải thiện các quyết định trong một ngành cụ thể. Do đó, trọng tâm chính của khai phá dữ liệu là tận dụng các tài sản dữ liệu của một tổ chức để thu được lợi ích tài chính hoặc phi tài chính. Do đó, việc khai phá dữ liệu đã được áp dụng cho hầu hết các ngành kinh doanh, kể cả lĩnh vực kế toán, kiểm toán. Kế toán doanh nghiệp có vai trò rất quan trọng đối với việc cung cấp thông tin kế toán phục vụ công tác quản lý và điều hành doanh nghiệp, là cơ sở cho việc ra quyết định kinh tế và điều hành của doanh nghiệp. Nhiệm vụ này liên quan đến nhiều sự kiện không chắc chắn và rủi ro phức tạp. Lĩnh vực kế toán sử dụng các ứng dụng thông minh có từ hơn ba thập niên qua (Baldwin và cộng sự, 2006) và một trong số đó là việc sử dụng khai phá dữ liệu để giải quyết tốt hơn những rủi ro và sự kiện phức tạp. Nhiều nghiên cứu đã được công bố mô tả các ứng dụng khai phá dữ liệu trong kế toán. Mục tiêu của bài báo là tổng quan một cách hệ thống các nghiên cứu đã công bố về các ứng dụng khai phá dữ liệu trong lĩnh vực kiểm toán nhằm mở ra các chủ đề cho mục đích ứng dụng và nghiên cứu. 2. khái niệm về khai phá dữ liệu Khai phá dữ liệu là việc áp dụng các thuật toán cụ thể để trích các mẫu từ dữ liệu. Khai phá dữ liệu cho phép khám phá tự động các mô hình tiềm ẩn và kiến thức thú vị ẩn chứa trong một lượng lớn dữ liệu (Jiawei và Kamber, 2001). Việc khai phá dữ liệu giúp các tổ chức tập trung vào những thông tin và kiến thức quan trọng nhất có sẵn trong cơ sở dữ liệu hiện có của công ty. Nhưng khai phá dữ liệu chỉ là một công cụ, do đó, không loại trừ nhu cầu kinh doanh, hiểu về dữ liệu hoặc để hiểu các phương pháp phân tích liên quan (Jackson, 2002) Khai phá dữ liệu có ba mục tiêu chính: mô tả, dự đoán và đề xuất. Trong khi mô tả tập trung vào việc xác định các mẫu mô tả về hành vi con người thông qua dữ liệu, dự đoán liên quan đến việc sử dụng một số biến hoặc các yếu tố trong cơ sở dữ liệu để dự đoán các giá trị chưa biết hoặc tương lai của các biến số được quan tâm khác (Fayyad và cộng sự, 1996). Mặt khác, đề xuất tập trung vào việc cung NGHIEÂN CÖÙU TRAO ÑOÅI NGHIÊN CỨU KHOA HỌC KIỂM TOÁN32 Số 119 - tháng 9/2017 cấp giải pháp tốt nhất cho vấn đề nhất định (Evans, 2013). Các mục tiêu này có thể đạt được bằng cách sử dụng nhiều nhiệm vụ khai phá dữ liệu bao gồm phân loại, phân cụm, dự đoán, phát hiện ngoại lai, tối ưu hóa và khái quát hóa. Những nhiệm vụ được giải quyết thông qua: ■ Phân loại tập trung vào việc lập bản đồ dữ liệu cho tập hợp các lớp thuộc tính, có thể là nhị phân hoặc đa lớp. ■ Phân cụm tập trung phân tách dữ liệu thành một số nhóm có ý nghĩa. ■ Dự đoán tập trung vào việc xác định giá trị số học trong tương lai (dự báo) hoặc không phải là giá trị số học (phân loại). ■ Phát hiện ngoại lai tập trung vào việc xác định các dữ liệu quan trọng có sai lệch so với dữ liệu chuẩn. ■ Tối ưu hóa tập trung vào việc tìm ra giải pháp tốt nhất cho một số tài nguyên. ■ Khái quát hóa tập trung vào việc trình bày trực quan và hiểu biết về dữ liệu. ■ Hồi quy tập trung vào ước lượng một biến phụ thuộc từ tập hợp các biến độc lập. 3. Vai trò của khai phá dữ liệu trong lĩnh vực kiểm toán và dịch vụ đảm bảo 3.1. Kiểm toán Các giao dịch kế toán đang trở nên phức tạp và dễ dàng hơn để thao tác với việc sử dụng ngày càng tăng của hệ thống trực tuyến và sự gia tăng của các thiết bị thông minh và sự kết nối vạn vật (IoT). Điều này đòi hỏi sự chuyên nghiệp về nghề kiểm toán cao hơn, bao gồm việc sử dụng kỹ thuật khai phá dữ liệu ngày càng tăng. Vai trò quan trọng của công nghệ thông tin ngày càng đóng vai trò quan trọng trong nâng cao hiệu quả của quá trình giám sát và kiểm soát (Daigle và Lampe, 2005). Khai phá dữ liệu đã được áp dụng trong suốt chu trình kiểm toán: lập kế hoạch (như cam kết, đánh giá rủi ro, lập kế hoạch kiểm toán), thực hiện (chủ yếu thực hiện thử nghiệm cơ bản) và báo cáo (báo cáo kiểm toán). Khai phá dữ liệu cũng đã được áp dụng sau khi chu kỳ kiểm toán hoàn thành, bao gồm sự tác động và hậu quả của ý kiến kiểm toán. Trong giai đoạn ký kết hợp đồng, khai phá dữ liệu đã được sử dụng để dự đoán việc lựa chọn của kiểm toán viên (Kirkos và cộng sự., 2010) và chuyển đổi (Kirkos, 2012) để tìm ra sự phù hợp tối ưu giữa các đặc tính của cuộc kiểm toán và chuyên gia kiểm toán trong lĩnh vực xây dựng (Wang và Kong, 2012) và phân loại mức chi phí cho cuộc kiểm toán và đưa ra sự thay đổi trong giá phí kiểm toán (Curry và Peel, 1998; Beynon và cộng sự, 2004). Trong môi trường giàu thông tin ngày nay, đánh giá rủi ro liên quan đến nhận dạng các mẫu trong dữ liệu, chẳng hạn như dữ liệu bất thường phức tạp và sự khác biệt có thể che giấu một hoặc nhiều lỗi trọng yếu (Ramamoorti và cộng sự, 1999). Calderon (1999) và Ramamoorti và cộng sự (1999) nghiên cứu khả năng của mạng lưới thần kinh để tăng cường quá trình đánh giá rủi ro của kiểm toán viên. Kết quả nghiên cứu cho rằng mô hình mạng thần kinh có giá trị trong việc định hướng kiểm toán viên nội bộ dành sự quan tâm đến những khía cạnh của tài chính, vận hành và tuân thủ ở các khu vực kiểm toán có nguy cơ cao và do đó tăng hiệu quả của cuộc kiểm toán. Tương tự, Davis và cộng sự (1997) và Hwang và cộng sự (2004) đã phát triển mô hình mạng lưới thần kinh để hỗ trợ các kiểm toán viên thực hiện đánh giá rủi ro kiểm soát. Kết luận rằng mạng nơ ron cung cấp cho kiểm toán viên một cách hiệu quả để nhận dạng các mẫu trong số lượng lớn các mối quan hệ mà các mối quan hệ liên biến này có thể thay đổi và các kiểm toán viên có kinh nghiệm cũng không thể mô tả được. Tương tự, Issa và Kogan (2014) đề xuất một dự đoán mô hình hồi quy xác suất như một công cụ để đánh giá chất lượng các đánh giá rủi ro kiểm soát và do đó cải thiện hiệu quả kiểm toán bằng cách tập trung vào vùng rủi ro hoặc ngoại lai. Trong lập kế hoạch kiểm toán, Ragothaman và cộng sự (1995) đã phát triển hệ thống tiếp cận theo nguyên tắc giúp các kiểm toán viên ở giai đoạn lập NGHIÊN CỨU KHOA HỌC KIỂM TOÁN 33Số 119 - tháng 9/2017 kế hoạch thiết kế các thử nghiệm cơ bản, khi các sai sót trọng yếu và các sai sót trong báo cáo tài chính có thể xảy ra. Thể hiện rằng hệ thống này hoạt động tốt hơn mô hình dựa trên phân tích phân biệt trong phân loại các lỗi và không lỗi. Nhưng kích thước mẫu được sử dụng trong nghiên cứu giới hạn tính tổng quát của các quy tắc được tạo ra. Trong giai đoạn thực hiện kiểm toán, Argyrou và Andreev (2011) đã đề xuất công cụ bán giám sát cho việc tập hợp cơ sở dữ liệu kế toán như một quy trình kiểm soát nội bộ thông qua việc sử dụng các bản đồ tự tổ chức để bổ sung cho việc kiểm soát nội bộ, xác minh việc xử lý kế toán các giao dịch và đánh giá báo cáo tài chính. Kết quả thực nghiệm cho thấy công cụ đề xuất có thể nén một số lượng lớn các giao dịch kế toán, tạo ra các cụm đồng nhất, tách biệt, và có thể hiểu được. Trong thực hiện thử nghiệm cơ bản, Coakley và Brown (1993) và Koskivaara (2000) đã sử dụng các mạng thần kinh trong việc dự đoán các mẫu trong kiểm toán số dư hàng tháng như là một phần của quá trình đánh giá phân tích của kiểm toán viên và cho thấy rằng các mạng nơron nhận ra các mẫu trong tài khoản cũng như mối quan hệ giữa các tài khoản này hiệu quả hơn so với phân tích tỷ số và phương pháp hồi quy. Coakley (1995) đề xuất việc sử dụng các mạng thần kinh trong nhận dạng mô hình của các tín hiệu cần xem xét được tạo ra bởi các thủ tục phân tích. Kết luận rằng việc sử dụng mạng nơron cung cấp một chỉ dẫn đáng tin cậy hơn về sự có mặt của các sai sót trọng yếu so với các thủ tục hoặc phân tích mẫu truyền thống. Phân tích và cung cấp cái nhìn sâu hơn về các nguyên nhân chính đáng của những sai sót này. Kết quả của họ cho thấy việc sử dụng một ANN để phân tích các mô hình các biến dạng liên quan đến nhiều tỷ lệ tài chính cung cấp một chỉ dẫn đáng tin cậy hơn về sự hiện diện của sai sót trọng yếu hơn các thủ tục phân tích truyền thống hoặc phân tích mẫu, cung cấp hiệu suất được cải thiện trong việc nhận ra các sai sót trọng yếu. Trong hậu chu kỳ kiểm toán, nội dung thông tin về giả định hoạt động liên tục của kiểm toán viên có ảnh hưởng đáng kể đến vị thế hiện tại và tương lai của một công ty. Jones (1996) đã kiểm tra các khoản lợi nhuận bất thường của cổ phiếu xung quanh việc công bố báo cáo hoạt động liên tục của kiểm toán viên bằng cách sử dụng hồi quy bình thường nhỏ nhất và nhận thấy rằng hồi quy bình phương nhỏ nhất bình thường cho thấy rằng lợi nhuận bất thường trung bình xung quanh việc NGHIEÂN CÖÙU TRAO ÑOÅI NGHIÊN CỨU KHOA HỌC KIỂM TOÁN34 Số 119 - tháng 9/2017 công bố báo cáo của kiểm toán viên thấp hơn đối với các ý kiến quan tâm đến hoạt động chứ không phải do ý kiến rõ ràng và mức độ của các khoản lợi nhuận bất thường phụ thuộc vào mức độ mà loại ý kiến không được kỳ vọng đối với các nhà đầu tư. 3.2. Tình hình tài chính Dự báo phá sản là một chủ đề quan trọng đã được nghiên cứu rộng rãi và đa quốc gia trong các nghiên cứu trước đây. Nhiều tác giả đã sử dụng kỹ thuật khai thác dữ liệu để dự báo phá sản (Jo et al., 1997, O’Leary, 1998, Yang và cộng sự, 1999, Zhang và cộng sự, 1999. Charalambous và cộng sự, 2000Tsai và Wu, 2008, Chen và các cộng sự, 2009a, 2009b, Olson và cộng sự, 2012, Kasgari và cộng sự, 2013; Korol, 2013; Serrano-Cinca và Gutiérrez-Nieto, 2013; Tinoco và Wilson, 2013). Kết quả nghiên cứu Yang và cộng sự (1999) về sự lan truyền ngược lại đã không phân biệt được giữa các công ty bị phá sản và không phá sản và tính ưu việt của phân tích hồi quy tuyến tính đối với mạng nơ-ron xác suất. Mặt khác, Zhang và cộng sự (1999) đã báo cáo rằng các mạng nơ ron mạnh mẽ để lấy mẫu các biến thể về hiệu suất phân lớp tổng thể. Shirata và cộng sự (2011) chứng minh hiệu quả của dự đoán phá sản khai phá qua văn bản, trong đó một số kết hợp các thuật ngữ có hiệu quả trong việc phân biệt giữa các công ty phá sản và không phá sản. Cụ thể hơn, Pompe và Bilderbeek (2005) đã kiểm tra các yếu tố dẫn đến dự báo phá sản, và nhận thấy rằng các mô hình được tạo ra từ báo cáo tài chính hàng năm, cuối cùng đã được công bố trước khi phá sản ít thành công hơn trong dự báo thất bại kịp thời và sự suy giảm kinh tế trùng khớp với sự suy giảm hiệu suất của mô hình . Mặc dù tất cả các tác giả này chỉ sử dụng các biện pháp định lượng, chủ yếu là tỷ lệ tài chính, trong mô hình dự báo phá sản. Anandarajan và cộng sự (2001) đã sử dụng các biện pháp định tính và định lượng. Trong khi Cho và cộng sự (2009) đã phát triển một mô hình tổng hợp kết hợp các kỹ thuật thống kê và trí tuệ nhân tạo để dự báo phá sản, một số khác tập trung vào tính chính xác của các mô hình dự báo phá sản (Tseng và Hu, 2010, Kim và Kang, 2010; Jardin, 2010; Tseng và Hu, 2010) với thỏa thuận không nhất trí về kỹ thuật mô hình hóa nào mang lại dự đoán tốt nhất. Tóm lại, không có bằng chứng nào cho thấy một kỹ thuật khai phá dữ liệu tốt hơn các kỹ thuật khai phá dữ liệu khác trong mọi trường hợp. 3.3. kế toán điều tra AICPA công nhận trách nhiệm của kiểm toán viên trong việc phát hiện gian lận (Cullinan và Sutton, 2002). Việc phát hiện thao túng báo cáo tài chính bằng cách sử dụng các thủ tục kiểm toán thông thường đã trở thành một nhiệm vụ rất khó khăn (Dikmen và Küçükkocaoğlu, 2010). Đánh giá rủi ro gian lận là quá trình rất phức tạp và một phần của tất cả các cuộc kiểm toán. Theo thời gian, các yêu cầu bắt buộc đã tăng nhanh chóng, khoảng thời gian và nỗ lực của kiểm toán viên để đánh giá gian lận. Do đó, đánh giá rủi ro gian lận tạo ra cơ hội lý tưởng cho sự hỗ trợ kỹ thuật (Comunale và cộng sự, 2010). Việc rà soát các nghiên cứu cho thấy việc sử dụng phổ biến khai phá dữ liệu của các nhà nghiên cứu và các học viên để phát hiện gian lận. Các nhà nghiên cứu giải quyết ở mức độ khác nhau đối với các dạng gian lận. Một số tập trung vào việc phát hiện rủi ro gian lận ở mức độ vĩ mô nhiều hơn ở cuộc kiểm toán (Comunale và cộng sự, 2010) và một số khác tập trung vào việc phát hiện gian lận ở cấp độ vi mô hơn của các giao dịch kinh doanh (Debreceny và Gray, 2010; Bella và cộng sự, 2009; Tackett, 2013). Trong khi đó, Debreceny và Gray (2010) đã nghiên cứu sự gian lận trong các bút toán bằng cách sử dụng phân tích số liệu và phát hiện ra rằng sự phân bố các chữ số đầu tiên của số tiền trong bút toán khác với quy luật của Benford, Bella và cộng sự (2009) đã phát triển cấu trúc bốn bước để phát hiện gian lận của các hồ sơ thanh toán điện tử và Tackett (2013) đã đề xuất việc sử dụng các quy tắc liên kết trong việc phát hiện gian lận thông qua các mẫu và mối quan hệ khi kiểm tra nghiệp vụ kinh tế. Mặt khác, Bay và cộng sự (2006) tập trung vào việc xác NGHIÊN CỨU KHOA HỌC KIỂM TOÁN 35Số 119 - tháng 9/2017 định những bất thường ở sổ cái (Jans và cộng sự, 2010; Jans và cộng sự, 2011; Owusu-Ansah và cộng sự, 2002) và tập trung vào việc phát hiện gian lận ở chu kỳ kinh doanh hoặc quy trình. Trong khi Jans và cộng sự (2010) sử dụng kỹ thuật khai phá dữ liệu mô tả để phát hiện và giảm nguy cơ gian lận nội bộ ở cấp độ chu trình kinh doanh, Jans và cộng sự (2011) đã kiểm tra tính hiệu quả của thủ tục kiểm tra phát hiện gian lận ở chu kỳ tồn kho và lưu kho và Owusu-Ansah và cộng sự (2002) sử dụng quá trình khai phá quy trình kinh doanh để giảm thiểu các rủi ro gian lận nội bộ của các giao dịch trong quá trình mua hàng. Các tác giả này thấy rằng quy mô của kiểm toán, nhiệm kỳ của kiểm toán viên, và năm kinh nghiệm của kiểm toán viên là yếu tố dự báo về gian lận về mặt thống kê. Sử dụng một sự kết hợp của Luật Benford và các mạng thần kinh, Busta và Weinberg (1998) tập trung vào việc phát hiện dữ liệu tài chính bị thao túng thông qua thủ tục phân tích; Kim và Vasarhelyi (2012) đã sử dụng khai phá dữ liệu để phát hiện gian lận nội bộ ở cấp công ty. “Quản trị” gian lận là một loại hình gian lận có ảnh hưởng xấu đến các bên liên quan thông qua các báo cáo tài chính gây hiểu nhầm hoặc gian lận (FFS) (Elliott và Willingham, 1980). Do đó, nhiều nhà nghiên cứu tập trung vào việc phát hiện FFS với sự trợ giúp của việc khai phá dữ liệu ở các cấp khác nhau: dựa trên gian lận của nhà quản lý cấp cao (Fanning và Cogger, 1998, Pai và cộng sự, 2011), phát hiện gian lận dựa trên dự đoán về kết quả hoạt động trong tương lại của công ty (Virdhagriswaran và Dakin, 2006) và phát hiện gian lận trong các báo cáo tài chính (Kirkos và cộng sự, 2007; Perols, 2011). Các kết luận quan trọng của các tác giả này bao gồm: khả năng của các mô hình mạng thần kinh phân loại thành viên trong các cơ sở nghiên cứu SEC so với các cơ sở không điều tra với độ chính xác cao. Một giải thích cho thành công tương đối của mạng nơron là khả năng sử dụng các quy trình học tập thích ứng để xác định điều gì là quan trọng để phân biệt “tín hiệu” thực từ các tín hiệu nhiễu. Các nghiên cứu cũng khảo sát hiệu quả của việc kết hợp các chỉ số tài chính và quản trị, các yếu tố ngoại sinh và nội sinh và lựa chọn tính năng để phát hiện các báo cáo tài chính sai lệch. Theo dòng nghiên cứu, nghiên cứu của Gaganis (2009) liên quan đến việc sử dụng các kỹ thuật phân loại khai phá dữ liệu kết hợp cả dữ liệu tài chính và phi tài chính cho xác định FFS và kết luận rằng sự phân loại chính xác phụ thuộc vào cách dữ liệu được xử lý trước, chức năng khách quan, và chiến lược tìm kiếm của mô hình. Alden và cộng sự (2012) đã sử NGHIEÂN CÖÙU TRAO ÑOÅI NGHIÊN CỨU KHOA HỌC KIỂM TOÁN36 Số 119 - tháng 9/2017 dụng các thuật toán di truyền để phát hiện các mẫu FFS và kết luận rằng ước lượng thuật toán phân phối cho thấy khả năng phân loại mô hình gian lận tài chính tốt hơn so với mô hình hồi quy xác suất truyền thống. Cụ thể hơn, Lin và cộng sự (2003) đã phát triển mô hình mạng nơ ron tích hợp để đánh giá nguy cơ FFS. Mô hình mạng thần kinh mờ của Lin và cộng sự (2003) đã vượt trội hơn hầu hết các mô hình thống kê và mạng thần kinh khớp thần kinh được báo cáo trong các nghiên cứu trước và hiệu quả của nó so với mô hình hồi quy logit. Liou (2008) đã khám phá ra sự khác biệt và tương đồng giữa phát hiện báo cáo tài chính giả mạo và các mô hình dự báo thất bại kinh doanh bằng cách sử dụng hồi quy logistic, mạng nơ ron và cây quyết định và nhận thấy rằng các yếu tố tài chính được sử dụng để phát hiện các báo cáo gian lận là hữu ích trong dự báo thất bại kinh doanh. Welch và cộng sự (1998) đã phát triển một hệ thống phân loại dựa trên khai phá dữ liệu để xây dựng mô hình quyết định của kiểm toán viên khi ước tính khả năng gian lận bởi các nhà thầu phát triển hồ sơ thầu cho các hợp đồng của Chính phủ và báo cáo rằng trong các mô hình quyết định phân loại liên quan đến chế biến, sản xuất các mô hình cải tiến khi so sánh với các phương pháp toán học truyền thống. Kochetovakozloski và cộng sự (2011) đã sử dụng khai phá dữ liệu để cải thiện xét đoán của kiểm toán viên về các sự kiện “quản trị” gian lận. Hành vi điều chỉnh lợi nhuận Trong lĩnh vực tiên đoán về quản trị lợi nhuận, Tsai và Chiou (2009) đã phát triển mạng lưới thần kinh và các mô hình cây quyết định để các nhà đầu tư sử dụng để dự đoán mức độ quản trị lợi nhuận trước đó và đánh giá mức độ tăng giảm của lợi nhuận sau đó. Kết quả của Tsai và Chiou (2009) chỉ ra rằng sử dụng các kỹ thuật khai phá dữ liệu đã làm tăng đáng kể dự báo về quản trị lợi nhuận và các quy tắc ra quyết định giúp xác định việc quản trị lợi nhuận. Mặt khác, Ezazi và cộng sự (2013) đã kiểm tra tính hữu dụng của các kỹ thuật khai phá dữ liệu khác nhau trong dự đoán quản trị lợi nhuận và đặt câu hỏi về giả thiết tuyến tính cho việc mô hình biến kế toán dồn tích tùy ý và kết luận rằng một cách tiếp cận phi tuyến tính để dự đoán việc quản trị lợi nhuận hiệu quả hơn phương pháp tuyến tính. Tập trung vào việc phát hiện quản trị lợi nhuận, Jones (1991) đưa ra mô hình tích lũy bằng cách sử dụng một thuật toán di truyền. Kết quả cho thấy sự vượt trội của các thuật toán di truyền so với các phương pháp phân cụm. Để giải quyết vấn đề số liệu sẵn có trong ước tính chuỗi thời gian, Hoglund (2013) nhận thấy mô hình Jones dựa trên hồi quy tuyến tính mờ tốt hơn mô hình Jones dựa trên hồi quy trong việc phát hiện quản trị lợi nhuận được mô tả khi các chuỗi thời gian ước lượng ngắn. Song và cộng sự (2013) đã kiểm tra mối liên quan giữa quản trị lợi nhuận và khai khống tài sản và phát hiện ra rằng việc khai khống tài sản có mối liên quan đáng kể với biến kế toán dồn tích tùy ý. Tóm lại, các ứng dụng khai phá dữ liệu trong kiểm toán và dịch vụ đảm bảo tập trung chủ yếu vào hai chủ đề chính: kiểm toán (bao gồm các giai đoạn ký kết, lập kế hoạch, thực hiện và sau kiểm toán) và kế toán điều tra (phát hiện gian lận và quản trị lợi nhuận). Mục tiêu chính của các ứng dụng trong lĩnh vực này là dự đoán và nhiệm vụ chính là phân loại. Các kỹ thuật nổi trội là các mạng nơ-ron và hồi quy. Các cơ hội nghiên cứu trong tương lai bao gồm: tăng các dữ liệu đầu vào với các biến số liên quan đến đặc điểm quản trị, thử nghiệm các cách tiếp cận khác nhau để kết hợp các cách phân loại, kiểm tra các thuật toán học khác nhau và các mô hình cấu trúc, khám phá các thời gian khác nhau và các phương pháp tiền xử lý dữ liệu, mở rộng phạm vi phát triển mô hình tới nhiều loại hình kinh doanh và nhiều lựa chọn hơn, tăng thời gian dự đoán bao gồm các biến phi tài chính và phân tích trực quan hơn, chú ý nhiều hơn đến so sánh mô hình, chuẩn hóa dữ liệu và khai phá văn bản trong dự báo gian lận tài chính. 4. kết luận Bài viết tổng quan các nghiên cứu liên quan đến ứng dụng khai phá dữ liệu trong lĩnh vực kiểm NGHIÊN CỨU KHOA HỌC KIỂM TOÁN 37Số 119 - tháng 9/2017 toán và dịch vụ đảm bảo. Hầu hết, các nghiên cứu cho thấy khai phá dữ liệu ngày càng đóng vai trò quan trọng và tăng tính hiệu quả cho công việc của kiểm toán viên. Tại Việt Nam, nghiên cứu về ứng dụng khai phá dữ liệu trong kiểm toán còn chưa được chú ý. Nghiên cứu trong tương lai về lĩnh vực này sẽ là hướng đi phù hợp và tiềm năng cho các nhà nghiên cứu lẫn các nghiên cứu ứng dụng, triển khai trong thực tiễn. TÀI LIỆU THAM KHẢO 1. Anandarajan, M., Anandarajan, A., 1999. A comparison of machine learning techniques with a qualitative response model for auditor’s going concern reporting. Expert Syst. Appl. 16 (4), 385–392. 2. Argyrou, A., Andreev, A., 2011. A semi-supervised tool for clustering accounting databases with applications to internal controls. Expert Syst. Appl. 38 (9), 11176–11181. 3. Beynon, M.J., Peel, M.J., Tang, Y.C., 2004. The application of fuzzy decision tree analysis in an exposition of the antecedents of audit fees. Omega 32 (3), 231–244. 4. Bhimani, A., Gulamhussen, M.A., Lopes, S., 2009. The effectiveness of the auditor’s going-concern evaluation as an external governance mechanism: evidence fromloan defaults.Int.J.Account.44(3) ,239–255. 5. Blacconiere, W.G., DeFond, M.L., 1997. An investigation of independent audit opinions and subsequent independent auditor litigation of publicly-traded failed savings and loans. J. Account. Public Policy 16 (4), 415–454. 6. Busta, B., Weinberg, R., 1998. Using Benford’s law and neural networks as a review procedure. Manag. Audit. J. 13 (6), 356–366. 7. Calderon, T.G., 1999. Neural networks and preliminary information risk assessment in an auditing environment. Account. Enq. 8, 245–290. 8. Calderon, T.G., Cheh, J.J., 2002. A roadmap for future neural networks research in auditing and risk assessment. Int. J. Account. Inf. Syst. 3 (4), 203–236. 9. Callen, J.L., Kwan, C.C., Yip, P.C., Yuan, Y., 1996. Neural network forecasting of quarterly accounting earnings. Int. J. Forecast. 12 (4), 475–482. 10. Cerullo, M.J., Cerullo, M.V., 2006. Using neural network software as a forensic accounting tool. Information Systems Control Journal 2, 33. 11. Debreceny, R.S., Gray, G.L., 2010. Data mining journal entries for fraud detection: an exploratory study. Int. J. Account. Inf. Syst. 11 (3), 157–181. 12. Debreceny, R.S., Gray, G.L., 2011. Data mining of electronic mail and auditing: a research agenda. J. Inf. Syst. 25 (2), 195–226. 13. Evans, J.R., 2013. Business Analytics: Methods, Models, and Decisions. Prentice-Hall, Boston, MA. 14. Issa, H., Kogan, A., 2014. A predictive ordered logistic regression model as a tool for quality review of control risk assessments. J. Inf. Syst. 28 (2), 209–229. 15. Jans, M., Alles, M., Vasarhelyi, M., 2013. The case for process mining in auditing: sources of value added and areas of application. Int. J. Account. Inf. Syst. 14 (1), 1–20. 16. Jo, H., Han, I., Lee, H., 1997. Bankruptcy prediction using case-based reasoning, neural networks, and discriminant analysis. Expert Syst. Appl. 13 (2), 97–108. 17. Jones, J.J., 1991. Earnings management during import relief investigations. J. Account. Res. 193–228. 18. Jones, F.L., 1996. The information content of the auditor’s going concern evaluation. J. Account. Public Policy 15 (1), 1–27. 19. Kirkos, E., 2012. Predicting auditor switches by applying data mining. Journal of Applied Economic Sciences 3 (21), 246–261. 20. Kirkos, E., Spathis, C., Manolopoulos, Y., 2007. Data mining techniques for the detection of fraudulent financial statements. Expert Syst. Appl. 32 (4), 995–1003. 21. Kirkos, E., Spathis, C., Manolopoulos, Y., 2008. Support vector machines, decision trees and neural networks for auditor selection. Journal of Computational Methods in. 22. Science and Engineering 8 (3), 213–224. 23. Tackett, J.A., 2013. Association rules for fraud detection. Journal of Corporate Accounting and Finance 24 (4), 15–22. ...
File đính kèm:
- vai_tro_cua_khai_pha_du_lieu_trong_linh_vuc_kiem_toan_va_dic.pdf