Home / Tin tức / PHƯƠNG PHÁP KIỂM ĐỊNH CHÉO ĐỂ ĐÁNH GIÁ ĐỘ CHÍNH XÁC CỦA MÔ HÌNH DỰ BÁO NHẠY CẢM SẠT LỞ ĐẤT

PHƯƠNG PHÁP KIỂM ĐỊNH CHÉO ĐỂ ĐÁNH GIÁ ĐỘ CHÍNH XÁC CỦA MÔ HÌNH DỰ BÁO NHẠY CẢM SẠT LỞ ĐẤT

PHƯƠNG PHÁP KIỂM ĐỊNH CHÉO ĐỂ ĐÁNH GIÁ ĐỘ CHÍNH XÁC CỦA MÔ HÌNH DỰ BÁO NHẠY CẢM SẠT LỞ ĐẤT

Chu Văn Trung1,2*, Nông Thị Thu Huyền1, Chiang Shou Hao2, Lin Tang Huang2, Lưu Thảo Nguyên1

[1]Khoa Quản lý tài nguyên, Trường Đại học Nông Lâm, Đại học Thái Nguyên

2Trung tâm Nghiên cứu Không gian và Viễn thám, Đại học Quốc lập Trung ương Đài Loan

*E-mail: chuvantrung@tuaf.edu.vn

TÓM TẮT

Nghiên cứu này đánh giá các phương pháp kiểm định chéo trong việc xác định độ chính xác và độ tin cậy của bản đồ nhạy cảm sạt lở đất bằng mô hình rừng ngẫu nhiên (Random Forest). Hai phương pháp lấy mẫu (lựa chọn ngẫu nhiên và theo cụm) và bốn phương pháp kiểm định chéo (Design-based, Random K-fold CV, Spatial K-fold CV và Buffered Leave-One-Out CV – B-LOO CV) được so sánh. Kết quả cho thấy lấy mẫu ngẫu nhiên cho kết quả tốt hơn lấy mẫu theo cụm và phương pháp kiểm định dựa trên thiết kế (Design-based) cho kết quả tốt nhất. Các phương pháp kiểm định không gian (Spatial CV và B-LOO CV) cho thấy dự đoán yếu tại các khu vực xa điểm mẫu huấn luyện, trong khi kiểm định ngẫu nhiên (Random K-fold CV) và kiểm định không gian (Spatial K-fold CV) tạo ra sự không chắc chắn, với xu hướng đánh giá cao hơn thực tế khi chọn mẫu ngẫu nhiên và thấp hơn thực tế khi chọn mẫu theo cụm. Như vậy, việc lựa chọn phương pháp lấy mẫu và kiểm định chéo ảnh hưởng đáng kể đến khả năng diễn giải chất lượng và độ tin cậy của bản đồ nhạy cảm sạt lở đất.

Từ khóa: sạt lở đất, kiểm định chéo, học máy, rừng ngẫu nhiên, độ chính xác.

SUMMARY

Cross-validation approaches for evaluation of landslide susceptibility map accuracy

Chu Van Trung 1,2, Nong Thi Thu Huyen1, Shou Hao Chiang2, Tang Huang Lin2, Luu Thao Nguyen1

1 Faculty of Resource Management, Thai Nguyen University of Agriculture and Forestry, Vietnam
2Center for Space and Remote Sensing Research, National Central University, Taoyuan 32001, Taiwan

This study evaluates the contribution of different cross-validation methods for determining the accuracy and reliability of landslide susceptibility maps using the Random Forest model. Two sampling methods (random selection and clustered selection) and four cross-validation methods (Design-based, Random K-fold CV, Spatial K-fold CV, and Buffered Leave-One-Out CV) were compared. The results indicate that random sampling outperforms clustered sampling, and the design-based cross-validation method yields the best results. Spatial validation methods (Spatial CV and B-LOO CV) show weaker predictive performance in areas distant from training points, while Random K-fold CV and Spatial K-fold CV introduce uncertainties. These methods tend to overestimate with random sampling and underestimate with clustered sampling. Thus, the choice of sampling and cross-validation methods significantly affects the interpretation of the quality and reliability of landslide susceptibility maps.

Keywords: landslide, cross-validation, machine learning, Random Forest, accuracy.

 

Ngày nhận bài: 10/12/2024

Ngày thông qua phản biện: 22/4/2025

Ngày duyệt đăng: 25/4/2025

GIỚI THIỆU

GIỚI THIỆU VỀ TẠP CHÍ KHOA HỌC ĐẤT CỦA HỘI KHOA HỌC ĐẤT VIỆT NAM

Tạp chí Khoa học Đất có giấy phép xuất bản số 342/GP-BTTTT ngày 28/6/2016 của Bộ Thông tin Truyền thông, ISSN 2525-2216.
Tên tiếng Anh: VIETNAM SOIL SCIENCE

 

024 3821 0374