ỨNG DỤNG MÁY HỌC ĐỂ DỰ BÁO THÀNH PHẦN CƠ GIỚI ĐẤT TẠI HUYỆN BỐ TRẠCH, TỈNH QUẢNG BÌNH
Nguyễn Ngọc Thanh1*, Phạm Thị Thảo Hiền1, Dương Quốc Nõn1, Nguyễn Công Đạt2
[1]Trường Đại học Nông Lâm, Đại học Huế2Chi nhánh văn phòng đăng ký đất đai thành phố Đồng Hới, tỉnh Quảng Bình
*Email: nguyenngocthanh@hueuni.edu.vn
TÓM TẮT
Nghiên cứu này áp dụng các mô hình máy học để dự đoán sự phân bố không gian của thành phần cơ học đất, bao gồm cát, limon và sét. Hiệu suất của Random Forest (RF) và Support Vector Machine (SVM) được so sánh trong việc dự đoán tỷ lệ cát, limon và sét trong đất. Một bộ dữ liệu gồm 94 mẫu đất và tám biến môi trường đã được sử dụng để huấn luyện và kiểm tra các mô hình với tỷ lệ 70:30. Kết quả cho thấy sự phân bố không gian của cát, limon và sét trên bản đồ là khác nhau và hiệu suất của RF vượt trội hơn so với SVM. Cụ thể, độ chính xác của RF lần lượt là 0,71, 0,70 và 0,67 cho dự báo hàm lượng cát, limon, và sét. Trong khi, độ chính xác của SVM lần lượt là 0,68, 0,66 và 0,63 cho dự báo hàm lượng cát, limon và sét. Ngoài ra, nghiên cứu này chỉ ra rằng tỷ lệ cát có mối tương quan nghịch với tỷ lệ limon và sét trong đất. Mối tương quan giữa limon và sét là không rõ ràng. Những phát hiện của nghiên cứu này cung cấp những hiểu biết quan trọng về kết cấu đất ở huyện Bố Trạch, tỉnh Quảng Bình, là yếu tố không thể thiếu trong việc ra quyết định quản lý đất đai bền vững.
Từ khóa: thành phần cơ giới đất, rừng ngẫu nhiên, máy vector hỗ trợ, Bố Trạch.
SUMMARY
Application of machine learning to predict soil texture in Bo Trach district, Quang Bình province
Nguyen Ngoc Thanh1, Pham Thi Thao Hien1, Duong Quoc Non1, Nguyen Cong Dat2
1University of Agriculture and Forestry, Hue University
2Branch of Land Registration Office in Dong Hoi City, Quang Binh Province
This study applied machine learning models to predict the spatial distribution of soil texture, including sand, silt, and clay. Random Forest (RF) and Support Vector Machine (SVM) performances were compared in predicting the sand, silt, and clay percentage. A data set of 94 soil samples and eight environmental variables was used to train and test models with a scale of 70:30. The results showed that the spatial distributions of sand, silt, and clay were different in maps and that the performance of the RF was superior to the SVM. Specifically, the accuracy of the RF was 0.71, 0.70, and 0.67 for predicting sand, silt, and clay, respectively. Meanwhile, the accuracy of the SVM model was 0.68, 0.66, and 0.63 for predicting sand, silt, and clay, respectively. In addition, this study indicated that the percentage of sand was negatively correlated with the percentages of silt and clay in the soil. The correlation between silt and clay was a weak positive. The findings of this study offer crucial insights into the soil texture in Bo Trach district, Quang Binh province, which is integral for sustainable land management decision-making.
Từ khóa: soil texture, random forest, support vector machine, Bo Trach.
Người phản biện: PGS.TS. Trương Chí Quang
Email: tcquang@ctu.edu.vn
Ngày nhận bài: 01/5/2024
Ngày thông qua phản biện: 25/5/2024
Ngày duyệt đăng: 21/6/2024