Tên Luận Văn: Nghiên cứu kỹ thuật khai phá dữ liệu và học sâu áp dụng vào lĩnh vực nông nghiệp chính xác cho các loài cây chủ lực tại Việt Nam.
1. Chủ nhiệm đề tài: Nguyễn Văn Trọng
2. Tên cơ quan cử đi học: Trường Trung học Phổ thông Lê Lợi
3. Tên Viện - trường thực hiện luận văn: Trường Đại học Thủ Dầu Một
4. Mục tiêu nghiên cứu:
Tạo ra một bộ dữ liệu hình ảnh phong phú và đa dạng về trái thanh long tại Việt Nam, phục vụ cho việc nghiên cứu, phát triển và ứng dụng các công nghệ nhận dạng trái cây. Sử dụng bộ dữ liệu hình ảnh để huấn luyện và triển khai các mô hình học máy có khả năng nhận dạng, phân loại. Nghiên cứu trong luận văn này góp phần phát triển các giải pháp công nghệ thông tin giúp tối ưu hóa quá trình sản xuất, thu hoạch, vận chuyển, và tiêu thụ nông sản, giúp nâng cao hiệu quả của ngành nông nghiệp thông minh tại Việt Nam, đồng thời tạo ra nhiều giá trị kinh tế và xã hội cho đất nước.
5. Kết quả thực hiện (tóm tắt):
Để đạt được mục tiêu trên, đề tài cân thực hiện các nội dung sau:
- Nghiên cứu tổng quan về tổ chức dữ liệu học máy.
- Khái niệm cơ bản trong xử lý ảnh.
- Phương pháp biểu diễn dữ liệu học máy.
- Nghiên cứu đặc điểm, tính chất đặc trưng của một số loại trái cây.
- Mô hình học sâu (Deep Learning) YOLO, Faster R-CNN.
- Thực nghiệm dữ liệu.
Để thực hiện đề tài này, tác giả sử dụng các phương pháp nghiên cứu sau:
- Nghiên cứu lý thuyết: Tìm kiếm, tổng hợp và nghiên cứu các tài liệu tổng quan, liên quan đến bài toán nhận dạng thời kỳ chín của trái cây.
- Nghiên cứu lý thuyết, khai phá dữ liệu và học sâu. Tìm hiểu các kỹ thuật khai phá dữ liệu và ứng dụng học sâu (deep learning) trong việc nhận dạng thời kỳ chín của trái cây, đặc biệt là trái thanh long.
Phương pháp thực nghiệm: Sau khi nghiên cứu phương pháp lý thuyết, xác định vấn đề bài toán, đề xuất mô hình; Tiến hành xây dựng và phát triển ứng dụng trên mô hình đề xuất; Cài đặt thử nghiệm chương trình với ngôn ngữ lập trình Python.
Ngoài phần mở đầu và tài liệu tham khảo, luận văn gồm 3 chương chính.
Chương 1. GIỚI THIỆU CHUNG
Trình bày tổng quan về tầm quan trọng của dữ liệu số trong bối cảnh Cách mạng Công nghiệp 4.0 và vai trò của nó trong việc phát triển các ứng dụng AI, đặc biệt là trong lĩnh vực nông nghiệp. Việc xây dựng và tổ chức cơ sở dữ liệu hình ảnh trái cây chín là cần thiết để hỗ trợ các mô hình nhận dạng và đánh giá chất lượng trái cây, nhằm nâng cao hiệu quả kinh tế và đáp ứng các yêu cầu cụ thể trong sản xuất nông nghiệp.
Chương 2. CƠ SỞ LÝ THUYẾT
Trình bày những khái niệm về dữ liệu học máy và xử lý ảnh, cùng với các phương pháp biểu diễn dữ liệu. Chương đã làm rõ vai trò của các bộ dữ liệu như tập đào tạo, tập xác thực và tập kiểm thử trong việc huấn luyện và đánh giá mô hình học máy. Các khái niệm về điểm ảnh, độ phân giải và loại ảnh đã được giải thích, giúp hiểu rõ các yếu tố ảnh hưởng đến chất lượng ảnh số. Giới thiệu các phương pháp biểu diễn dữ liệu.
Cuối cùng, đưa ra các ứng dụng thực tiễn trong nông nghiệp, đặc biệt là nhận diện và phân loại trái cây như thanh long.
Chương 3. GIẢI PHÁP XÂY DỰNG BỘ DỮ LIỆU ẢNH SỐ CHO BÀI TOÁN NHẬN DẠNG THỜI KỲ CHÍN CỦA TRÁI THANH LONG
Trình bày một quy trình chi tiết để xây dựng bộ dữ liệu ảnh số phục vụ cho bài toán nhận dạng và phân loại trái thanh long theo thời kỳ chín. Quy trình này bao gồm các bước từ xác định mục tiêu, thu thập và xử lý dữ liệu hình ảnh, đến gán nhãn, tổ chức bộ dữ liệu và thực nghiệm dữ liệu. Nhấn mạnh tầm quan trọng của việc chuẩn bị dữ liệu chất lượng cao để đảm bảo hiệu quả của các mô hình học máy.
6. Năm tốt nghiệp: 2025