Áp dụng độ đo Entropy cho bài toán tách đặc trưng của bọt khí trên video và đề xuất kết hợp SVM cho vấn đề tự động theo dõi sục khí tại trạm quan trắc môi trường
Ngày nay, để có được môi trường trong sạch mà đặc biệt là môi trường nước, ngành công nghiệp xử lý nước sạch đang được nhà nước và cộng đồng quan tâm sâu sắc. Để có được nguồn nước sạch, người ta cần cải tạo môi trường và hệ sinh thái bằng cách nuôi những con vi sinh trong những cái bể lớn nhằm cung cấp vi sinh cho những chỗ nước bị nhiễm bẩn, hệ sinh thái bị biến đổi. Trong quá trình nuôi vi sinh người ta cần phải sục khí liên tục vào bể để cung cấp đủ oxi để nuôi sống vi sinh, nếu không được sục khí thường xuyên thì những con vi sinh sẽ không thể sống được do thiếu oxi.
Xuất phát từ thực tế này, chúng ta cần có những phần mềm để theo dõi và giám sát xem bể nuôi vi sinh có được sục khí liên tục hay không. Trong đó, vấn đề liên quan đến xử lý video, xử lý frame ảnh và nhận dạng frame ảnh trong video sẽ phục vụ cho nhu cầu phát hiện và cảnh báo vấn đế không có bọt khí (khi bể không được sục khí) thông qua việc giám sát tự động bởi các camera. Với nhu cầu trên, tác giả Trịnh Văn Dũng đã chọn chủ đề “Áp dụng độ đo Entropy cho bài toán tách đặc trưng của bọt khí trên video và đề xuất kết hợp SVM cho vấn đề tự động theo dõi sục khí tại trạm quan trắc môi trường” làm đề tài luận văn tốt nghiệp sau đại học cho mình.
Mục tiêu của đề tài là tìm hiểu và nghiên cứu một số kỹ thuật xử lý phân tích, trích chọn đặc trưng ảnh để có thể lấy ra được những ảnh mẫu tốt nhất phục vụ việc huấn luyện phân lớp mẫu và nhận dạng. Đồng thời khảo sát, nghiên cứu một số thuật toán học phục vụ việc huấn luyện mô hình phân lớp mẫu. Từ đó sử dụng so sánh với các frame ảnh trích xuất từ các camera giám sát bất kỳ nào có thể dự đoán, nhận dạng được frame ảnh đó có bọt khí hay không có bọt khí nhằm giải quyết bài toán nhận dạng ảnh để xác định bể nuôi vi sinh có được sục khí hay không được sục khí.
Để đạt được mục tiêu đề ra, tác giả đã tiến hành nghiên cứu tổng quan về video, xử lý video, các đặc trưng cơ bản đối với frame ảnh, các phương pháp và kỹ thuật xử lý phân tích trích chọn đặc trưng ảnh như: các bộ lọc làm mịn ảnh, các kỹ thuật tìm biên ảnh, độ đo Entropy cho các điểm ảnh, Fuzzy Logic và phép biến đổi Wavelet Haar. Mục đích để có thể đưa ra các ảnh mẩu tốt nhất phục vụ cho việc huấn luyện mô hình phân lớp và nhận dạng sau này.
Nghiên cứu về học máy cùng một số thuật toán học máy giúp huấn luyện và phân lớp dữ liệu ảnh mẫu nhằm đưa ra được mô hình học phân lớp tốt nhất có thể, giúp phát hiện nhận dạng đúng hiện tượng ảnh có bọt khí (trường hợp bể nuôi có sục khí) hay không bọt khí (trường hợp bể nuôi không được sục khí) chính xác nhất có thể. Đồng thời, cài đặt thực nghiệm cho một số video clip trích từ camera giám sát của các bể nuôi vi sinh được thu thập từ đơn vị quan trắc môi trường tại tỉnh Bình Dương.
Theo tác giả, Trong tiếng việt chúng ta chưa có từ tương đương với từ Entropy, tuy nhiên có thể định nghĩa về mặt toán học như sau: Entropy là một đại lượng toán học dùng để đo lượng thông tin không chắc chắn (hay lượng ngẫu nhiên) của một sự kiện hay của phân phối ngẫu nhiên cho trước. Hay một số tài liệu tiếng anh gọi là Uncertainty Measure. Hay có thể gọi Entropy là đại lượng đo thông tin (hay còn gọi là độ bất định). Nó được tính như một hàm phân bố xác suất.
Để theo dõi quá trình sục khí trong các bể nuôi vi sinh của các đơn vị quan trắc môi trường nước thông qua các camera giám sát. Bài toán đặt ra ở đây là làm sao theo dõi biết được quá trình sục khí có thường xuyên hay không. Vì vậy, cần phải nhận dạng được ảnh có bọt khí (trong trường hợp có sục khí) và ảnh không có bọt khí (trong trường hợp không được sục khí) thông qua việc nhận dạng frame ảnh trích xuất từ camera giám sát. Để giải quyết cho vấn đề này, tác giả đã thực hiện nghiên cứu các kiến thức về xứ lý ảnh số, các phương pháp xử lý ảnh số, các thuật toán học máy, huấn luyện phân lớp và nhận dạng ảnh và xây dựng bài toán nhận bọt khí theo 3 giai đoạn: Quá trình xử lý ảnh, quá trình huấn luyện - phân lớp mẫu và quá trình nhận dạng ảnh.
Như vậy, qua quá trình nghiên cứu và kết quả thực nghiệm, tác giả đã đề xuất với hai phương pháp trích chọn đặc trưng: Một là ứng dụng độ đo Entropy kết hợp Fuzzy Logic và Wavelet Haar để đưa ra những ảnh có đặc trưng tốt nhất cho huấn luyện phân lớp; Hai là ứng ứng dụng bộ lọc Canny để tìm ra những đường biên tốt nhất cho ảnh cho huấn luyện phân lớp. Từ đó có thể huấn luyện phân lớp và có được mô hình phân lớp mẫu tốt nhất nhằm sử dụng cho bài toán nhận dạng ảnh bọt khí /không bọt khí ứng dụng cho việc quản lý, giám sát quá trình sục khí cho các bể nuôi vi sinh. Đồng thời có thể giúp cho các đơn vị quan trắc môi trường hay các công ty sản xuất có nước xả thải có thể xử lý tốt hơn trước khi xả thải ra môi trường. Đặc biệt là đối với hướng ứng dụng bộ lọc canny được cài đặt trên Visual Studio C++ và sử dụng thư viện mã nguồn mở OpenCV có kết quả nhận dạng với độ chính xác rất cao (100%) và thuận tiện cho việc xây dựng ứng dụng người dùng, có thể đưa vào ứng dụng thực tế được ngay cho các camera giám sát bể nuôi vi sinh.
Thơ Mộng (Đọc toàn văn tại Trung tâm Thông tin và Thống kê KHCN)