Phát hiện chỗ trống trong bãi đậu xe có Camera quan sát
Đây là luận văn sau đại học của tác giả Nguyễn Thị Thanh Trúc thực hiện vào năm 2019 với mục tiêu nhằm đề xuất mô hình đơn giản, hạn chế tối đa các chi phí với độ chính xác có thể chấp nhận được nhằm phát hiện chỗ trống trong bãi đậu xe có camera giám sát. Với camera cố định lắp đặt trong bãi đậu xe đã thiết lập tọa độ thể hiện vị trí của các chỗ đậu xe trong từng khung hình. Đồng thời, luận văn cũng muốn thử nghiệm phương pháp rút trích đặc trưng từ các phương pháp cơ bản đến việc sử dụng mô hình học sâu để huấn luyện các ảnh tĩnh bằng phương pháp học máy.
Luận văn đã đưa ra bài toán cần giải quyết là dữ liệu video được thu từ camera có độ thu phóng tốt, lấy được ảnh bãi đậu xe có vạch kẻ. Camera có độ thu phóng tốt phục vụ giám sát bãi đậu xe rộng nhất có thể. Dựa vào các ảnh thu được đã gắn tọa độ thể hiện vị trí của từng chỗ đậu xe để phân biệt vị trí đậu xe còn trống với vị trí đậu xe không còn trống.
Qua đó cho thấy thách thức của bài toán được đặt ra là góc nhìn của camera, điều kiện ánh sáng là có ảnh hưởng đến dữ liệu thu thập. Thách thức này ảnh hưởng đến độ chính xác của hệ thống khi xác định đối tượng trong ảnh, nhận dạng và tiên đoán; sự biến thiên lớn trong các chỗ đậu xe chẳng hạn như có vũng nước, có đồ vật lạ… cũng là thách thức của bài toán. Một hệ thống phát hiện chính xác các hỗ có xe đậu với các chỗ không có xe đậu.
Với những thách thức của bài toán đặt ra, luận văn tập trung giải quyết vấn đề phát hiện các chỗ đậu xe trống và thống kê chính xác số lượng các chỗ đậu xe còn trống, mong muốn là tăng độ chính xác của phương pháp trên một hệ thống các thiết bị không mạnh.
Từ bài toán đặt ra, tác giả đã tiến hành tìm hiểu các phương pháp nhận dạng cũng như phát hiện các vị trí đậu xe trống trong bãi đậu xe. Việc phát hiện ra chỗ trống trong bãi đậu xe, tác giả đã dựa vào mô hình AdaBoost và SVM. Trong đó, mô hình AdaBoost cho kết quả tốt là nhờ vào việc chọn bộ phân lớp yếu phù hợp, còn mô hình SVM tùy thuộc vào việc chọn “hàm nhân”. Bộ phân lớp yếu của mô hình AdaBoost được chọn để thực nghiệm cho bài toán là cây quyết định nông và qua thực nghiệm cụ thể số cây quyết định nông: 10, 40, 60, 100, 120, 256 thì kết quả nhận được khi số cây quyết định 120 và 256 là tốt nhất. Đối với mô hình SVM hàm nhân tuyến tính cho ra kết quả tốt nhất…
Kết quả, đề tài đã phát hiện chỗ trống trong bãi đậu xe dựa vào cường độ ánh sáng của các điểm ảnh trong vùng ảnh. Dựa vào thông tin của ảnh, con người có thể dễ dàng phân tích, đánh giá cũng như phát hiện các chỗ đậu xe trống trong ảnh, nhưng để cho máy tính có thể tự hiểu, đánh giá, đưa ra một nhận định chính xác là một thách thức trong ngành thị giác máy tính.
Ý nghĩa của đề tài nhằm tăng cường khả năng hiểu ảnh của máy tính, giúp máy tính đưa ra những nhận định chính xác một cách tự động. Nói cách khác, máy tính có thể hiểu được các thông tin trong ảnh để phát hiện đối tượng được chính xác hơn. Từ đó, hệ thống phát hiện và thống kê chỗ đậu xe trống hỗ trợ cho người điều khiển xe cũng như người quản lý bãi đậu xe tiết kiệm được thời gian. Để hiểu và phát hiện được chỗ đậu xe trống, chúng ta cần làm cho máy hiểu được sự khác biệt về cường độ ánh sáng giữa các vùng ảnh trong ảnh. Đề tài giúp cho máy tính hiểu chỗ đậu xe trống dựa trên đặc trưng LBP và đặc trưng được trích xuất từ mô hình VGG16.
Với ý nghĩa thực tiễn, ngày nay có rất nhiều nghiên cứu tập trung phát hiện chỗ trống trong bãi đậu xe nhằm tiết kiệm thời gian, chi phí của người lái xe đồng thời hạn chế sự ô nhiễm môi trường tự lượng khí thải của xe. Bên canh đó, kết quả nghiên cứu cũng hỗ trợ cho người quản lý trong việc giám sát và thống kê lưu lượng xe trong bãi đậu xe.
Đặc trưng LBP (Local Binary Pattern) - đặc trưng cục bộ địa phương do Ojala đề xuất năm 1996 và được cải tiến vào năm 2002, 2007. Mục tiêu của LBP là dùng các điểm láng giềng (gp) của giá trị tâm (gc) chọn làm ngưỡng xác định. Từ đó, xác định được mô hình ngưỡng dựa trên việc so sánh giá trị tâm (gc) với các điểm láng giềng (gp).
Mô hình VGG16: Trong mô hình mạng học sâu có 2 khía cạnh cần quan tâm là tính bất biến và tính kết hợp. Với cùng một đối tượng, nếu đối tượng này được chiếu theo các góc độ khác nhau thì độ chính xác của thuật toán sẽ bị ảnh hưởng đáng kể. Tính kết nối cục bộ cho ta các cấp độ biểu diễn thông tin từ mức độ thấp đến mức độ cao và trựu tượng hơn thông qua phép tích chập từ các bộ lọc. Đó là lý do tại sao mạng tích chập cho ra mô hình với độ chính xác cao. Vì vậy Luận văn đã lựa chọn học chuyển tiếp trên mô hình VGG16 để thực hiện rút trích đặc trưng.
Mô hình SVM là một trong những lựa chọn tốt nhất cho các bài toán lớp nhi phân. Mục tiêu của SVM là huấn luyện một mô hình gán các đối tượng không nhìn thấy mới vào một lớp cụ thể. Điểm mạnh của SVM là việc sử dụng phương pháp hạt nhân giúp cho SVM không còn bị giới hạn bởi việc phân lớp một cách tuyến tính, hay nói cách khác các siêu phẳng có thể được hình thành từ các hàm phi tuyến tính.
Ngọc Loan