Nhận dạng cảm xúc của người dựa trên ảnh nhiệt
Cảm xúc đóng một vai trò quan trọng trong giao tiếp phi ngôn ngữ, là một trong những cơ sở để hiểu được hành vi của con người. Có thể nhận dạng cảm xúc thông qua nhiều hình thức khác nhau, và đặc biệt là thông qua biểu hiện trên khuôn mặt.
Trong xu hướng phát triển của khoa học kĩ thuật, công nghệ thông tin, nhận dạng cảm xúc trở thành một vấn đề đã và đang thu hút được sự quan tâm, nghiên cứu của các nhà khoa học. Tuy nhiên, do sự phức tạp của khuôn mặt người, biểu cảm của cảm xúc và quan điểm về hành vi cho thấy nghiên cứu về lĩnh vực này vẫn còn là một thách thức lớn.
Ngoài ra, các hệ thống dựa trên các hình ảnh nhìn thấy phải đối mặt với những thách thức như: chất lượng ảnh không tốt do điều kiện ánh sáng kém, nhiều người không biểu hiện nên không thể nhận biết được cảm xúc thật… Những nguyên nhân đó đều có thể làm giảm độ chính xác của kết quả nghiên cứu. Việc sử dụng hình ảnh nhiệt là một trong những giải pháp khắc phục những hạn chế của ảnh nhìn thấy được. Bên cạnh đó, không phải toàn bộ ảnh có tác động thay đổi nhiệt độ khi cảm xúc thay đổi nên việc rút trích đặc trưng vùng quan trọng là rất cần thiết. Có thể nói, sử dụng ảnh nhiệt là một kỹ thuật đầy hứa hẹn trong việc nhận dạng cảm xúc thực tế hơn.
Từ những nhận định trên, tác giả Nguyễn Thị Anh Thư, trường Trung học phổ thông chuyên Hùng Vương đã chọn đề tài “Nhận dạng cảm xúc của người dựa trên ảnh nhiệt” làm luận văn sau đại học cho mình vào năm 2018 dưới sự hướng dẫn của Tiến sĩ Nguyễn Viết Hưng, đề tài được thực hiện với mục tiêu xây dựng một mô hình rút trích đặc trưng của ảnh nhiệt hỗ trợ cho việc nhận dạng cảm xúc của người dựa trên ảnh nhiệt của khuôn mặt người.
Tất cả vật thể, cả tự nhiên lẫn nhân tạo, đều phát ra năng lượng nhiệt hồng ngoại. Bằng cách phát hiện sự khác biệt nhiệt độ rất tinh vi, công nghệ hình ảnh nhiệt cho thấy những gì mà mắt thường không nhìn thấy được. Hình ảnh nhiệt không gây hại cho cơ thể con người, do đó nó đã được đề xuất như là một nguồn thông tin thay thế để phát hiện, công nhận khuôn mặt và ước tính của cảm xúc.
Qua tìm hiểu các bài nghiên cứu trước đó, tác giả cho rằng, hầu hết các phương pháp tiếp cận bài toán dạng cảm xúc đều chuyển đổi dữ liệu đến các không gian khác có mô tả tốt hơn và dễ dàng phân loại cảm xúc hơn. Trích xuất đặc trưng là cách tìm các đặc trưng phù hợp để thể hiện tốt nhất cảm xúc của con người. Dựa trên các đặc trưng này để thực hiện phân loại cảm xúc. Trích xuất đặc trưng là chìa khóa để trích xuất các thông tin hữu ích của khuôn mặt bằng cách giảm số chiều của không gian dữ liệu sao cho lượng thông tin sau khi trích xuất vẫn đảm bảo các đặc trưng của dữ liệu ban đầu, trích xuất đặc trưng tốt làm giảm chi phí và tăng độ chính xác cho quá trình nhận dạng. Có thể phân thành hai phương pháp chính: Phương pháp dựa trên việc xuất hiện đặc trưng và phương pháp dựa trên đặc trưng hình học.
Bên cạnh đó, các nghiên cứu cũng cho thấy hình ảnh nhiệt không nhạy cảm với điều kiện ánh sáng, không chịu tác động bởi điều kiện môi trường xung quanh, có thể được sử dụng để phát hiện sự thay đổi nhiệt độ trên khuôn mặt. Bên cạnh đó, không phải toàn bộ ảnh có tác động thay đổi nhiệt độ khi cảm xúc thay đổi nên việc rút trích đặc trưng vùng quan trọng là rất cần thiết. Như vậy, sử dụng ảnh nhiệt là một kỹ thuật đầy hứa hẹn trong việc nhận dạng cảm xúc con người chính xác hơn và thực tế hơn.
Tại thời điểm nghiên cứu, có nhiều cơ sở dữ liệu ảnh nhìn thấy được phổ biến rộng rãi. Trong khi đó, chỉ có rất ít cơ sở dữ liệu ảnh nhiệt được khai thác và sử dụng. Ngoài ra, có một số cơ sở dữ liệu ảnh nhiệt gặp vấn đề khi thiết kế trong thu thập dữ liệu, đó là hiện tượng trễ thời gian. Do đó, tác giả đã đề xuất sử dụng cơ sở dữ liệu cảm xúc và gương mặt nhiệt Kotani Thermal Facial Emotion - KTFE để nghiên cứu phân tích biểu hiện khuôn mặt trở nên thực tế hơn. KTFE chứa bảy cảm xúc tự phát của 30 đối tượng gồm người Việt, người Nhật và người Thái từ 11 đến 32 tuổi, bao gồm 130GB các video cảm xúc trên khuôn mặt có thể nhìn thấy và nhiệt, cơ sở dữ liệu hình ảnh biểu hiện khuôn mặt và cơ sở dữ liệu hình ảnh khuôn mặt nhiệt.
Dựa vào cơ sở dữ liệu được đề xuất, tác giả tiến hành thực nghiệm và phân tích kết quả thực nghiệm theo yêu cầu đặt ra. Sau đó, so sánh kết quả trên cùng cơ sở dữ liệu, cùng phương pháp và so sánh kết quả trên cùng cơ sở dữ liệu nhưng phương pháp khác nhau. Từ kết quả thu được, tác giả tin rằng dữ liệu nhiệt là thông tin bổ sung quan trọng để hỗ trợ nhận dạng cảm xúc người chính xác hơn.
Về mặt lý thuyết, đề tài đã ứng dụng thành công công nghệ thị giác máy tính vào trong thực tế. Nhận dạng cảm xúc của người dựa trên ảnh nhiệt cho kết quả chính xác cao trong những điều kiện thu nhận thay đổi về tỉ lệ, ánh sáng, đặc biệt là với dữ liệu khuôn mặt của người. Tạo tiền đề cho các nghiên cứu dùng thị giác máy tính và tâm lý học tiếp theo trong tương lai. Về thực tiễn, đề tài đã cung cấp các thuật toán hỗ trợ cho điều khiển robot, các thiết bị phát hiện và nhận dạng cảm xúc khuôn mặt người, các hệ thống tư vấn, đánh giá độ hài lòng của khách hàng thông qua nét mặt, các ứng dụng trong tương tác người - máy, khoa học máy tính, khoa học hành vi, tâm lý học và khoa học y khoa và các lĩnh vực khác.
Ngọc Trang