a. Tên luận văn: Phát hiện hành vi té ngã dựa trên đặc trưng học sâu và máy học vectơ hỗ trợ
b. Họ và tên cá nhân thực hiện luận văn: Nguyễn Thị Ngọc Hương
c. Tên đơn vị công tác: Trường THPT Nguyễn Trãi
d. Tên viện - trường thực hiện luận văn: Trường Đại học Khoa học Tự nhiên thành phố Hồ Chí Minh
e. Mục tiêu nghiên cứu: Mong muốn thử nghiệm phương pháp học chuyển tiếp trên các mô hình mạng học sâu tích chập đã được huấn luyện trên tập ảnh tĩnh vào bài toán có chứa yếu tố động.
e. Kết quả thực hiện (tóm tắt)
Hiện nay nhiều nghiên cứu tập trung phát triển các cảm biến cầm tay, hoặc các thiết bị đeo vào người nhằm chăm sóc tốt hơn sức khỏe cho con người, theo nghiên cứu của IMS (Internet Marketing Solution), thị trường các thiết bị mang trên người dự đoán sẽ tăng trưởng từ 14 triệu thiết bị năm 2011 lên khoảng 171 triệu vào năm 2018. Một tổ chức nghiên cứu khác, ABI, đã đưa ra nhận định số lượng tiêu thụ các thiết bị này sẽ đạt con số 485 triệu vào năm 2018.
Tuy nhiên, người lớn tuổi luôn gắn liền với vấn đề trí nhớ kém dần, không thể nhớ được các việc cần làm như uống thuốc sau khi ăn, tắt đèn khi ra khỏi nhà vệ sinh, …nên việc ghi nhớ phải mang các cảm biến vào người là điều tương đối khó khăn đối với người lớn tuổi. Đồng thời, chúng ta sẽ có cảm giác bất tiện khi phải mang các thiết bị cảm biến trên người. Vì vậy nếu dùng các cảm biến được gắn trên người thì lại kém hiệu quả nếu như người đó quên mang cảm biến.
Với nhu cầu hiện nay, thách thức lớn nhất của công trình nghiên cứu là làm sao xây dựng một hệ thống hỗ trợ mà hệ thống đó phải đảm bảo cuộc sống riêng tư và tạo cho người được chăm sóc không có cảm giác bị quan sát và làm phiền. Các hoạt động thường ngày của họ không cần được người khác quan sát trực tiếp thông qua camera. Một thách thức khác là các hệ thống sẽ giám sát các hành vi của người già cần phát hiện và thông báo nhanh chóng, kịp thời cho người chăm sóc biết để xử lí tình trạng bất thường có thể xảy ra, khắc phục hậu quả nghiêm trọng.
Chính vì vậy, vào năm 2018, tác giả Nguyễn Thị Ngọc Hương đã thực hiện đề tài này nhằm đề xuất mô hình đơn giản nhất, hạn chế tối đa các chi phí với độ chính xác có thể chấp nhận được phát hiện hành vi té ngã trên sàn trong môi trường trong nhà. Với camera cố định, người được quan sát không bị che khuất hoặc mang vác đồ vật. Mục tiêu của luận văn muốn thử nghiệm phương pháp học chuyển tiếp trên các mô hình mạng học sâu tích chập đã được huấn luyện trên tập ảnh tĩnh vào bài toán có chứa yếu tố động. Luận văn sử dụng phương pháp rút trích đặc trưng với mục đích giảm bớt chi phí huấn luyện, phù hợp với tập dữ liệu nhỏ.
Đề tài đã nghiên cứu tổng quan về vấn đề cấp thiết cần có hệ thống hỗ trợ phát hiện người té ngã. Đồng thời giới thiệu các giải pháp hiện tại đang được sử dụng để phát hiện té ngã trong và ngoài nước hiện nay; trình bày các công trình liên quan về các đặc trưng đã được sử dụng trong việc giải quyết bài toán nhận dạng hành vi nói chung và nhận dạng té ngã nói riêng; khái quát về mạng học sâu, mạng học sâu tích chập và các mô hình mạng học sâu nổi bật, trình bày mô hình đề xuất của luận văn, phương pháp tạo dãy ảnh chứa đối tượng đang chuyển động, phát hiện đối tượng trong video cô lập vùng cục bộ, phương pháp rút trích đặc trưng được lựa chọn trong bài toán phát hiện té ngã với điều kiện máy móc bị giới hạn. Đồng thời, trình bày cách tổ chức dữ liệu thực nghiệm, minh họa các mẫu dữ liệu cụ thể và báo cáo chi tiết kết quả phát hiện trên từng video trong tập dữ liệu đề xuất. So sánh kết quả với các nghiên cứu trước.
Kết quả, đề tài đã phát hiện hành vi của con người trong một bối cảnh dựa vào một dãy hành động nhỏ liên tiếp của một video. Dựa vào thông tin nội dung của video, con người có thể dễ dàng phân tích, đánh giá cũng như nhận dạng các hành vi của đối tượng trong video, nhưng để cho máy tính có thể tự hiểu, đánh giá, đưa ra một nhận định chính xác là một thách thức lớn trong ngành Thị giác máy tính. Ý nghĩa của đề tài nhằm tăng cường khả năng hiểu video của máy tính, giúp máy tính đưa ra những nhận định chính xác một cách tự động. Hay nói cách khác, máy tính có thể hiểu được các hành vi của đối tượng được quan sát trong video để việc phát hiện được chính xác hơn. Từ đó tăng cường khả năng hiểu hoạt động của con người, tiên đoán khả năng có tình huống bất thường xảy ra.
g. Năm tốt nghiệp: 2019
(Có thể tìm đọc toàn văn Báo cáo kết quả nghiên cứu luận văn - luận án tại Trung tâm Thông tin và Thống kê khoa học và công nghệ).