Ứng dụng phân tích BigData và học máy trong nghiên cứu và tìm kiếm các chỉ thị sinh học đệ chẩn đoán, tiên lượng và điều trị ung thư gan nguyên phát
Tại Hội thi Sáng tạo Kỹ thuật tỉnh Bình Dương lần thứ XI năm 2024-2025 vừa qua, một công trình nghiên cứu đầy tâm huyết và mang tính ứng dụng cao đã vinh dự đạt Giải Nhì, khẳng định tiềm năng ứng dụng khoa học công nghệ trong trong lĩnh vực y tế. Đó là giải pháp "Ứng dụng phân tích Big Data và học máy trong nghiên cứu và tìm kiếm các chỉ thị sinh học để chẩn đoán, tiên lượng và điều trị ung thư gan nguyên phát" của nhóm tác giả Nguyễn Minh Nam và Bùi Thị Phường thuộc Trường Đại học Sức khỏe. Công trình này góp phần mở ra những hy vọng mới cho hàng triệu bệnh nhân ung thư gan.
1. Bối cảnh và tầm quan trọng của nghiên cứu ung thư gan
Ung thư biểu mô gan (HCC) là một trong những loại ung thư ác tính phổ biến nhất và là nguyên nhân gây tử vong do ung thư đứng thứ ba trên toàn thế giới. Đáng lo ngại hơn, tỷ lệ sống sót sau năm năm ở những bệnh nhân được chẩn đoán mắc ung thư gan thấp do bệnh thường được phát hiện vào giai đoạn trung gian hoặc giai đoạn muộn, khi các lựa chọn điều trị kém hiệu quả và tiên lượng xấu. Ung thư gan nguyên phát phần lớn xảy ra trên nền xơ gan. Điều trị và kiểm soát ung thư gan nguyên phát gặp nhiều khó khăn do bệnh thường được phát hiện muộn, có tiên lượng kém, tỷ lệ tái phát khối u cao và kháng với các liệu pháp hóa trị, xạ trị truyền thống, đặc biệt là với các khối u không đồng nhất. Trong khi bệnh ở giai đoạn đầu có tỷ lệ sống sót sau năm năm từ 40% đến 70%, hầu hết bệnh nhân được chẩn đoán mắc bệnh ở giai đoạn trung gian hoặc muộn.
Việc phát hiện sớm ung thư gan nguyên phát bằng cách sử dụng hình ảnh và các chỉ dấu sinh học có thể cải thiện đáng kể kết quả của bệnh nhân. Tuy nhiên, các phương pháp chẩn đoán và tiên lượng bệnh hiện nay vẫn còn rất nhiều hạn chế trong việc phát hiện sớm cũng như theo dõi các giai đoạn phát triển của bệnh. Mặc dù đã có những tiến bộ trong sự hiểu biết về cơ chế bệnh sinh phân tử của ung thư gan dẫn đến việc phát triển các liệu pháp điều trị mới được phê duyệt, nhưng các lựa chọn điều trị cho bệnh ở giai đoạn muộn vẫn còn hạn chế. Chính vì những lý do đó, việc nghiên cứu và phát hiện ra một chỉ dấu sinh học có thể giúp chẩn đoán sớm, tiên lượng và điều trị ung thư biểu mô tế bào gan là vấn đề cần được quan tâm hơn.
Trong bối cảnh cấp bách đó, đề tài "Ứng dụng phân tích Big Data và học máy trong nghiên cứu và tìm kiếm các chỉ thị sinh học để chẩn đoán, tiên lượng và tiên lượng ung thư gan nguyên phát" đã được thực hiện. Mặc dù tựa đề của nghiên cứu là ung thư gan nguyên phát nhưng các bệnh nhân được đưa vào nghiên cứu là các bệnh nhân ung thư biểu mô tế bào gan. Điều này là do bệnh nhân ung thư biểu mô tế bào gan chiếm phần chính yếu của ung thư gan nguyên phát và các hồ sơ dữ liệu của bệnh nhân cũng đa phần là của các bệnh nhân ung thư biểu mô tế bào gan.
2. Mục tiêu nghiên cứu và cách tiếp cận
Nghiên cứu được thực hiện với ba mục tiêu chính:
- Mục tiêu 1: Tìm những gene làm chỉ thị sinh học liên quan tới sự sống của bệnh nhân ung thư gan và có biểu hiện khác biệt giữa mô gan bình thường và mô ung thư gan dựa vào phân tích dữ liệu lớn.
- Mục tiêu 2: Xây dựng và kiểm định mô hình chẩn đoán, tiên lượng và điều trị dựa vào học máy.
- Mục tiêu 3: Kiểm tra tính khả thi các chỉ thị sinh học trong việc chẩn đoán sớm trên mẫu bệnh nhân ung thư gan ở Việt Nam.
Để đạt được những mục tiêu này, nhóm nghiên cứu đã áp dụng một cách tiếp cận toàn diện và hiện đại. Hồ sơ dữ liệu biểu hiện gene và các thông tin lâm sàng của bệnh ung thư biểu mô tế bào gan được thu thập từ các nguồn cơ sở dữ liệu quốc tế lớn là The Cancer Genome Atlas (TCGA) và Gene Expression Omnibus (GEO). Tổng cộng, nghiên cứu đã sử dụng 1.889 mẫu, bao gồm 1.357 mẫu ung thư và 532 mẫu mô bình thường hoặc mẫu mô lân cận mô ung thư, từ bảy tập hồ sơ dữ liệu khác nhau.
3. Những điểm sáng tạo và kết quả đạt được
Công trình nghiên cứu này nổi bật không chỉ bởi việc áp dụng các công nghệ tiên tiến mà còn ở những phát hiện cụ thể và quy trình khoa học chặt chẽ.
3.1. Phát hiện Chỉ thị sinh học F12 - Bước tiến vượt trội trong chẩn đoán sớm:
Một trong những thành tựu quan trọng nhất của nghiên cứu là việc xác định và chứng minh được F12 là một chỉ thị có thể giúp chẩn đoán ung thư gan tốt hơn AFP (Alpha-fetoprotein). AFP là chỉ thị sinh học phổ biến hiện nay nhưng còn nhiều hạn chế, đặc biệt ở các giai đoạn sớm của bệnh.
- Hiệu quả vượt trội của F12: F12 có biểu hiện thấp ở mô ung thư và có thể chẩn đoán tốt ở các nhóm xơ gan, bệnh nhân có nồng độ AFP thấp, và đặc biệt là nhóm bệnh nhân ung thư gan giai đoạn rất sớm và sớm. Điều này khắc phục được nhược điểm của AFP, vốn không hiệu quả trong chẩn đoán sớm và ở một số nhóm bệnh nhân cụ thể.
- Kiểm chứng trên mẫu bệnh nhân Việt Nam: Hơn nữa, nghiên cứu cũng đã chứng minh được giá trị chẩn đoán của F12 trên mẫu bệnh nhân người Việt Nam. Đây là một yếu tố quan trọng, khẳng định tính ứng dụng thực tiễn của phát hiện này trong điều kiện y tế và đặc điểm di truyền của người Việt.
3.2. Xây dựng mô hình tiên lượng 14 Gene - Cá nhân hóa điều trị ung thư gan:
Bên cạnh F12, nghiên cứu đã tìm ra 14 gene tiềm năng khác trong tiên lượng bệnh ung thư gan và dự đoán đáp ứng điều trị của bệnh nhân ung thư gan với liệu pháp TACE (Transcatheter Arterial Chemoembolization) và sorafenib. Các gene này bao gồm: ADH1B, CAT, CENPM, CYP3A43, ECHDC2, F12, MAFF, MLYCD, NDFIP1, SERPINE1, SLC10A1, SNRPF và UBE2D3.
- Mô hình tiên lượng đột phá: Đồng thời, nghiên cứu đã xây dựng được mô hình tiên lượng ung thư gan dựa trên biểu hiện của 14 gene và kiểm định trên các tập dữ liệu bệnh nhân độc lập khác. Theo đó, những bệnh nhân có chỉ số tiên lượng cao sẽ có tiên lượng xấu hơn và thời gian sống cũng như thời gian tái phát ngắn hơn so với những bệnh nhân có chỉ số tiên lượng thấp hơn.
- Dự đoán đáp ứng điều trị: Một điểm nổi bật khác của mô hình là khả năng dự đoán đáp ứng điều trị. Cụ thể, những bệnh nhân ung thư gan có chỉ số tiên lượng thấp thì phù hợp với điều trị bằng phương pháp TACE. Ngược lại, những bệnh nhân ung thư gan nào có chỉ số tiên lượng cao thì sẽ đáp ứng tốt với liệu pháp sorafenib. Mô hình này cũng được chứng minh là mô hình tiên lượng độc lập cho sự sống còn của bệnh nhân ung thư gan.
3.3. Quy trình Khoa học hoàn chỉnh và khả thi:
Để đảm bảo tính chính xác và khả năng tái lập của nghiên cứu, nhóm đã thiết kế thành công các primer, xây dựng được quy trình thu thập, tách chiết mRNA và Realtime RT-PCR để đánh giá biểu hiện của các gene F12, AFP và GAPDH. Các bước này đều tuân thủ nghiêm ngặt các quy định về đạo đức và kỹ thuật trong nghiên cứu khoa học.
4. Ý Nghĩa đối với y học và cộng đồng
Giải pháp này không chỉ là một thành tựu khoa học mà còn có ý nghĩa thiết thực trong việc nâng cao chất lượng chăm sóc sức khỏe cộng đồng, đặc biệt trong cuộc chiến chống lại ung thư gan.
- Nâng cao hiệu quả chẩn đoán sớm: Với chỉ thị F12 mới, khả năng chẩn đoán ung thư gan ở giai đoạn sớm được cải thiện đáng kể, đặc biệt là ở những nhóm bệnh nhân khó chẩn đoán bằng phương pháp truyền thống. Chẩn đoán sớm là yếu tố then chốt để tăng tỷ lệ sống sót và hiệu quả điều trị.
- Cá nhân hóa và tối ưu hóa điều trị: Mô hình tiên lượng 14 gene cung cấp một công cụ mạnh mẽ để phân tầng bệnh nhân, giúp bác sĩ đưa ra quyết định điều trị phù hợp nhất cho từng cá thể. Điều này giúp tránh được các phương pháp điều trị không hiệu quả, giảm tác dụng phụ không mong muốn, và tối ưu hóa nguồn lực y tế. Đây chính là bản chất của y học cá nhân hóa và y học chính xác, xu hướng phát triển của y học hiện đại.
- Tiềm năng ứng dụng thực tiễn tại Việt Nam: Việc kiểm chứng thành công F12 trên mẫu bệnh nhân Việt Nam là một minh chứng rõ ràng cho tính khả thi của giải pháp này trong hệ thống y tế trong nước. Điều này mở ra cơ hội lớn để áp dụng các kết quả nghiên cứu vào thực tiễn lâm sàng, mang lại lợi ích trực tiếp cho người bệnh.
5. Hướng phát triển
Để tiếp tục phát huy những thành quả đã đạt được và đưa giải pháp này vào ứng dụng rộng rãi, nhóm nghiên cứu cũng đưa ra một số kiến nghị quan trọng:
- Mở rộng quy mô và cỡ mẫu: Cần có thêm nguồn kinh phí để mở rộng nghiên cứu ở các bệnh viện khác và gia tăng cỡ mẫu. Điều này sẽ giúp củng cố và chứng minh vững chắc hơn giá trị chẩn đoán của F12 và giá trị tiên lượng của mô hình trên một phạm vi lớn hơn.
- Kết hợp chỉ thị sinh học: Kết hợp chỉ thị sinh học F12 với các chỉ thị sinh học khác hoặc/và các thông tin lâm sàng khác để xây dựng mô hình chẩn đoán chính xác hơn. Tương tự như điểm GALAD (kết hợp AFP, AFP-L3, DCP cùng tuổi và giới tính) đã đạt độ nhạy 94,2% trong chẩn đoán ung thư gan, việc kết hợp F12 với các yếu tố khác có thể mang lại kết quả tối ưu.
- Đánh giá giá trị protein F12 trong huyết tương: Nghiên cứu sâu hơn về giá trị chẩn đoán ung thư gan của protein F12 trong huyết tương sẽ là một bước tiến quan trọng, giúp phát triển các xét nghiệm không xâm lấn và tiện lợi hơn cho bệnh nhân.
Các gene trong mô hình 14 gene cũng cho thấy sự tương đồng với các nghiên cứu trước đây. Ví dụ, SNRPF được chứng minh là biểu hiện cao ở các mô ung thư và có xu hướng tăng theo giai đoạn bệnh. G6PD tăng cao ở các mô ung thư gan và liên quan đến di căn và tiên lượng xấu. CENPM cũng biểu hiện cao ở mô ung thư gan, tăng theo giai đoạn và liên quan đến tiên lượng xấu. Ngược lại, các gene biểu hiện thấp ở mô ung thư gan nguyên phát như SLC10A1, ADH1B, CYP3A43, MLYCD cũng có nhiều nghiên cứu tương đồng, liên quan đến thời gian sống sót ngắn hơn hoặc tiến triển của bệnh. Đặc biệt, sự đa hình của SERPINE1 có vai trò quan trọng trong phân định kết quả điều trị TACE, và UBE2D3 là một trong ba gene trung tâm trong việc xây dựng mô hình phòng ngừa và điều trị HCC. Điều này càng củng cố độ tin cậy và tiềm năng ứng dụng của các gene được tìm thấy trong nghiên cứu.
6. Lời Kết
Giải pháp "Ứng dụng phân tích Big Data và học máy trong nghiên cứu và tìm kiếm các chỉ thị sinh học để chẩn đoán, tiên lượng và điều trị ung thư gan nguyên phát" đạt Giải Nhì tại Hội thi Sáng tạo Kỹ thuật tỉnh Bình Dương lần thứ XXI năm 2024-2025 là một niềm tự hào lớn, minh chứng cho sự sáng tạo, trí tuệ và nỗ lực không ngừng của các nhà khoa học trong lĩnh vực y tế. Hơn cả một giải thưởng, công trình này thể hiện một cam kết hướng đến tương lai, nơi công nghệ sẽ tiếp tục là đòn bẩy quan trọng để mang lại những cải thiện rõ rệt trong y học, từ đó góp phần nâng cao sức khỏe và chất lượng cuộc sống cho cộng đồng.

Nhóm tác giả đạt giải nhì tại Hội thi Sáng tạo Kỹ thuật tỉnh Bình Dương lần thứ XI năm 2024-2025
Trung Tính