머신러닝 기반 위암 전암성 병변 고위험 환자 선별 모델 개발
위암의 전암성 병변(PLGC)의 개별화된 예측과 구별은 위암의 조기 예방에서 중요하다. 현재 PLGC와 위암(GC)을 구별할 수 있는 정확한 비침습적 방법은 부족한 상황이다. 본 연구는 머신러닝 및 딥러닝 기법을 활용해 위암 조기 진단을 돕는 위험 예측 모델을 개발하는 것을 목표로 했다.
연구 방법
2022년 10월부터 2023년 11월까지 9개의 3차 병원에서 총 2229명의 피험자를 모집했다. 통계적으로 유의미한 요인을 식별하고 웹 기반 열지도를 생성하기 위해 포괄적인 설문지를 설계했다. 머신러닝 기법을 사용해 위험 예측 모델을 개발했으며, 딥러닝 알고리즘을 통해 설립한 설문지 기반 위험 예측 모델도 구축했다.
연구 결과
로지스틱 회귀분석을 기반으로 동적 웹 기반 노모그램을 개발했다. 랜덤 포레스트(RF) 모델은 85.65%의 정확도를 기록해 가장 높은 성과를 보였다. 주요 위험 요인으로는 연령, 전통 중국 의학(TCM) 체질 유형, 설태 색깔, 혀 색깔, 불규칙한 식사, 절인 음식, 기름진 음식 선호, 과도하게 뜨거운 음식 섭취 습관, 불안, 수면 시작 지연 등이 있다. Swin Transformer 구조를 사용한 설문지 기반 모델은 73.33%의 정확도와 모든 모델에서 0.8 이상의 AUC를 기록했다.
결론
이 연구는 머신러닝과 딥러닝 기반의 PLGC에서 GC로의 진행 위험 예측 모델을 성공적으로 개발했다. 이는 고위험 환자를 식별하고 위암 조기 진단을 개선하는데 도움을 준다.
배경
중국에서 위암의 발병률과 사망률은 여전히 높으며, 환자의 80% 이상이 말기에 진단된다. 전암성 병변에서 고위험 인구를 식별하는 것은 위암 발병률을 낮추기 위한 필수적 단계다. PLGC는 주로 위 점막의 장상피화생과 이형성을 특징으로 한다. 전통 중국 의학(TCM) 체질 이론은 건강을 이해하고 관리하는 데 도움을 줄 수 있다. 본 연구는 설문지 분석을 통해 위암 발병 위험이 높은 환자를 식별하는 것을 목표로 한다.
연구 방법
데이터는 9개의 3차 병원에서 수집됐으며, 참가자들은 18-75세 사이의 효과적인 의사소통이 가능한 사람들로 구성됐다. 연구에 동의한 참가자들을 대상으로 인구통계학적 정보, 생활 습관, 의료 역사, 수면 상태, 사회적 및 심리적 요인, 신체 활동, 식이 습관, 설문지 데이터 및 TCM 체질 유형을 평가했다.
통계 방법
통계적으로 유의미한 위험 요인은 이진 로지스틱 회귀 모델을 통해 추가 분석했다. 이후 모델 훈련을 위한 데이터셋을 마련하여, 70%는 훈련, 30%는 테스트에 사용했다. 다양한 머신러닝 방법을 사용해 예측 모델을 구성했다.
논의
고위험 개인의 조기 식별은 위암 진행을 예방하기 위한 신속한 개입을 구현하는 데 중요하다. 본 연구에서 개발된 머신러닝 모델은 임상 평가와 개인 맞춤형 위암 관리 전략을 크게 향상시킬 수 있다.
결론
이 연구는 PLGC에서 GC로의 진행과 관련된 주요 위험 요인을 식별하며 머신러닝과 딥러닝을 활용해 발전 단계를 예측했다. TCM 체질 유형과 식습관의 기여는 위암 환자 관리 및 위험 평가에 귀중한 통찰을 제공한다.
출처 : 원문 보러가기