AI 임상 시험의 진화: 책임감 있는 모델 개발과 검증
최근 몇 년간 인공지능(AI)의 임상 번역에 대한 권위 있는 지침은 주로 두 가지 영역으로 집중되었습니다: 책임감 있는 모델 개발과 검증, 그리고 사전 임상 시험입니다. 초기 작업은 우수한 성능을 보이고 중요한 임상 과제를 해결하며 적절한 데이터를 기반으로 훈련되어 의미 있는 목표 달성이 가능한 모델을 구축하는 데 집중되었습니다. 이 모델은 새로운 사례 세트를 통해 일반화 능력을 검증하고 외부 평가 가능성을 확인해야 합니다. 또한, 모델의 성능 변화 탐지를 위해 지속적인 모니터링 관행의 중요성이 대두되고 있습니다.
임상 환경에서 AI의 효과적 검증 필요
실리코(in silico) 환경과 임상 환경 사이의 차이는 상당하므로, 임상 평가의 필요성이 강조됩니다. 2020년, SPIRIT-AI 및 CONSORT-AI 보고 지침은 AI 모델의 영향을 평가하는 사전적인 개입 임상 시험을 위한 최소 보고 기준을 마련했습니다. 그 후 AI 도구의 초기 인간 임상 시험을 다룬 DECIDE-AI 지침도 발표되었습니다. 규제 프레임워크는 임상적 증거의 중요성을 강조하고 있으나, 임상 AI 애플리케이션 승인에 필요한 정확한 증거의 종류와 정도는 아직 명확하지 않습니다.
출처 : 원문 보러가기