이상수의 health policy insight

● [Health Policy Insight 354회]

영국, 디지털헬스 '근거 표준 프레임워크(Evidence Standards Framework, ESF)' 개발

▲ 이 상 수
Medtronic North Asia
(Korea and Japan)
대외협력부 전무

디지털헬스 기술(digital health technologies, DHTs)은 인간 또는 더 광범위한 헬스케어 시스템에 혜택을 주기 위한 앱, 소프트웨어 및 온라인 플랫폼을 포함한 광범위한 제품으로 구성된다. DHTs의 급속한 출현은 효과적이고 저렴한 비용으로 대규모의 환자중심 케어를 제공하기 위한 새로운 방법을 모색하는 의료시스템에 기회와 도전 모두를 제시한다. 이 분야의 발전 속도는 효과성을 보여주는 근거가 거의 없고 헬스케어 시스템에 의한 표준화된 평가 없이 많은 DHTs가 시장에 도입되고 있음을 의미한다. 강건한 의료기술평가(health technology assessment, HTA)는 가장 효과적인 중재(interventions)를 식별하고 자원을 가장 효율적으로 사용하는데 이용된다. 

그러나 전통적인 의료기술평가는 출판된 근거의 평가(appraisal)에 의존하는데, 이는 생성하는데 시간과 자원이 많이 소요되고 DHTs의 빠른 개발주기에 맞지 않는다. 출판된 임상 및 경제성 연구에 대한 요건은 종종 서비스 개선을 주도하고 헬스케어 제공에 혁신적인 변화를 가져오며 더 광범위한 경제적 편익을 제공할 잠재력이 있는 혁신에 대한 장애물로 설명된다. 전통적인 HTA 방법과 DHT 개발의 빠른 특성 간에 인식된 충돌에 비추어, 일부에서는 DHTs의 HTA가 다른 중재에 대해 다른 수준과 유형의 근거를 사용해야 한다고 주장했다. 

DHTs를 평가하기 위한 프레임워크(frameworks)를 만들기 위해 많은 추진계획이 시도됐다. Moshi 외 동료의 모바일 의료 앱을 위한 평가 프레임워크 검토는 2011~2016년에 이러한 도구의 HTA를 안내하기 위해 발표된 45개의 프레임워크를 확인했다. 이러한 맥락에서 영국 국립보건서비스(National Health Service, NHS)는 영국 'National Institute for Health and Care Excellence (NICE)'에 효과성과 경제적 영향 고려사항을 모두 포함하는 DHTs에 대한 비례적 근거 표준 프레임워크(evidence standards framework, ESF)를 개발하도록 의뢰했다. ESF의 목적은 NHS England 헬스케어 위원(health and care commissioners)에게 '우수한 근거(good evidence)'가 무엇인지 이해할 수 있는 도구를 제공하는 것이다 – 어떠한 근거가 DHTs를 임상적으로 그리고 비용 효과적인 것으로 보여주는데 필요한지. 

또한, 개발자가 영국 헬스케어 시스템에서 DHT를 사용하기 위해 어떤 종류의 근거를 개발해야 하는지 이해하는데 도움이 될 수 있다. ESF는 영국 보건복지부(UK Department of Health and Social Care)가 출판한 데이터 기반 헬스케어 기술에 대한 행동 강령(Code of Conduct for Data-Driven Health and Care Technology)의 원칙 8(principle 8)을 뒷받침하기 위해 만들어졌다. 행동 강령은 영국 헬스케어 시스템에서 DHTs의 개발 및 구현을 안내하는 10가지 원칙을 기술한다. 

이는 NHS Digital의 디지털 평가 설문지(digital assessment questionnaire, DAQ)를 대체하기 위해 2021년 봄에 출시된 NHSX의 디지털 기술 평가 기준(Digital Technology Assessment Criteria, DTAC)을 비롯한 다른 추진계획을 보완한다. DTAC는 5가지 핵심 영역을 다룬다: 임상적 안전성(clinical safety), 데이터 보호(data protection), 기술 보증(technical assurance), 상호운용성(interoperability), 사용성(usability) 및 접근가능성(accessibility). 본 논문에서 ESF를 개발하는데 사용된 민첩한 정책 연구 접근방식을 설명하고, ESF가 어떻게 작동하는지 간략하게 설명하고, ESF가 빠르게 변화하는 디지털 헬스케어에서 최신 상태를 유지하도록 하기 위해 현재까지의 영향과 진행 중인 업무에 대해 설명한다.

NICE의 의료기술평가 프로그램(medical technologies evaluation programme, MTEP)은 DHTs와 유사하게 근거수준이 낮은 의료기기를 평가하기 위해 2009년에 설립됐으며 이러한 경험은 기능적 범주 설계에 도움이 됐다. NICE 및 NHSE IAPT 평가 프로그램은 치료자(therapist)에게 안내되는 심리치료를 제공한 DHTs를 평가했다. 

이 프로그램의 업무는 근거수준의 설정을 알리고 헬스케어 시스템 내에서 DHTs를 구현하기 위한 기타 요건(가령, NHSE 임상적 안전성 요건 및 NHS Trusts의 지역 거버넌스 등) 및 맥락을 이해하는데 도움이 됐다. 워크숍 토론에서 이해당사자가 디지털 도구에 대한 새로운 평가 접근방식(가령, A-B 시험과 같은 소프트웨어 개발 분야에 더 친숙한 방식) 이용에 대해 잘 알고 격려했지만, 근거 표준은 다음과 같아야 한다는 것이 대다수의 견해였다 : HTA에 대한 '전통적인' 접근방식에 기반을 두고, 가장 높은 위험도 도구에 대한 모범사례 표준으로 무작위 비교임상(randomized controlled trials)을 최상위에 포함하지만, 덜 엄격한 연구 설계를 최소 기준 및 하위 계층으로 허용하는 실용적 근거 계층구조(pragmatic evidence hierarchy)를 사용한다. 워

크숍과 자문 단계에서 DHTs가 평가를 위해 '실세계(real-world)' 근거를 활용할 수 있는 기회에 주의를 기울였다. 프레임워크는 실세계 데이터 이용 잠재성이 증가함에 따라, 새로운 연구설계의 가치를 계속 조사해야 한다는 점을 인정한다. 짧은 기간 내에 ESF의 급속한 발전에도 불구하고, 광범위한 문헌기반을 검토하고 100명 이상의 이해당사자 및 해당 조직과 협의해 헬스케어 시스템에 대한 실용적인 가이드를 생성할 수 있었다. 프로젝트 내에서 프레임워크를 완전히 시험하는데 제한된 시간이 있었으나 보충적 사례연구 업무를 통해 격려됐다. 그 일환으로 핵심 프로젝트 팀에 속하지 않은 연구원들이 기능 분류를 적용하고, 본 기준에서 권고하는 것과 일치하는 선택된 DHTs에 대한 근거를 설명할 수 있었다. 

마찬가지로 이전의 모든 업무를 완전히 체계적으로 통합하거나 주요 단계에서 프레임워크 개발을 일시 중지하고 각 단계에서 폭넓게 협의할 시간이 없었다. 개발에는 최종 자문 단계 이전에 자주 경미한 수정이 필요했다. ESF는 프레임워크에서 적응형 알고리즘(adaptive algorithms)을 통합하는 DHTs를 제외함으로써 어느 정도 제한되며 이는 분명히 추가 개발 업무의 영역이다. 여기에서 '적응형 알고리즘'은 시간이 지남에 따라 지속적으로 진화하는 것으로 정의하므로 그 효과성은 언제든지 고정되지 않는다. 이것은 ESF의 권한 내에 있는 고정 알고리즘(fixed algorithms) DHTs와 대조된다. 

고정 알고리즘은 주기적으로 업데이트할 수 있지만 지속적으로 변경되지 않는 알고리즘으로 정의한다. 고정 알고리즘 DHT를 의뢰하는 시점에서 위원(commissioner)과 개발자가 그러한 업데이트를 배포하기 위한 프로세스에 동의할 것이라고 생각한다. 적응형 AI를 이용하는 DHTs의 HTA에 대한 합의가 이뤄지면, ESF가 이를 포함하도록 확장될 것으로 예상된다. 'British Standards Institute (BSI)'와  'Association  for  the  Advancement  of  Medical Instrumentation (AAMI)’의 최근 업무에서는 의료기기의 AI에 대한 권고사항을 제시했다.

NHSX의 AI lab은 헬스케어 시스템 내에서 AI 기반 DHTs를 안전하고 윤리적으로 채택하는 문제를 해결하기 위해 만들어졌으며, 이러한 문제를 해결하기 위한 수많은 업무흐름(workstreams)을 갖고 있다. NHSX, NICE, CQC 및 MHRA는 헬스케어 시스템에서 AI 기반 DHTs에 대한 '결합된(joined-up)' 규제 및 승인 시스템을 개발하기 위해 공동으로 노력한다. 이 업무는 AI 기반 DHTs를 규제하고 평가하기 위해 현재의 파편화된 시스템을 영국 헬스케어 시스템을 위한 일관된 프로세스로 통합하는 유용한 수단을 제공할 것이다. 또 다른 한계는 주요 초점이 의료 환경에 있었지만 사회적 케어에서 DHTs의 광범위하고 증가하는 이용을 인식한다는 것이다. 

이 업무의 추가 (및 관련) 제한사항은 DHTs를 서비스 또는 경로의 일부가 아니라 특정 기능을 제공하는 독립형 도구(standalone tools)로 개념화한다는 것이다. Apple 및 Google과 같은 제공업체가 다양한 범위의 기기 및 소비자가 직면하는 서비스에 걸쳐 건강 기능을 통합함에 따라 DHTs가 임상경로 내에서 더 통합되거나 의료 소비자의 자체 디지털 생태계에 더 많이 내재됨에 따라, 이 영역의 향후 개발로 인해 DHTs를 평가를 위한 단일 독립체(single entities)로 분리하기가 더 어려워질 것이다. 

ESF는 영국 헬스케어 시스템에서 위임된 DHTs에 대한 근거를 평가하는데 사용하도록 설계됐으며, 앱 스토어와 같이 일반 사용자가 직접 사용할 수 있는 기술에는 관련성이 적다. NICE ESF는 2018년 12월에 처음 출판된 이후로 전 세계적인 관심을 불러일으켰고 평가자, DHT 개발자 및 학계로부터 긍정적인 피드백을 받았다. 앱 평가기관에서 긍정적인 피드백을 받았으며, 여러 국가의 정부 그룹에서 ESF에 관심을 보였다. 

이는 DHTs에 대한 평가가 많은 조직에 도전적인 것으로 입증됐으며, NICE ESF가 DHTs에 대한 혁신적인 HTA 접근방식을 제공하는데 있어 간극을 메우고 있음을 나타낸다. 2019년 NICE는 DHTs에 대한 NICE 지침을 생성하기 위한 시범사업을 실행했으며, 2020년에는 디지털 평가 프로그램(digital evaluation programme)이 이제 ESF의 근거 계층3에 있는 모든 DHT에 공개된다고 발표했다. 이 프로그램은 고위험 DHTs에 대한 공식적 평가 설정을 허용한다. 2019년에 ESF에 대한 피드백을 구하고 응답했으며 이에 대한 응답으로 ESF를 경미하게 수정했다. 시간 경과에 따라 디지털 헬스케어 분야에 대한 지속적인 감시의 필요성을 인정하고 향후 몇 년간 ESF가 추가로 반복될 것으로 예상한다.

시사점
- 비례성(proportionality)은 민첩한 접근방식에 대한 필요성에 실용적 솔루션을 제공하면서, 디지털 헬스케어 기술에 대한 NICE 근거 표준 프레임워크(evidence standards framework)는 빠르게 변화하는 분야에서 HTA에 대한 새로운 접근방식을 취할 수 있는 방법을 보여줌
- 근거 표준 프레임워크는 영국의 DHTs에 대한 지역 및 국가 구매 결정을 지원하고 DHTs 개발자가 근거기반 생성을 계획하는데 도움이 되도록 설계됨
- ESF는 역동적인 방식으로 개발되었으며, 기존 문헌 뿐만 아니라 헬스케어 위원 및 의료 혁신가와의 광범위하고 반복적인 협의를 통해 정보를 얻었고 공동디자인 접근 방식을 창출함

출처원

: Unsworth H, et al. Digital Health Volume 7: 1–20. DOI: 10.1177/20552076211018617

https://journals.sagepub.com/doi/pdf/10.1177/20552076211018617

* 본 컬럼은 의료기기를 비롯한 헬스케어 분야의 국내외 학회지에 발표된 논문 및 연구보고서 등을 살펴봄으로써 우리나라 의료기기 관련 보건의료정책 마련에 통찰력을 제공하기 위한 목적으로 매주 발표됨

 

저작권자 © 의료기기뉴스라인 무단전재 및 재배포 금지