특별기고

정신 질환에 도전하는
인공지능 기반 헬스케어 연구들

한상기 대표(테크프론티어)

현재 많은 헬스케어 데이터셋은 영상 의학을 중심으로 만들어지고 있다. 국내에서도 조금씩 진단 분야의 범위를 넓혀 라이프로그의 활용이나 영상이 아닌 데이터셋을 통해 연구 범위를 넓히고자 하는 움직임이 있지만, 아직 단순 수치로 확인할 수 없는 아날로그적 질환에 대한 연구를 살펴보는 것도 의미 있는 일이라고 생각한다.

특히 정신 건강 문제의 진단을 인공지능으로 접근하고자 다양한 연구가 진행되고 있다. 세계보건기구(WHO)에 따르면 전 세계에서 우울증으로 고통받는 사람이 3억2,200만 명에 달한다고 한다. 우울증에 대한 접근은 음성, 뇌파, fMRI(Functional Magnetic Resonance Imaging, 기능적 자기공명영상) 영상, 심지어 인스타그램에서 사용하는 필터 유형을 통한 진단 방식도 있다. 랜드(RAND)연구소가 조사한 결과에 따르면 팬데믹 시대에 원격 헬스가 크게 증가하면서 더 많은 사람이 정신 건강 서비스를 찾고 있다.1)

텍스트와 음성을 통한 연구

2018년 인터스피치(Interspeech) 콘퍼런스에서 MIT 연구진은 원천 텍스트와 오디오 데이터를 통해 우울증을 시사하는 패턴을 발견할 수 있다는 연구를 발표했다.2) 이 발표에 따르면 질의응답에 대한 추가 정보 필요 없이 개인이 우울한지를 정확히 예측할 수 있다고 한다. 연구자들은 이 패턴을 활용하면 자연스러운 대화 중 우울증 징조를 탐지하는 도구를 개발할 수 있다고 보았다.

과거 모델에서 특정한 질문 모음을 가지고 사람이 어떻게 반응하는지 찾고자 했다면, 이 모델의 가장 큰 특징은 질문에 어떤 제약도 주지 않는 ‘자유로운 문맥을 사용’한다는 점이다. 이들이 사용한 기법은 시퀀스 모델링3) 이라는 방식으로, 주로 음성 처리에서 사용하는 방식인데 우울증이 있는 사람과 아닌 사람으로부터 질의응답에 대한 텍스트와 오디오 데이터를 받아 시퀀스를 모델링한다. 시퀀스가 축적되면 음성 패턴을 추출한다. 예를 들어 ‘sad’, ‘low’, ‘down’ 같은 단어를 오디오 신호와 페어링하고, 우울한 사람은 천천히 말하거나 단어 사이에 더 긴 멈춤(pause)이 있음을 인식해 활용한다. 동일한 스타일이 새로운 대상에서도 발견되면 우울증 가능성이 높은 것으로 판단한다.

이들이 사용한 데이터셋은 ‘Distress Analysis Interview Corpus’이며 142개의 상호 작용을 이용해 학습하고 검사했다. 이 데이터셋에는 오디오, 텍스트, 비디오 인터뷰가 있으며 인간이 조절하는 가상 에이전트가 있다. 각 주제는 개인 건강 질문 리스트(Personal Heath Questionnaire)를 사용해 0에서 27까지의 점수를 매긴다. 10~14나 15~19는 우울한 것으로 판단하며, 데이터셋의 전체 대상 중에서 20%가 우울함으로 레이블되어 있다.

정확도와 재현율로 측정한 성능은 각각 71%와 83%를 얻었고, 두 지표를 통합한 평균 점수는 77%의 정확도로 평가했다. 연구 결과에 따르면 텍스트는 시퀀스 모델링을 위한 충분한 데이터가 축적되어 보다 빠르고 정확한 결과를 얻을 수 있었고, 오디오는 상대적으로 더 많은 시퀀스 모델링 데이터가 필요했다.

인스타그램의 사용자 특성 분석

2017년 하버드대의 앤드루 리스(Andrew Reece)와 벌링턴에 있는 버몬트대의 크리스 댄포스(Chris Danforth)는 인스타그램에 올리는 사진의 색깔과 개인의 정신 건강에 매우 중요한 상관 관계가 있다는 사실로 논문을 발표했다.4)

이들은 166명에게 얻은 인스타그램 데이터와 이들이 올린 4만3,950개의 사진에서 컬러 분석, 메타데이터 구성 요소, 얼굴 인식 알고리듬을 활용해 우울증 진단을 실행한 결과, 일반적으로 정신과 의사의 정신 질환 진단율을 능가하는 성능을 보였다고 발표했다.5)

건강한 사람들은 최근의 100장의 사진을, 우울증 환자의 사진은 진단받기 전 100장의 사진을 선택해 터크의 작업자들이 흥미로움, 좋아할 만함, 행복, 슬픔에 따라 0점에서 5점을 줬다. 동시에 연구자들은 평균 색조, 채도, 대조 등과 같은 객관적 지표를 기준으로 평가했으며, 사진에 나타난 얼굴의 개수를 계산했는데 이는 사회 활동 수준에 대한 대리 지표로 봤다. 또한 각 이미지에 대한 ‘좋아요’와 코멘트 개수도 평가했다.

그림 1. 오른쪽 사진의 색조가 왼쪽과 비교하여 파란색 톤을 보이며 있고 채도는 더 낮고 밝기는 어둡다. 우울증에 걸린 사람이 올린 인스타그램 사진은 정신적으로 건강한 개인이 올린 사진과 비교해 채도, 명도, 밝기 등이 오른쪽 이미지와 유사했다. 그림 1. 오른쪽 사진의 색조가 왼쪽과 비교하여 파란색 톤을 보이며 있고 채도는 더 낮고 밝기는 어둡다. 우울증에 걸린 사람이 올린 인스타그램 사진은 정신적으로 건강한 개인이 올린 사진과 비교해 채도, 명도, 밝기 등이 오른쪽 이미지와 유사했다.
[출처: Reece A. and Danforth, C., “Instagram photos reveal predictive markers of depression”, 2017]

연구자들은 우울한 사람의 경우 더 푸르고, 회색, 어두운 이미지를 사용했고 건강한 사람에 비해 더 적은 ‘좋아요’를 받았다는 사실을 찾아냈다. 우울증 진단을 받은 사용자는 얼굴과 관련한 사진을 포스팅하는 경우가 더 많았는데, 이는 자기 집중적인 언어를 많이 사용하는 정신 질환 환자의 특성이 이미지에까지 확대된 것으로 보인다.

결론적으로 100명에 대해 알고리듬은 70% 정도의 정확도로 우울증이 있는 사람을 찾아냈는데, 이는 일반 의사보다 더 높은 수준의 정확도다.

알파벳 X의 프로젝트 앰버(Amber)

과거 구글 X라 부르던 알파벳의 X에서 실행한 정신 질환에 관한 연구는 3년에 걸쳐 이뤄졌음에도 실패로 귀결했다. 이들은 우울증이나 불안감에 대한 바이오마커6)를 찾기 위해 머신러닝 기법을 이용했다. ‘프로젝트 앰버’라고 부른 이 연구는 혈당을 측정하듯이 뇌파를 분석해 우울증을 객관적으로 측정할 수 있을까 하는 물음에서 2018년 시작해 3년간 지속되었다.

사실 뇌과학 연구 분야의 주안점은 뇌의 전기적 활동에서 특정한 패턴이 우울증 증상과 연관이 있다는 점이다. 우울증이 있는 사람은 뇌의 보상 시스템에서 지속적으로 낮은 전기적 활동을 보였고, 이를 EEG7)를 통해 확인할 수 있었기 때문이다.

프로젝트 팀은 실험실이 아닌 1차 진료 의사나 카운슬링 센터, 정신과 의사가 현실에서 평가 도구로 사용할 수 있는 수준의 데이터를 얻고자 했다. 그래서 EEG 데이터를 쉽게 수집하고 해석하기 위해 저가의 포터블 EEG 헤드셋 기기를 만들었다.

그림 2. 프로젝트 앰버의 EEG 기기 프로토타입과 최종 버전. [출처: 알파벳 X] 그림 2. 프로젝트 앰버의 EEG 기기 프로토타입과 최종 버전. [출처: 알파벳 X]
그림 2. 프로젝트 앰버의 EEG 기기 프로토타입과 최종 버전. [출처: 알파벳 X]

이들은 딥마인드 인공지능 전문가와 협력했으며 뇌파 신호의 노이즈를 적절한 규모로 줄이고, 누군가 우울한지 아닌지를 판정하는 데 가장 연관성이 높은 신호 측면이 무엇인지를 알고자 했다.

그러나 2020년 11월 발표한 논문에 따르면 이 방식은 임상적 유용성을 완전히 얻지 못했다. 그 이유는 첫째로 EEG 데이터를 적정 규모로 받았을 때 그에 포함된 내재적인 노이즈를 다룰 자동화한 방식을 얻지 못했고, 둘째로는 어떤 신호 측면이 임상 장애의 표지가 되는 것인지에 대한 지식이 부족했다는 것이다.

이들의 연구는 비지도 표현 학습을 사용했으며 그 결과는 ICLR 2021 콘퍼런스8) 에서 발표했다. 노이즈에 대한 효과적 처리 방식이나 우울증 증세, 일반적인 불안 예측의 개념은 증명했으나 가능성만 보였기 때문에 이를 사용자 연구를 통해 더 탐구하고자 한다. 약 250명의 잠재적 사용자를 인터뷰했고, 실제로 정신 건강 문제를 겪었던 사람이나 이에 관련한 모든 직업의 사람들과 얘기하고, 이들의 일상에서 또는 전문가 입장에서 어떤 객관적 측정이 가능할 것인지를 연구했다. 연구 결과, 프로젝트 앰버 팀이 얻은 인사이트는 다음과 같다.

  • - 정신 건강에 대한 측정은 아직 해결하지 못한 문제다.
  • - 주관적인 데이터와 객관적 데이터를 결합하는 것은 가치가 있다.
  • - 새로운 측정 기술을 사용할 수 있는 여러 가지 케이스가 있다.

뇌파를 통한 우울증 진단은 학계에서 큰 환영을 받지 못했는데, 전문가들은 전문적인 상담이나 인터뷰로 질환 진단에 접근할 수 있기 때문에 이에 무관하다고 봤으며 실제 증상 경험이 있는 사람 중 일부는 기계에 의해 우울증이라고 낙인 찍히는 것을 싫어했다. 그러나 이를 오랜 기간 지속적으로 모니터링하는 방안은 많은 관심을 받았는데, 이를 통해 시간의 경과에 따른 정신 건상 상태의 변화를 확인할 수 있을 것이라는 긍정적 해석에서 기인한다.

EEG에 관한 또 다른 연구로, IBM 팀이 EEG 해석에 머신 러닝 알고리듬을 적용해 발작을 분류하는 데 98.4%의 정확도를 얻었다. 2020년 2월 ‘네이처 바이오테크놀로지’에 발표한 논문은 EEG와 머신러닝을 이용해 어떤 환자가 항우울제로부터 효과를 얻을 수 있는가를 예측했다.9)

프로젝트 앰버 팀은 모든 하드웨어와 소프트웨어를 깃허브에 공개했으며10), 이에 대한 특허에 대해서도 자유롭게 사용하도록 했다. 나아가 50개의 프로토타입 기기는 휴먼 브레인 다양성 프로젝트의 한 부분으로 사용하기 위해 사피언스 랩에 기증했다.

포브스지(誌)는 인공지능이 앞으로 정신 건강 관리를 혁명적으로 변화시킬 것이라고 하면서 다섯 가지 방법을 제시했다.11)

  • 1. 정신 의료와 물리적 의료의 통합 – 예를 들어 자해하는 사람이 미래에 자살을 기도할 가능성을 예측하는 연구가 있다.12)
  • 2. 편향과 인간 오류를 감소 – 가상의 인공지능 에이전트를 활용
  • 3. 심각한 문제에 대한 조기 경보 – 사용하는 언어 분석
  • 4. 언제, 어디서나 지원이 가능 – 챗봇과 앱을 사용
  • 5. 정신 건강 이슈에 낙인 찍는 것에서 벗어나도록 지원 – 주관적이지 않고 증거 기반의 데이터와 진단을 통해 접근

앞으로 보다 다양한 데이터 수집과 방법론을 개척하면 정신 건강 관리 문제를 보다 객관적인 지표와 확인 과정을 통해 해결할 수 있으며 인공지능이 이를 위한 매우 유용한 도구로 자리매김할 수 있을 것이다.

Reference
  • 1) Fischer, S.H., Uscher-Pines, L., Roth, E., and Breslau, J., “The Transition to Telehealth during the First Months of the COVID-19 Pandemic: Evidence from a National Sample of Patients,” Journal of General Internal Medicine 36, pp. 849-851, Jan 06 2021
  • 2) MIT News, “Model can more naturally detect depression in conversations,” Aug 29, 2018
  • 3) 시퀀스 모델링(Sequence Modeling)이란 연속적인 입력으로부터 연속적인 출력을 생성하는 모델링이다(ex. 챗봇 등).
  • 4) Reece A. and Danforth, C., “Instagram photos reveal predictive markers of depression,” EPJ Data Science 6, No. 15, 2017
  • 5) 처음에는 아마존의 메커니컬 터크(Mechanical Turk)에서 일하는 500여 명을 모집한 후 인스타그램 공유를 허락한 166명을 선정했는데, 이 중 70명 정도가 임상적으로 우울증 진단을 받은 사람이다.
  • 6) 바이오마커(bio-marker)란 생체지표로 몸속 세포나 혈관, 단백질, DNA 등을 이용해 몸 안의 변화를 알아낼수 있는 지표다.
  • 7) EEG(electroencephalogram)란 뇌파도, 뇌파검사(법)으로 뇌 내의 전위 변화를 기록한 파형이다.
  • 8) ICLR(International Conference on Learning Representations, 표현 학습 국제 학회) 2021 콘퍼런스는 5월 4일에 개최되었다.
  • 9) Wu, W., et. al., “An electroencephalographic signature predicts antidepressant response in major depression,” nature Biotechnology 38, pp. 439-447, Feb 10, 2020
  • 10) https://github.com/google/x-amber
  • 11) Forbes, “Five Ways AI Can Help Revolutionize Mental Healthcare,” Aug 19, 2020
  • 12) Walsh, C., Ribeiro, J., and Franklin J.C., “Predicting Risk of Suicide Attempts Over Time Through Machine

지난 웹진 보기

이전호 더보기