이규언 서울대학교 의과대학 의료빅데이터센터장

수술실 대화내용 등 음성데이터도 좋은 자료
중환자실 환자 바이탈데이터 200만 시간 축적

빅데이터 이용, 환자 목소리로 신장병 진단
대장암 진단용 AI 세계 첫 개발, 시판 예정

기자명 김왕근 기자 (slbu@themedical.kr)

현미경으로 보는 영상, 수술 동영상,

마취 과정 중의 혈압과 심박 등 생체신호,

수술실에서 오가는 의사와 간호사 간의 대화…

이런 데이터들을 모두 저장하고 있다

1994년 서울 휘문고 학생 이규언은 서울대학교 의과대학을 지원했다. 당시는 의과대학과 공과대학의 커트라인이 크게 차이나지 않았고, 친구들은 공대로 많이 갔지만, 생명과학과 뇌과학에 관심이 있는 그는 의대를 선택했다.

전공은 내분비외과를 선택했다. 내분비외과에서는 갑상선 부갑상선 부신 등 호르몬 분비 내분비기관을 수술한다. 그는 2008년 이후, 로봇수술도 많이 했다. 로봇수술을 한다고 하면 환자가 “저는 로봇보다 의사선생님이 수술해 줬으면 좋겠어요”라고 말할 정도로 로봇 수술의 초창기였다. 2022년 2월 미국 존스홉킨스대학교 기계공학과 교수 연구팀이 돼지의 장을 봉합하는 데에 사람의 도움 없는 로봇 자율 수술을 했지만, 지금도 ‘로봇 수술’은 주로 의사가 로봇을 조종해서 하는 수술을 말한다. 

2015년부터는 의료계에 ‘융합’이 화두로 떠올랐고 이 교수는 의공학과 분야의 교수들로부터 “수술 동영상을 이용해 인공지능 연구를 하자”라는 말을 들었다. 2016년 알파고와 이세돌이 대국을 펼치기 1년 전이라 사람들은 이런 분야에 관심이 없었지만, 원래 컴퓨터에 관심이 있었던 이 교수는 연구를 시작했다. 서울대 의대 의료빅데이터센터는 2018년에 개설됐고, 2019년에 미국 연수를 마치고 돌아온 이 교수는 2020년에 센터장이 됐다.

이 교수가 말한 본인의 사적인 정보는 이 정도였다. 인터뷰란, 인터뷰이와 사적인 얘기를 하는 것이다. 그런데 그는 “센터장은 심부름꾼일 뿐입니다”라면서 겸손해 했고 추가 질문에 답하지 않았다. 그는 다만 서울대 의대 빅데이터센터가 무슨 일을 하는지 A4용지 넉장 분량의 자료를 가져다 주었는데, 일반인들이 알기 어려운 빅데이터 관련 ‘전문 언어’들로 가득했다. 이 자료만으로 기사를 쓴다면 이는 인터뷰가 아니라 ‘보고서’가 될 상황이었다.

대신에 그는 학생 자랑을 했다. “서울대학교 전산과를 나온 학생에게 ‘부갑상선 찾는 알고리즘’을 만들어보면 어떻겠느냐’라고 제안했더니 2~3주만에 뚝딱 만들어 오더라”라는 것이었다. 부갑상선은 갑상선 뒤쪽에 위치하고 있기 때문에 로봇 수술을 할 때 화면에서 부갑상선이 어디에 있는지를 알기는 전문가도 쉽지 않은데, 학생이 만든 알고리즘이 그걸 금방 알 수 있게 해준다는 것이었다. 그는 “서울대 공대를 나온 마취과 교수가 있다”라며 교육에서 의학과 공학의 융합을 강조했다.

그는 의료빅데이터센터의 가장 중요한 기능은 ‘교육’이라고 했다. “센터의 인재양성부는 지난해 7월부터 ‘서울대학교 의료 인공지능 융합인재 양성 사업’을 주도하고 있다. 보건복지부와 교육부가 지원하는 이 사업은 의과대학, 공과대학, 병원을 즉 의학과 정보통신기술(ICT) 및 인공지능(AI), 임상 현장을 연계하는 융합 교육 사업이다. 구체적으로는 서울대학교 공과대학, 데이터사이언스대학원, 서울대학교병원, 분당서울대학교병원, 카카오, 네이버 등 플랫폼기업 그리고 루닛과 뷰노 등 의료 인공지능 기업들이 컨소시엄을 구성했으며, 1차년도에 의과대학 학부생 10명과 공과대학·데이터사이언스대학원 소속 학부생 및 대학원생 20명 등 총 30명을 교육하고 있다. 앞으로도 매년 20명 이상의 학생을 신규 모집할 계획이다.”

이 교수는 최근의 국제대회 수상 소식도 전했다. ‘싱가포르 의료 인공지능 데이터톤(SHADE 22)’의 국제 팀 부문에서 이형철 교수 연구팀이 ‘비침습적 심장마비 예측(Non-Invasive Prediction of Cardiac Output)’과 ‘마취 관리(Anaesthetic Management)’로 1, 2위 상을 휩쓸었다. 공현중(서울대학교병원 융합의학과) 교수 연구팀의 ‘외과 수술에서의 유령 데이터(Phantom Data into Real Surgical Scenes)’도 공동 2위에 올랐다. 특히 ‘마취 관리’는 의과대학 학부생과 바이오엔지니어링전공 대학원생이 협업해 성과를 낸 융합연구 사례다. ‘SHADE 22’는 싱가포르국립대학교(NUS), 메사추세츠공과대학(MIT), 서울대학교 의과대학, 의료 인공지능 융합인재 양성 사업단 등이 공동 주관했다.

서울대학교 의과대학 의료 빅데이터센터에서는 여러 의료 인공지능(AI)를 만들고 있다. 이 그림은 가슴 x선 사진을 입력 값으로 넣으면 코로나19 감염 여부를 판단하도록 하는 딥러닝 개발 모델이다. [그래픽=서울대 의대 의료빅데이터센터 제공]
서울대학교 의과대학 의료 빅데이터센터에서는 여러 의료 인공지능(AI)를 만들고 있다. 이 그림은 가슴 x선 사진을 입력 값으로 넣으면 코로나19 감염 여부를 판단하도록 하는 딥러닝 개발 모델이다. [그래픽=서울대 의대 의료빅데이터센터 제공]

교육 이외의 사업에는 어떤 것이 있을까? 센터에서 가장 중요하게 여기는 것 중 하나가 ‘비정형빅데이터 연구’다. “현미경으로 보는 영상, 수술 동영상, 마취 과정 중의 혈압과 심박 등 생체신호, 의사와 환자 간 혹은 의사와 의사 간의 대화, 수술할 때 수술실에서 오가는 의사와 간호사 간의 대화… 이런 데이터들을 우리는 모두 저장하고 있다.” 이 센터장은 “기존의 데이터들은 엑셀 파일의 칸 안에 정렬돼 있지만, 의료 빅데이터가 사용할 수 있는 데이터는 그보다 더 광범위하다”라고 말했다.

“빅데이터 센터가 ‘병원 안의 모든 것’을 기록하는 것인가”라는 질문에 이 센터장은 이렇게 덧붙였다. “예컨대 코로나 때문에 열이 나는 것 같은데, 그럴 때 검사를 받아야 할지 말아야 할지 등에 대해서는 네이버와 카카오에서 서비스를 했었다. 챗봇이 환자의 증상을 물어보고 답을 해 준 것이다. 아이가 열이 날 때 어떻게 대처해야 하는지에 대해서도 ‘열나요’라는 앱이 있다. 이런 건 옛날에 연구 대상이 아니었지만, 인공지능이 있는 현재는 이런 소소한 정보들도 다 쓸모가 있게 될 가능성이 있다.” 그는 “옛날에 몸의 뼈를 찍는 엑스선이 인체에 어떻게 나쁜지를 몰랐던 것처럼, 지금 우리가 알지 못하는 게 있을 수 있다. 그러니 죄다 기록하는 것이다”라고 덧붙였다.

그렇다면 구체적으로 서울대의대빅데이터센터는 무슨 일을 할까? 이 센터장은 다음의 연구 및 사업을 제시했다.

 

◇생체신호실험실(바이탈 랩)=서울대학교 의과대학 마취통증의학교실 정철우 교수와 이형철 교수가 이끄는 이 실험실은 자체 개발한 생체신호 데이터 수집 프로그램 ‘바이탈 레코더(Vital Recorder)’를 이용해 서울대학교병원 수술실과 중환자실에서 파형(波形)데이터를 비롯한 고품위 생체신호 데이터를 수집한다. 현재까지 15만 개의 수술 데이터, 200만 시간의 중환자실 데이터 등 5테라바이트(TB)의 데이터를 쌓았다.

또 수술실 데이터 중 약 1년간의 코호트(집단) 데이터인 6388례의 데이터를 정제해서 데이터셋을 구축했고, 세계 최대 생체신호 데이터베이스인 피지오넷(PhysioNet) 페이지를 통해 이를 공개하고 있다. 이는 한국보건복지인력개발원에서 인공지능 전문가 양성과정의 교육용으로도 활용되고 있다.

중환자실 데이터는 인공지능 임상의사 결정 지원 시스템(CDSS) 개발에도 이용된다. 이 시스템은 중환자에게 어느 시점에 어떤 약을 투여할지를 결정하는 시스템이다.

 

◇전신마취 수술 10만명 ‘말뭉치’구축=부센터장인 의공학교실 윤형진 교수는 의학 도메인 전문 말뭉치(corpus) 구축을 진행하고 있다. 말뭉치란, 언어를 연구하는 각 분야에서 필요로 하는 연구 재료로서 언어의 본질적인 모습을 총체적으로 드러내 보여줄 수 있는 자료의 집합을 뜻한다. 이는 정제된 환경에서 언어를 연구해야 한다는 촘스키 언어학과 정 반대방향에 있는 것이다. 윤 교수는 2004년부터 2020년까지 1시간 이상 전신마취 수술을 한 10만명의 입원기록, 마취기록, 수술기록, 퇴원 기록의 ‘말뭉치’를 모았다. 이 말뭉치는 나중에 인공지능이 식별하여 사용할 수 있는 데이터가 될 수 있다.

 

◇비정형 오디오 DB랩=관악캠퍼스의 불어교육과 김선희 교수, 언어학과 정민화 교수가 진행하는 ‘비정형 오디오 DB 랩’은 소리를 통해 치료하는 과정에 필수적인 소리 데이터를 축적하는 연구다.

이는 우선 인공와우 이식 아동의 발음 문제를 해결하고 재활을 돕는 데 사용된다. 인공와우란 손상된 내이(內耳)를 대체하여 전기신호를 전달하는 청력 회복 기술이다. 수술 후 인공와우 이식기를 통해 들어오는 소리는 일반인들이 듣는 소리와는 다르게 인식되므로 대화를 하기 위해서는 언어 치료가 필요하다. 그러려면 자동 발음 평가 및 피드백 제공 프로그램이 필요하고, 이를 위해서 오디오 빅데이터가 있어야 하는 것이다.

이 데이터는 또 환자의 음성으로 질병을 진단하는 데도 이용된다. 만성 콩팥병 환자의 경우 질병으로 인해 음성의 특성이 변화하는데, 인공지능에 오디오 빅데이터를 학습시킴으로써 환자의 음성만으로 질병을 진단할 수 있는 것이다. 인공지능은 이 자료들을 이용해 우울증 및 학교 적응 장애를 진단하는 심리 상태 예측 모형을 생성할 수도 있다.

 

◇중심정맥관 삽입 AR솔루션=서울대학교병원 소아외과 김현영 교수가 이끄는 의료 메타버스 랩에서는 ‘의료현장에서 활용 가능한 중심정맥관 삽입 수술용 AR 솔루션 및 교육용 VR 콘텐츠 개발’ 과제를 수행하고 있다. AR 기술을 이용한 중심정맥관 삽입 기기 개발과 VR 기술을 이용한 수술 술기 교육 모듈 개발을 이미 마쳤고, 상용화 및 사업화를 추진 중이다. 중심정맥관은 몸통에서 연결되어 심장으로 들어가는 쇄골하정맥, 경정맥, 대퇴정맥 등 큰 정맥에 삽입되는 관이다. 한 번 정맥관이 잘 삽입되면, 이곳을 통해 언제든 약을 주입할 수 있다.

 

◇대장 용종 발견 및 암 진단 AI=의료빅데이터센터의 대표적인 사업화 사례로 대장 용종 발견과 진단용 인공지능 개발을 들 수 있다. 지금까지 용종을 발견하는 인공지능(AI)은 있었지만 암 진단까지 하는 AI는 아직 없다. 센터는 모 기업과 연계하여 이 인공지능 사업화에 박차를 가하고 있는데, 이는 후지필름, 메드트로닉스, 올림푸스 등 내시경 분야에서 앞서가는 해외 기업들도 이루지 못한 세계 최초의 성과가 될 것이다. 이 사업은 이미 식약처 인허가를 획득했고, 상용 고도화 및 임상 테스트를 거쳐 곧 시판될 예정이다.

이 센터장은 “고품질의 비정형 의료데이터 축적과 이를 활용할 전문인력 양성이 서울대의대의료빅데이터센터의 임무”라고 강조했다. 그는 또 “산학연병 융합 연구를 창의적으로 기획하고, 의료 빅데이터의 숨은 가치를 발굴해 사업화하도록 노력하겠다”라며 “우리는 임상의, 연구자, 기업인 등 디지털 헬스 분야의 다양한 플레이어들과 데이터를 잇는 가교가 되겠다”라고 덧붙였다.