[AI랑 산다]
AI 모델 구축보다
양질의 데이터 축적·관리 중요

ⓒPixabay
ⓒPixabay

어린이날과 어버이날이 연달아 있던 5월 첫 주 연휴에 격리 생활을 했다. 지역 소도시에 거주 중인 어머니가 코로나19에 뒤늦게 감염돼서다. 아버지는 타지에서 근무 중이어서 휴가를 쓰고 갈 수 있는 사람이 나뿐이었다. 어머니의 지병 때문에 함께 머물며 지켜볼 사람이 필요했다. 어머니는 무척 심하게 앓았고, 휴일인 어린이날 응급실에 가야 했다. 그 도시에서 가장 큰 병원에 아침 7시30분쯤 도착했고, 병원 측은 “응급실에 확진자를 받을 수 있는 격리 시설이 없다”고 말했다.

주차장에 차를 대고 앉아 다른 병원을 찾으려는데, 순간 막막해졌다. 당황한 나머지, 1339라는, 지난 3년간 보고 들었던 그 비상 연락번호가 떠오르지 않던 것이다. 포털 사이트에 “코로나”, “코로나 전담병원”, “코로나 전담 번호”, “코로나 전화번호”, “코로나19 비상 전화번호”를 재차 입력했다. ‘코로나’를 입력하니 코로나라는 이름의 업체가 검색됐고, 전담병원은 관련 뉴스만 나왔으며, 비상 전화번호는 몇 개의 블로그를 건너가고 나서야 검색됐다. 애써 찾은 1339에 전화하니, 주변 병원 검색 시스템이 없다며 119에 전화해야 한다고 했다. 119에서 전화 한 번을 거쳐서야 30km 떨어진 병원 정보를 받을 수 있었다. 30분을 산 넘고 강 건너서야 비로소 격리 부스가 바깥에 덩그러니 놓인 응급실에 도착할 수 있었다.

정보 검색을 일상에 줄줄이 달고 사는 나조차도, 당황하니 그 흔한 키워드들을 제대로 떠올리지 못했다. 기어이 생각해 낸 검색어로는 영 엉뚱한 소스에 닿았고, 원하는 정보도 찾을 수 없었다.

가만 생각해 보니 우리에게는 ‘챗GPT’(ChatGPT) 같이 문맥을 이해해서 원하는 정보를 기똥차게 찾아줄 도구가 있었다. 챗GPT와 언어 모델을 쓰면서 정보 출처도 제공하는 ‘빙 챗’(Bing Chat)을 활용해 검색해 봤다. 그렇게 나온 링크는 응급의료포털 E-Gen이라는 곳으로 연결이 됐다. 그러나 가까운 응급실 병원, 그러니까 우리가 오전에 들렀다가 들어가지 못한 곳만을 소개할 뿐, 실제 격리 시설이 있는 응급실을 알려주지는 못했다. 그때 몸으로 깨달았다. 결국엔 ‘데이터’가 잘 돼 있어야 한다는 가장 기본적인 상식을 말이다.

데이터는 그 자체만으로는 빛을 내지 못한다. 데이터가 진짜 가치를 지니려면 데이터를 소비할 사용자의 필요에 맞게 정확하게 구성돼 있어야 한다. 예를 들어, 응급 포털이라면 당연히 코로나19 상황에서 가장 필요로 할법한 데이터가 마련돼 있어야 한다. ‘응급실’과 ‘격리실’이 레이블 돼, 휴일에도 급히 갈 수 있는 ‘응급실+격리실’ 데이터를 뽑아낼 수 있는 수식이 응급 포털 사이트 내에 있어야 하는 것이다.

이런 감각은 공공 영역뿐 아니라 여러 서비스와 투자 분야에서도 매우 중요하다. 가령 사업을 성공으로 이끌기 위한 지표를 설계할 때, 어떤 숫자가 정말 우리 사업에 의미가 있는지, 데이터들을 잘 조합해 의미 있는 관찰 자료로 만드는 것은 경영진이 해야 할 핵심적인 일 중 하나다.

물론 각종 미가공 데이터(raw data)들로부터 인사이트를 찾는 기술적인 시도도 이어지고 있다. 각 폴더와 드라이브에 뿔뿔이 흩어진 자료들을 연동한 뒤, 문장 한 줄짜리 요청에 맞게 인사이트를 뽑아주는 식이다. 마이크로소프트와 구글 같은 빅테크 기업들은, 자사의 클라우드에 들어 있는 문서들을 연계해 지식을 가공하는 일에 힘쓰고 있다. 많은 AI 스타트업들도 보안이 걸린 사내 정보들을 연결해 의미 있는 메시지로 가공해 내는 지식관리시스템(knowledge management system) 분야에 도전하고 있다.

하지만 이 또한 올바르고 정확한 정보들만이, 되도록 빈틈없이 켜켜이 입력돼 있어야 충분히 중요한 인사이트를 줄 수 있다. 응급실 데이터만 있고 격리 시설 데이터는 입력해 두지 않았을 경우, 격리 시설이 있는 응급실에 대한 정보를 제공할 수 없듯 말이다.

알고리즘이 데이터를 엮어 지식을 만들어 주더라도, 결국 어떤 데이터를 모아 둘 것인지에 대한 상상력과 결심은 우리의 몫이다. 그 몫을 잘 해내기 위해선, 우리가 사는 세상에 대한 관찰과 공감과 호기심을 충분히 품어야 한다는 생각이 더욱 강해지는 요즈음이다. 우리는 궁극적으로 무엇을 이루기 위해 데이터를 모아야 할까. 그 마음들이 모이면, 예상한 것보다 훨씬 더 많은 문제를 풀 수 있을지도 모른다.

유재연 옐로우독 AI펠로우
유재연 옐로우독 AI펠로우

소셜임팩트 벤처캐피털 옐로우독에서 AI펠로우로 일하고 있다. 인간-컴퓨터 상호작용 분야에서 박사과정을 수료했고, 주로 인공지능 기술과 인간이 함께 협력해가는 모델에 대해 연구하고 있다. <AI랑 산다>는 장밋빛으로 가득한 AI 세상에서, 잠시 ‘돌려보기’ 버튼을 눌러보는 코너다. AI 기술의 잘못된 설계를 꼬집기 보다는, 어떻게 하면 AI 기술과, 그 기술을 가진 이들과, 그리고 그 기술을 가지지 못한 자들이 함께 잘 살아갈 수 있을지 짚어 본다.

① 인공지능이 나에게 거리두기를 한다면
http://www.womennews.co.kr/news/articleView.html?idxno=220379

② 기계가 똑똑해질수록 인간은 바빠야 한다
http://www.womennews.co.kr/news/articleView.html?idxno=221310

③ 인간이 AI보다 한 수 앞서야 하는 이유
http://www.womennews.co.kr/news/articleView.html?idxno=222353

④ AI에게 추앙받는 사람
http://www.womennews.co.kr/news/articleView.html?idxno=223684

⑤ 메타버스서 공포증 극복·명품 쇼핑...‘비바 테크놀로지 2022’ 참관기
http://www.womennews.co.kr/news/articleView.html?idxno=224824

⑥ 월경·난자 냉동... 79조 펨테크 시장 더 커진다
http://www.womennews.co.kr/news/articleView.html?idxno=225977

⑦ 사람을 살리는 AI 솔루션이 필요하다
http://www.womennews.co.kr/news/articleView.html?idxno=227124

⑧ 이상행동 탐지·채팅앱 신고...AI로 스토킹 막으려면
http://www.womennews.co.kr/news/articleView.html?idxno=228068

⑨ 일하다 죽지 않게 만들 기술이 필요하다
http://www.womennews.co.kr/news/articleView.html?idxno=228998
⑩ ‘AI 예술가’는 이미 현실, 이제 창작자들이 연대해야
http://www.womennews.co.kr/news/articleView.html?idxno=229928
⑪ 요즘 대세 ‘챗GPT’ 이후의 AI는 어떻게 진화할까
http://www.womennews.co.kr/news/articleView.html?idxno=230850

⑫ ‘박사학위자의 결혼 조건은?’ 챗GPT에 물어보니
http://www.womennews.co.kr/news/articleView.html?idxno=231690

⑬ 편견·차별 없는 AI 만들려면? 챗GPT가 던진 질문
http://www.womennews.co.kr/news/articleView.html?idxno=233074

⑭ 막 오른 빅테크 AI 대전...사람은 어떻게 일해야 할까
http://www.womennews.co.kr/news/articleView.html?idxno=234139

⑮ AI 시대, 밀려나는 사람들을 생각한다
http://www.womennews.co.kr/news/articleView.html?idxno=235242

⑯ “코로나19 응급실 어디야?” 빙AI·챗GPT도 답 못했다
h
ttp://www.womennews.co.kr/news/articleView.html?idxno=236388

저작권자 © 여성신문 무단전재 및 재배포 금지