[과학 혁신은 포용으로부터] ③

달리(DALL·E)로 제작한 이미지. ⓒ한국과학기술젠더혁신센터 제공
달리(DALL·E)로 제작한 이미지. ⓒ한국과학기술젠더혁신센터 제공

근대 과학의 사상적 기초를 제시한 것으로 평가되는 영국 경험주의 철학자 프랜시스 베이컨은 과학 방법론으로 귀납법을 강조한 것으로 잘 알려져 있다. 귀납법의 핵심은 많은 관찰 사례를 수집하고 이를 바탕으로 일반화나 유비 추론을 통해 보편 이론을 도출하는 것이다. 비록 현대 과학자들이 귀납법에만 의존하는 것은 아니며 가설연역법 등 다양한 연구 방법론을 활용하는 것이 사실이지만, 구체적인 사례의 묶음에서 일반적인 ‘패턴’을 찾는 방법론은 18세기 통계학의 도입을 통해 더욱 세련되게 발전했고 현재 데이터 과학과 인공지능 연구에서도 핵심적인 역할을 담당하고 있다.

종종 간과되는 점은 베이컨이 과학에서 귀납의 역할을 설명할 때 단순히 사례의 개수가 아니라 ‘다양성’을 강조했다는 사실이다. 그 이유는 쉽게 짐작할 수 있다. 특정한 조건에서 수집된 수십만 개의 데이터보다 다양한 조건에서 수집된 수천 개의 데이터가 관련된 자연현상의 본질을 더 잘 보여줄 수 있다. 20세기 초반까지도 생물학 실험의 재현이 쉽지 않았는데 그 이유는 지금처럼 인공적으로 실험실의 공기 조건을 표준화할 수 없어서 각 실험실의 습도, 온도 등이 모두 달랐기 때문이다. 미국 내에서도 습도가 높았던 남부 지역의 실험실에서 이루어졌던 곰팡이 연구가 건조한 북서부 지역에서 재현이 되지 않았던 경우가 허다했다. 결국 과학적 데이터에서 귀납적으로 올바른 결론을 끌어내기 위해서는 탐구하는 현상에 대해 다양한 조건 하에 수집된 데이터가 필수적이다. 과학지식의 타당성과 객관성 확보를 위해 데이터의 다양성은 기본 중의 기본인 것이다.

여기까지는 쉽게 납득할 수 있지만 실제로 데이터의 다양성을 어떻게 확보할 것인지는 쉽지 않은 문제다. 우선 당연한 이야기지만 다양한 조건 하에 데이터를 수집하는 것은 제안된 조건에서 데이터를 수집하는 것보다 비용도 많이 들고 연구 수행도 더 어렵다. 연구 결과물 압박에 시달리는 연구자라면 제한된 조건에서 실험하고 이 결과로부터 귀납적으로 얻어지는 결론을 무리하게 확장하려는 유혹에 빠지기 쉬운 이유가 여기에 있다. fMRI 연구처럼 많은 수의 실험 참여자를 대상으로 데이터를 얻기 어려운 상황에서 수십 명 정도에게 데이터를 얻은 후에 이로부터 전 인류에 적용되는 과감한(?) 주장, 예를 들어 남성과 여성은 본질적으로 이러이러한 이유에서 다르다는 논쟁적 주장을 끌어내 언론의 주목을 받고자 하는 유혹이 그런 예이다.

얼핏 생각하면 이런 문제는 ‘많은 양’의 데이터를 동원하면 모두 해결될 것 같다. 하지만 베이컨이 강조했듯이 핵심은 양이 아니라 다양성이다. 데이터는 하늘에서 떨어지듯 갑자기 생겨나지 않는다. 우리가 모을 수 있는 데이터는 역사적으로 누군가가 특정한 이론적 가정에 입각해서 특정한 의도를 갖고 수집하거나 정리한 데이터일 가능성이 높다. 예를 들어 19세기까지도 여성의 신체는 남성 신체의 불완전한 형태라는 생각이 의사들 사이에 널리 받아들여졌다. 그런 이유로 여성과 남성을 특별히 표지해서 데이터가 수집되지도 않았고 많은 경우에 ‘사람’이라는 표지를 가진 데이터는 남성 데이터가 대부분이었다. 이렇게 다양성이 부족한 데이터에 입각한 귀납 추론에서 여성의 생리적 특상에 대해 과학적으로 객관적인 결론을 얻기를 기대하기는 어려울 것이다. 같은 이유로 인공지능의 사전훈련을 위해 인터넷에서 데이터를 긁어모았을 때 그 데이터가 충분한 다양성을 적절하게 반영했을 것이라고 기대하기는 어렵다.

그러므로 젠더 혁신을 포함해서 과학적 데이터의 다양성을 강조하는 모든 포용적 혁신은 실은 과학의 객관성을 높이려는 방법론적 태도이다. 물론 이 점을 과학 방법론의 관점에서 논란의 여지가 없는 명확한 결론이라고 인정한다고 해서, 그 다양성 추구를 어떻게 해야 하는지의 어려운 문제가 손쉽게 해결되는 것은 아니다. 예를 들어 다양성 추구를 어느 수준까지 얼마나 해야 하는지의 결정은 제한된 연구 자원을 고려할 때 쉽지 않은 복합적 결정일 수밖에 없다. 또 여성과 남성의 차이점을 부각하는 다양성 연구에 대해 정치적인 이유로 거부감을 보이는 사람들도 있다. 그러므로 이런 복합적 결정은 순전히 과학적으로만 내려질 수 있는 것이 아닌 사회적 차원을 갖는다.

하지만 한 가지 확실한 점은 다양성 추구 자체가 과학의 객관성을 높이기 위한 기본적 지침이라는 사실이다. 남은 과제는 어떻게 포용적 혁신을 이룩할 것인지의 세부사항을 고민하는 것이다. 지금부터라도 이 작업을 본격적으로 시작해야 한다.

이상욱 한양대 철학과·인공지능학과 교수는

이상욱 한양대 철학과·인공지능학과 교수. ⓒ본인 제공
이상욱 한양대 철학과·인공지능학과 교수. ⓒ본인 제공

유네스코 세계과학기술윤리위원회(COMEST) 의장단, HY 과학기술윤리법정책센터 센터장, ‘디지털 소사이어티’ 창립회원 및 라운드테이블 위원, AI 윤리 신뢰성 포럼 제3기 위원장으로 활동하고 있다. 한국과학철학회 회장을 지냈다. 

*외부 필자의 글은 본지 편집 방향과 일치하지 않을 수 있습니다. 

저작권자 © 여성신문 무단전재 및 재배포 금지