Frontier in dataset

교실의 데이터 우물(Data Well)

임완철 교수(경상국립대학교/USG공유대학 대학교육혁신본부 부본부장)

2008년 창업한 블루핀랩스(Bluefin Labs)1)는 2013년 트위터에 약 1억 달러 규모로 인수된 회사다. 창업자는 MIT 미디어랩 교수인 뎁 로이(Deb Roy)와 그의 박사과정 학생이었던 마이클 플레이쉬먼(Michael Fleischman)이었다. 데이터 비즈니스를 했던 블루핀랩스가 어떤 일을 하는 회사였는지는 뎁 로이 교수가 2011년 테드(TED)에서 발표한 강연2) 내용으로 추정해볼 수 있다.

그들은 단순하지만 집요하게 사업을 시작했다. 자신들의 아이의 삶을 데이터로 바꾸는 일부터 시작한 것이다. 뎁 로이 교수는 아이가 태어나기 전 자기 집 거실, 방, 부엌, 통로의 천장 안쪽에 광각 렌즈로 영상을 촬영하는 비디오카메라를 설치했다. 그리고 아이가 태어나서 집에 들어온 후 3년 동안 비디오 9만 시간, 오디오 14만 시간 분량의 데이터를 기록했다.

아이가 태어난 이후 3년 동안의 삶을 담은 데이터는, 흔히 ‘데이터 댐’이라고 부르는 규모와 비교했을 때 욕조의 목욕물 수준이지만 한 인간을 기준으로 보면 ‘빅’데이터다. 뎁 로이 교수와 그의 연구실 동료들은 이 데이터를 통해 아이(확대 해석하면 인간)에게서 단어가 탄생하는 메커니즘을 설명하고 있으며, 2011년 그 내용을 TED에서 ‘단어의 탄생(the Birth of a Word)’이라는 제목으로 발표했다.

아이가 태어난 후의 9만 시간은, 아이를 길러본 경험이 있는 부모들에게는 ‘빅데이터'다. 데이터의 총량이 커서가 아니라, 그곳에 데이터가 있다는 사실은 자명하지만 그 데이터를 감당할 방법이 없기 때문에 ‘빅데이터'다. 지금까지 모든 부모는 아이가 태어나서 눈빛으로 말하고 옹알이를 하고 처음으로 엄마라고 말할 때까지의 기억을 가지고 있지만, 그 기억에 오류가 없다고 확신할 수는 없다. 아이를 함께 기른 엄마와 아빠도 서로 ‘같은 기억'을 가졌는지 확신할 수 없기에, 말 그대로 ‘빅데이터'라 할 수 있다. 뎁 로이 교수는 이 빅데이터를 우리가 감당할 수 있는 데이터로 변환할 수 있음을 보여주었다. 작은 크기라도 꾸준히 발생한다는 관점에서 이와 같은 데이터 발생원을 ‘데이터 우물’이라고 불러보자.

교실에서 데이터 우물 자리 찾기

‘목마른 자가 우물을 판다’는 말이 있듯이, 바로 그 우물을 교실에서 파보자. 우물 자리를 찾기 전, 얼추 5년 만에 1억 달러 규모의 회사를 세운 뎁 로이 교수의 아이디어를 조금만 더 살펴보자. TED에서 그가 발표한 결과물은 크게 두 가지다. 텔레비전 네트워크에서 창발(‘발생’보다 좀 더 강하게 말하고 싶다)하는 실시간 단어들을 시각화할 수 있음을 보여준 결과물이 그중 하나다.

그림 1. TV 네트워크의 데이터 시각화 그림 1. TV 네트워크의 데이터 시각화 3)

‘단어의 탄생’이 (교육)학자들을 잠깐 멈춰 세웠다면, 텔레비전 네트워크에서 창발하는 어휘들의 관계를 시각화한 결과물은 트위터의 시선을 끌었다. 처음에는 연구비였고, 몇 년 뒤엔 회사 인수로 이어졌다. 이 아이디어를, 서로 다른 교실에서 발생하는 데이터 우물들 간의 관계를 시각화하는 아이디어로 사용해 보자. 모든 교실에서 실행되는 중간고사/기말고사가 사례가 될 수 있다. (학교 밖의) 우리는 중간고사/기말고사에 어떤 문제들이 출제되는지 모른다. ‘여러 가지’ 이유로 외부에 공개되지 않는다. 우리(사회)가 아이들에게 무엇을 물어보고 있는지 모르는 것이다. 그리고 다른 학교가 시행하는 중간고사/기말고사들 간의 차이도 모른다. 전국의 모든 학교에서 시행되고 있는 중간고사/기말고사 문제를 시각화한다면 무엇이 보일까? 지역별 학교마다 차이가 있는 것으로 보일까? 대도시는 수준이 높고, 지역은 수준이 낮을까? 문제해결 능력과 창의적 사고를 강조하고 있는 수많은 계획서나 보고서와는 달리 여전히 ‘외워야 답할 수 있는 문제’들로 가득한 질문을 다루고 있지는 않을까?

뎁 로이 교수의 TED 강연에서 소개된 또 다른 결과물은 ‘단어의 탄생’ 메커니즘이다. 아이가 언제쯤, 어느 위치에서, 어떤 단어를 발화하기 시작하는지에 대한 결과물이다. 현관 앞에서 탄생한 단어는 ‘안녕’이고, 냉장고 앞에서 탄생한 단어는 ‘물’이라는 식이다. 이 발표는 수많은 언어학자와 교육학자, 특히 언어교육학자와 영유아를 대상으로 하는 전공자들을 잠깐 멈춰 세웠다.

아이의 행동과 언어를 3년 동안 수집한 빅데이터를 기반으로 그 아이에게서 발생한 ‘변화’를 설명한 아이디어를 활용해 교실에서 우물 자리를 찾아보자. 예를 들어보면 ‘사회의 탄생’이다. 어떻게 ‘사회’가, 혹은 ‘상호 작용’이 탄생하는가다. 어린이집, 유치원, 초등학교, 중학교, 고등학교의 교실에서 발생하는 ‘대화’가 우물에서 퍼 올릴 데이터이고, 교실은 ‘사회의 탄생’ 메커니즘을 확인하는 데이터 우물이 된다. 교실에서 발생하는 현상에 대한 해상도를 조금 더 높여보면 ‘토론자의 탄생’, ‘협상가의 탄생’, 혹은 (우리나라에서는 익숙하지 않은 단어지만) ‘시민의 탄생’에 집중해볼 수도 있다. 수업시간에 발생하는 소그룹 단위의 토론이나 발표에서 어떤 어휘를 사용하고 어떤 패턴으로 토론하며 논쟁하고 발표하는지는 어린이집부터 유치원, 초·중·고등학교에서 수집할 수 있을 것이다. 또는 수업시간이 아닌, 그들만의 자유로운 상황 속에서 진행되는 무수한 토론과 협상, 조정과 중재를 데이터로 변환할 수도 있을 것이다. 그리고 확인해 보는 것이다. 우리가 어떻게 자라고 우리 사회가 어떻게 만들어지는지를 말이다.

교실을 데이터 우물로 써도 되는가

대부분의 영역에서 그렇듯이 교육 역시 한 명 한 명에게 최적화된 서비스를 목표로 한다. 다만 이 목표를 수천 년 동안 추구해 왔지만, 작은 규모와 특수한 조건에서만 가능했을 뿐이다. 인공지능과 데이터가 교육계에 전달하는 판타지는 국가 수준의 거대한 규모에서 일대일 맞춤 서비스를 학생 개개인에게 제공할 수 있을 것이라는 점에 집중된다. 맞춤 서비스를 제공하기 위해서는 서비스를 받을 학생에 대한 해상도 높은 이해가 선행되어야 한다. 이것이 교실에서 데이터 우물 자리를 찾아야 하는 이유다.

우리와 우리 아이들을 이해하고, 그들에게 더 적절한 기회와 경험을 제공하기 위해 교실에서의 데이터 우물을 파기 전 다뤄야 할 질문들이 있다.

수업에서 발생하는 토론과 발표를 ‘녹음/녹화’해도 될까? 수업이 아닌 자유로운 상황에서 발생하는 토론, 협상, 조정과 중재, 그리고 싸움을 ‘녹음/녹화’해도 될까? 교육적인 목적이라면 허용해야 할까? 전체 학교를 대상으로 하지 않고 샘플링해서, 즉 시범학교/연구학교 같은 곳을 선정한 뒤 그 학교의 학생들과 학부모 동의를 받았다면 그들의 삶을 모두 데이터로 바꿔도 될까?

이처럼 무수한 질문들이 이어질 것이고 합의를 이끌어내야 하며, 이 과정은 쉽지 않을 것이다. 충분한 시간이 필요할 것이다.

교실에서 발생하는 데이터의 ‘녹음/녹화’와 관련한 더 많은 논의가 필요해진 2021년, ‘줌(ZOOM)’은 실시간(온라인) 수업에서의 대화를 ‘녹음/녹화’해 자신들의 클라우드에 저장하고 있다. 이는 아마도 초등학교, 중학교, 고등학교, 대학교, 대학원 그리고 일부 평생교육까지 우리나라 구성원에게 제공되는 전체 교육 프로그램이 ‘녹음/녹화’되어 어느 외국계 기업의 클라우드에 저장되고 있다는 의미일 것이다. 합의를 이끌어내는 과정 없이 말이다. 그렇기에 뎁 로이 교수가 5년 만에 1억 달러 규모의 회사를 만들 때 사용했던 데이터보다 가치가 있을 이 데이터, 즉 우리나라의 모든 교실에 ‘줌’이라는 이름으로 뚫려 있는 ‘데이터 우물’에 대해 대화를 시작해야 할 때다.

지난 웹진 보기

이전호 더보기