서브비쥬얼이미지6

칼럼

HOME > 학술 웹진 social 2.0 > 칼럼

발표주제 빅데이터와 프라이버시 -2-
작성자 강장묵 조회수 6485
작성일 2013.07.19

 

빅데이터와 프라이버시 -2-

강장묵

고려대학교 사범대 (정보창의교육연구소)

 

 

생활 밀착형 서비스란

 

생활 밀착형이란 말 그대로 우리 일상에 아주 가깝게 바짝 붙은 무엇이라는 것이다. 마치 스마트폰을 손에 쥐지 않고 출근한다는 것이 상상할 수 없듯이, 특정 서비스가 우리 일상과 떨어질 수 없게 된다는 뜻이다.

평소 일처리를 잘 못하는 경우, “너 정신을 어디에 두고 있는 거야?”라는 야단을 맞게 된다. 이 말의 의미는 바로 정신 차리고 집중해서 일하라는 뜻이다. 이처럼, 몸만 일하는 곳에 있고 정신이 딴 곳에 있을 수 없듯이, 스마트폰이 손에 있으면 반드시 함께 따라 와야 하는 서비스가 있다는 것이다. 생활에 긴밀하게 관여하는 서비스, 바로 생활 밀착형 서비스이다.

예를 들면, 해외에 나가게 되면 데이터 요금이 부담스러워 스마트폰 서비스를 사용하지 못하는 경우가 있다. 스마트폰을 가지고 있으나, 생활밀착형서비스를 쓸 수 없어 불편한 것이다.

최근 대표적인 서비스가 위성항법장치 (GPS; global positioning system)를 활용한 위치기반서비스 (LBS; Location based Service)이다. GPS위치를 수신 받아 현재 어디에 있는지를 구글 지도 위에 표시하면, 낯선 곳에 여행을 가서 불편할 일 (길을 잃거나 맛 집을 찾거나 숙소를 구하는 일 등)이 없다. 길을 잃어버려도 현재 어디에 있는지를 금방 알 수 있다. 현재 이와 같이 위치기반의 생활 밀착형 서비스가 고도화되고 있다.

고도화의 방향은 클라우드, 빅데이터, 개인화라는 세 가지 큰 줄기이다.

 

 

클라우드, 빅데이터, 개인화

 

RFID (radio frequency identification; 극소형 칩에 상품정보를 저장하고 안테나를 달아 무선으로 데이터를 송신하는 장치, 시사상식사전, 2013, 박문각) 등을 기반으로 한 유비쿼터스 사회가 유행이던 시절이 있었다.

새로운 기술이 등장할 때마다, 신조어도 많이 생겨난다. 그리고 새로운 용어뿐만 아니라, 유비쿼터스 관련 연구소와 협회 등이 우후죽순 (雨後竹筍)격으로 늘어만 갔다.

최근에는 스마트 사회, 소셜 네트워크 사회, 클라우드 컴퓨팅, 빅데이터 등이 각광받고 있다. 이런 신조어와 유행을 경험하다보면 그 빠른 기술의 속도와 변화에 어지럼증이 나곤 한다. 그리고 기술 변화에 둔감해지거나 피로감이 누적되어 오히려 기술에 대한 반감이 늘기도 한다.

이런 신기술의 도입에 따른 피로감과 거부감은 곧잘 ‘스마트폰 게임에 중독되었다’ 또는 ‘스마트폰을 반드시 사용해야하는가?’ 등으로 표현된다. 그리고 부정적인 경험으로 구체화되며 회자된다. ‘카카오톡’이 편리하지만 ‘카톡~카톡’하면서 업무와 개인의 프라이버시를 침해한다는 볼멘소리와 같이 구체적인 사례도 있고 막연히 빅브라더스에 대한 염려도 존재한다. 최근 기업들은 프라이버시를 보호하는 여러 기능을 탑재하고 이용자의 프라이버시 보호를 구현하였다고는 하지만 여전히 볼멘 소리와 프라이버시의 종말에 대한 염려는 줄어들지 않는다.

이처럼 신기술은 순기능과 역기능을 동전의 양면처럼 드러내는데, 전반적으로 신기술이 도입되고 관련 기술에 대한 산업화를 이루어야 하는 시점에서는 산업발전이 우선이 되다보니 역기능에 대한 방비가 허술해지기 쉽다. 반면, 기술이 사회에 안정적으로 뿌리를 내리면 그제야 역기능의 발생이 빈번해지고 이에 따라 역기능에 대한 대비를 하게 되는 경우가 많다.

그러나 오늘날 신기술, 특히 빅 데이터는 프라이버시 등 역기능의 폐해가 실로 크다. 그렇다면 빅 데이터가 얼마나 우리 사회에 영향을 미치는지를 가늠해볼 필요가 있다.

빅 데이터를 현존하면서 각광받는 여타 인접 기술들과 함께 고려할 때 그 파급효과를 정확하게 이해하게 된다. 그 이유는 다음과 같다.

오늘날 데이터는 인터넷 기반 (Cloud)으로 저장하게 된다. 클라우드, 즉 구름(인터넷을 뜻함) 위에 저장된 데이터는 유/무선 환경에서 실시간으로 다운로드 및 업로드가 가능하다. 그뿐만이 아니다. 과거 개인이 사용하는 소형 컴퓨터 (PC; personal computer)에 설치되어 있던 응용프로그램이 인터넷 기반으로 작동함에 따라 더 이상 개인용 컴퓨터에 설치되어 구동되지 않는다. 즉 구름 (인터넷 기반) 위에 모든 어플리케이션을 올려놓고 필요할 때마다 시간별로 소프트웨어를 사용할 수 있는 환경이다.

클라우드 기반이란 크게 컴퓨팅 자원, 데이터 자원 그리고 서비스 등을 인터넷으로 사용할 수 있는 인프라를 구현한다는 것이다.

이런 인프라는 산업화 시대에 고속도로를 건설하는 것과 같다. 반면, 빅 데이터란 클라우드에 올라온 데이터를 어떻게 분석하는지에 대한 이야기이다. 그리고 개인화라함은 빅 데이터로 분석된 결과로 개인 맥락의 차별화된 서비스를 구현한 결과이다.

즉, 앞으로 모든 데이터와 소프트웨어 그리고 서비스 등은 인터넷에 올려놓는다. 물론 플래시 메모리가 내장된 탈착 가능한 저장장치 (USB flash drive)를 가지고 다니는 분들이 있으나, 미래에는 인터넷에서 다운로드 받거나 업로드하는 경우가 다수가 될 전망이다.

따라서 개인이 사용하는 소형 컴퓨터에 하드디스크의 사이즈가 줄어들거나 대부분의 소프트웨어가 웹 기반으로 구동되는 환경이 올 때, 빅 데이터는 개인들이 올려놓은 여러 정보를 수집하여 분석하는 것이 가능하다.

빅 데이터는 인터넷에 올라온 정형 데이터뿐만 아니라, 모바일 기반으로 주고받는 실시간 트위터 (www.tweet.com), 페이스북 (www.facebook.com), 로컬 이미지 기반 서비스인 옐프 (www.yelp.com), 플리커 (www.flickr.com), 게임 방식의 위치 기반 서비스인 포스퀘어 (www.foursquare.com) 등의 비정형 데이터도 분석한다.

빅 데이터가 분석한 결과는 개인화 서비스로 제공된다. 개인화 서비스란 말 그대로 개인에게 맞춰진 최적화 서비스이다.

예를 들면, 오늘날 전 국민이 즐겨 사용하는 포털인 네이버와 다음의 첫 화면에 나온 모든 정보가 여러분의 입맛에 맞는지를 묻고 싶다. 네이버와 다음의 첫 화면은 전 국민에게 동일하게 서비스된다.

여성이든, 노인이든, 어린이든, 남성이든, 부자든, 가난한 자든 모두에게 동일한 내용이 첫 화면이다. 어찌 보면, 공평하고 공정하다고 생각할 수 있다. 그러나 모두와 똑같은 서비스는 나에게는 일반적인 정보일 뿐, 반드시 내 정보일 수 없다는 문제가 있다. 마치 은행에 부자들을 위한 VIP 공간이 따로 있듯이, 네이버와 다음에서도 나만은 위한 특별한 서비스를 갖고 싶다.

이런 경우에는 어떤 정보가 더 필요할까? 우선 네이버와 다음 등의 포털 서비스는 접속한 개인용 컴퓨터의 기종과 사용자에 대한 정보를 알아야 한다. 그 뿐만 아니라, 이용자의 나이와 성별 그리고 주거 상황 등에 대한 정보를 알면, 현재 이용자가 무엇을 원하는지 대략 카테고리라도 가늠할 수 있다.

 

 

빅데이터와 고객정보

 

요즘 빅 데이터란 여기에 더해 기업이 가진 고유한 개인정보를 활용하는 것을 의미한다. 기업은 빅 데이터를 활용한 개인화 서비스를 활용하기 전에 기업이 갖고 있는 고객정보를 활용하거나 초기 벤처기업과 같이 고객정보가 없는 경우에는 외부에서 공유된 정보를 활용하고자 하게 된다.

벤처기업 등 누적된 고객정보 없이 새롭게 시작하는 기업은 트위터 등 응용 프로그램 용 프로그래밍 인터페이스인 API (API; Application programming interface)를 이용하여 빅데이터 서비스의 첫 걸음을 시작할 것이다. 성공한 SNS 기업들이 제공하는 API는 개방된 형태로 제공되고 누구든 이 기능을 무료로 사용할 수 있다.

따라서 벤쳐기업은 API를 이용하여 개발하고자 하는 애플리케이션(프로그램)과 운영체제(윈도, iOS, 안드로이드 등) 사이의 통신에 사용되는 언어나 메시지 등을 성공한 외부 SNS로부터 얻을 수 있게 된다. 대표적인 오픈 API는 '페이스북의 좋아요 기능', ‘페이스북의 공유 기능’, '구글맵', 'MS 빙맵', 'SK플래닛 티맵', 등이다.

반면 이미 오랜 기업 활동으로 축적된 고객정보가 있는 경우에는 어떨까? 즉 기업 고유의 정형화된 데이터를 보유한 경우에는 어떨까?

예를 들어, 현대카드는 마이메뉴라는 현대카드 어플을 서비스한다. 이 서비스는 현재 내 주변에 있는 현대카드 이용자의 인기 가맹점을 카드 종류별 방문자 순 등으로 확인하고 현대카드 회원의 연령대 및 다양한 혜택을 제공해주는 것을 특징으로 한다.

현대카드는 카드를 디자인하고 혜택 등을 설계하여 제품을 내놓을 때 이미 여성 30대 또는 남성 직장인 또는 여행과 여가는 즐기는 라이프스타일 등으로 제품군을 분류하고 카드를 발급한다. 이런 정보는 이미 기업의 영업 노하우로 고스란히 저장된 정보이다. 어쩌면, 정형 데이터와 비정형 데이터의 결합과 분석을 가능하게 하는 빅데이터라기 보다는 기업이 가진 고유한 정형 데이터와 스마트폰의 애플리케이션에서 수신받은 고객정보라고 보는 것이 맞을 것이다.

고객들은 자신의 카드 사용 실적, 자신의 라이프와 유사한 고객의 라이프 스타일, 특정 카드 소지자가 즐겨가는 동네 맛집, 현재 내가 위치한 곳의 관심지역을 검색함으로 기존 블로그나 여타 소셜 커머스 등의 정보 오남용 즉 정보의 신뢰 문제를 해결한다. 최근 파워블로거의 스폰싱 받은 사례 또는 댓글 알바 등과 같은 정보에 대한 불확실성이 늘어나고 있기 때문이다.

그러나 현대카드사 등은 하둡 등의 최신 기술을 이용하여 빅데이터를 실제 구현하고 있는지의 여부를 떠나, 생활밀착형 서비스 또는 개인화 또는 로컬 서비스라는 새로운 이름의 서비스를 제공한다. 그리고 개발하여 제공하는 대부분의 서비스 뒤에는 고객 정보를 충분히 잘 활용한다는 전제가 있다는 것이다. 즉 이미 고객정보를 충분히 가지고 있는 대기업이 스마트폰에서 애플리케이션을 개발하는 경우에는 빅데이터 기반의 새로운 서비스 개발보다는 기존 자사의 고객정보에 스마트폰을 소유한 고객의 추가 정보를 결합하는 방식으로 서비스를 개발하게 된다. 이 방식이 기존 기업이 잘 해오던 방법이고 쉬워 보인다. 그러나 그 이면에는 고객정보가 기존의 정적 정보에서 이동하면서 실시간으로 업데이트되는 스마트폰의 정보가 결합되기 때문에 예전보다 심각한 프라이버시 문제가 발생할 수 있다.

거대 기업은 지금까지 이메일을 발송하거나 해당 광고를 보여주는 수준에서 다음과 같이 발전하고 있다. 실시간으로 애플리케이션을 통해 고객의 일거수일투족을 살펴보고 남다른 서비스를 제공한다. 다른 기업의 경쟁 우위에 있기 위해서 기존에 보유한 고객정보를 기반으로 한 서비스를 발굴한다. 이들은 개인화 서비스 등 고객의 라이프 스타일과 표적 집단의 추이를 파악하기 위해 빅 데이터 기술을 도입하여 고도화된 정보를 생산한다.

그러나 이와 같은 고급 기술이 도입되기 전에 기업들은 고객정보를 스마트폰과 결합하고 있다. 그리고 장래에는 의료정보 등 보다 민감한 고객정보를 다루고 이를 새로운 서비스로 제공할 것이다.

 

예를 들어 의료정보에 있어서 빅데이터는 환자의 병력 및 질환 관리뿐만 아니라, 태어난 아기의 질병 가능성을 예측 및 추론하는 DNA 정보를 메타값이 파악 할 수 있다.

DNA란 모두가 알고 있듯이, 개인의 성격과 건강 그리고 잠재적인 활동이 어떠할지를 추측할 수 있게 해주는 민감한 정보이다. DNA 정보를 태어나자마자 또는 성인이 된 후, 보험회사 등과 공유하는 시대를 상상해보자. 이미 우리나라는 주민등록번호와 고유한 식별 자료인 지문을 국가가 관리하면서 범죄가 발생할 때마다 전국민을 잠재적 범죄인으로 간주하고 지문 대조를 하고 있다. 현재 범인을 잡거나 공적일을 돕는데 DNA는 결정적인 도움을 주고 있다. 또한 동시에 개인의 질병관리와 예방 차원에서 DNA 정보를 특정 서버에 저장하고 필요할 때마다 꺼내 쓰는 것은 건강과 라이프라는 아주 개인화된 생활밀착형 서비스이기도 하다.

그러나 그 이면에는 잠재적 프라이버시 위협도 높아질 것이다.

 

 

 

 

                                                                                   강장묵 교수(고려대), 공학박사

                                                                                   (이메일 : kangjm@korea.ac.kr    mooknc@gmail.com)

 

 

저자는 차이가 차별로 구조화되는 사회를 반대한다. 질투는 나의 힘이다. 염장질은 나의 버릇이다.

날마다, 창조적 조응을 통한 매혹을 그린다.

지루한 사람 곁에는 하품을, 어딘가 꼬여 부정적인 이에게는 안쓰러움을, 직급만 믿는 이에게는 거품 물방울을 뿌리며 산다.

하고 싶은 일만 골라서 하고, 물질보단 열정을 쫓는다. 느낌표가 그리울 땐 여행을 간다. 아이디어를 발견하면 글을 쓴다. 틈틈이 특강, 심사, 포럼을 하며 얇은 지식의 표상들에게 비수를 꽂는다. 사는 것이 즐겁다.

 

 

첨부파일  
이전글 방송의 디지털전환과 방송환경의 변화
다음글 학문으로서 융합, 연구로서 융합?
목록