온라인과 디지털의 발달로 각광받기 시작한 것 가운데 하나를 꼽자면 ‘빅데이터’를 들 수 있다.
빅 데이터의 사전적 의미는 디지털 환경에서 생성된 각종 데이터로, 수치와 문자는 물론 영상 등에 이르기까지 여하한 형태의 가치를 만들어낼 수 있는 데이터를 말한다.
따라서 가늠하기 어려울 정도로 규모가 방대하지만, 반대로 생성·소멸 주기가 짧다는 특징도 있다.
특정 분야에 국한한 정보나 데이터라도 사용하는 사람에 따라 엄청난 가치를 생성할 수 있다는 점에서 존재하는 모든 데이터가 빅 데이터에 해당한다고 볼 수 있다.
2일(현지시간) 미국의 경제전문지 포브스는 전세계에 퍼져 있는 각종 정보 가운데 실제로 사용되거나 분석에 활용되는 정도는 0.5%도 안된다고 지적했다.
그러면서 빅 데이터가 얼마나 광대한 것인지를 대략적으로 가늠할 수 있는 관련 통계와 실태를 소개해 눈길을 끌었다.
우선 정보의 폭발적 증가로 최근 2년새 만들어진 데이터가 인류가 등장한 뒤부터 지난 2년전까지 만들어진 데이터의 총량을 넘어선다는 것이다.
또 매초마다 1.7메가바이트에 해당하는 새로운 정보가 만들어진다.
세계최대의 검색엔진인 구글에는 매초마다 4만번 이상의 조회와 문의가 이어진다. 이는 전 인류가 하루에 3.5회씩 조회하거나 문의하는 것에 해당하고 연간으로 치면 1조2천억회에 달한다.
소셜미디어의 간판주자인 페이스북 이용자는 2015년 8월을 기준으로 매일 10억 명 이상에 달한다.
유튜브에는 1분마다 300시간 분량에 달하는 새로운 동영상이 오른다.
올해 들어 지금까지 촬영한 사진은 1조장 정도로 추산되며, 이 가운데 적어도 수십억장이 온라인에서 공유됐다.
2017년에 이르면 스마트폰으로 촬영된 사진은 전세계 사진의 80%를 점하게 된다. 이와 관련, 올해 들어서만 14억개의 스마트폰이 팔려나갔다. 이들 스마트폰에는 갖가지 데이터를 생성할 수 있는 센서나 앱이 장착돼있다.
2020년에는 전 세계에서 사용되는 스마트폰이 61억개에 달하게 된다. 아울러 2020년에 이르면 전세계 모든 데이터의 3분의 1은 클라우드 방식으로 저장돼 활용된다.
구글은 단 한가지 조회나 문의에 응답하기 위해 무려 1천개에 가까운 컴퓨터를 동원한다. 이들 컴퓨터가 조회와 문의에 답변을 내릴 때까지 걸리는 시간은 0.2초를 넘지 않는다.
빅 데이터를 활용하면 의료·보건 관련 비용을 연간 3천억 달러(354조9천억 원) 정도 줄일 수 있다. 이는 모든 사람이 부담하는 의료비용을 한 명당 연간 1천 달러(118만3천 원)씩 줄이는 효과가 있다.
미국 백악관은 이미 빅 데이터 관련 사업에 2억 달러 이상을 투입한 상태다.
미국의 ’1천대 기업’들이 빅 데이터 사용량을 10% 정도만 늘려도 6천500만 달러(769억 원)의 추가 순익을 얻을 수 있다.
아울러 각종 소매 판매 업체들이 빅 데이터를 충분히 활용하면 영업이익이 60% 정도 늘어난다.
이런 상황에서 세계적으로 활용되는 정보가 0.5%도 안된다는 점을 고려하면 빅 데이터의 추가 활용이 가져다줄 효과는 계량하기 어려울 정도로 클 수밖에 없다.
이강원 특파원 gija007@yna.co.kr
2015.10.03 ⓒ 연합뉴스