
융합학부
임세정 교수
운전자라면 누구나 공감하는 부분이 있다. 오랜 시간 가다 서다를 반복해야만 하는 극심한 교통 정체를 피하기 위해 필수적으로 교통 정보를 확인하는 일. 조금만 생각해보면, 과거 교통 예보가 어떠하였는가에 대해 기억해낼 수 있다. 주요 고속 도로를 통해 서울까지 오는데 얼마나 걸리는지 또는 현재 막히는 구간이 있는지 등의 단순한 정보였다.
하지만 오늘날 도로에서 수집되는 방대한 차량 통행 정보 즉, ‘빅 데이터’로 차량의 흐름 파악하여 정확도 95%로 차량이 집중될 시간대를 알려주며 미래의 교통 상황까지 예측하고 있다. ‘빅 데이터’라는 말은 우리의 일상생활 여기저기서 언급되고 있으며 커다란 가능성으로 우리의 삶을 바꿔놓고 있는 시대적인 흐름이 되었다. 하지만 빅 데이터의 의미를 제대로 이해하여 그 실체를 선뜻 정의 내릴 수 있는 사람은 많지 않을 것이다.
2012년 ‘빅 데이터’라는 개념이 국내에 확산되면서 단어가 의미하는 것처럼 엄청난 양의 데이터라는 뜻으로 받아들여졌지만 얼마나 큰 양의 데이터인지가 모호했으며 단순히 데이터의 양이 많다고 빅 데이터라고 할 수 있는가에 대해서도 고민하게 되었다. 현재 공통적으로 사용하는 빅 데이터의 정의는 2001년 애널리스트 더그 레이니(Doug Laney)에 의해 양(Volume), 속도(Velocity), 다양성(Variety)으로 요약되었고 쉽게 분석 가능한 고정된 크기의 숫자, 문자 등의 정보의 형태뿐만 아니라 영상 및 이미지, 음원 파일, 문서 파일처럼 다양한 형태로 테라바이트(TB), 페타바이트(PB), 엑사바이트(EB) 이상의 크기를 가진 데이터를 실시간 빠른 속도로 처리하는 것으로 정의되고 있다.
IBM은 여기에 수집된 방대한 양의 데이터 신뢰성을 강조하며 정확성을 추가하여 정의하였고 최근에는 빅 데이터 저장을 위한 인프라 구축 비용을 의미하는 가치(Value)를 포함하는 등 더 많은 빅 데이터의 속성이 추가되고 있다. 이러한 특징을 나타내는 빅 데이터는 데이터 수집, 저장, 처리, 분석, 표현하기 위한 새로운 방법이 필요하게 되었고 데이터 수집, 저장, 처리, 관리 등 빅 데이터 플랫폼 운영 기술, 분석·예측 기술 및 빅 데이터 활용을 위한 가공 기술과 시각화를 위한 다양한 기술이 등장했다. 빅 데이터 플랫폼으로 하둡(Hadoop)에서 고속 메모리 기반 분석이 가능한 아파치 스파크(Apache Spark)가 부각되고 있으며 딥 러닝 및 인공 지능이 결합된 지능형 빅 데이터 플랫폼으로 진화되고 있다. 구글(Google), 아마존(Amazon), 오라클(Oracle), 마이크로소프트(Microsoft)는 클라우드형 빅 데이터 플랫폼 서비스를 제공하고 있으며 IBM, SAS, SAP, Oracle 등은 시각화 기술을 출시했다.
국내에서도 한국전자통신연구원(ETRI)에서 텍스트 및 음성 분석 방법을 개발하고 공간 분석과 빅 데이터 서비스 기술 등이 연구 개발되고 있지만 아직 초기 단계에 머물러 있다. 2018년 데이터 산업 활성화 전략 I-Korea 4.0 데이터 분야 계획 I-Data를 발표하면서 4차 산업 혁명 시대를 이끌어갈 수단으로 데이터를 꼽았다. 또한 대통령 직속 4차 산업혁명 위원회에서는 개인 정보 보호와 활용을 위한 법제화 등 지원 체제를 마련하고 있다.
하지만 국내 산업 전반에서 빅 데이터 이용률은 7.5%로 매우 낮은 실정이다. 국가와 기업이 빅 데이터 시대에 경쟁력을 강화하고 성장하기 위해서 가장 중요한 것은 데이터, 사람, 플랫폼 등 세 요소이다. 예를 들면, 높은 품질의 실제 데이터 수집과 지능형 데이터 구축 및 클라우드 인프라 활용, 빅데이터 플랫폼 서비스, 빅 데이터 전문 기업의 성장 지원 및 빅 데이터 분석·개발 전문가 양성 등이라 할 수 있겠다.
빅 데이터 세계 시장은 연평균 10.6% 성장하고 있으며 2022년 900억 달러로 성장할 것으로 전망하고 있다. 국내에서는 향후 6년간 연 평균 10.9%의 성장으로 2022년 2조 2000억 원 규모가 될 것으로 기대하고 있다. 이처럼 향후 수년간 전략적 기술이 될 빅 데이터는 앞에서 언급했던 것처럼 이미 일상생활에서 광범위하게 활용되고 있으며 불가능을 가능으로 전환시키며 우리 삶에 엄청난 변화를 가져다 줄 것이다. 데이터를 ‘4차 산업 혁명의 쌀’, 미래 신수종 산업, 미래 새로운 먹거리로 꼽는다. 데이터 산업 활성화를 위한 ‘빅 데이터 경제 3법’의 조속한 정비를 기대해 본다.