오픈 소스 빅데이터 분석 도구 R
R은 통계처리를 위한 공개 소프트웨어 패키지로, 최근 가장 주목받는 빅데이터 분석 도구이다. R은 기존의 통계 소프트웨어인 S를 바탕으로 만들어졌는데, 다양한 통계기법과 시각화 도구들이 제공되고 있다.
R은 그동안 학계에서 연구용으로 많이 사용해왔는데, 빅데이터 분석을 위해 최근 소개되는 다양한 분석 방법들이 추가되면서, 2012년 현재는 4,000개 이상의 프로그램이 패키지 형태로 제공되고 있다. R 패키지는 R프로젝트 웹 사이트(https://www.r-project.org/)에서 내려받아 쉽게 설치하여 사용할 수 있다.
R은 자바(Java), C, C++, 파이썬(Python) 등 다른 프로그램 언어와도 쉽게 연동할 수 있으며, 윈도, 리눅스 · 유닉스, 맥(Mac) OS 등 대부분의 개발 환경을 지원한다. 또한, 하둡 분산처리 환경을 지원하는 라이브러리가 제공되기 때문에 구글, 페이스북, 아마존 등도 빅데이터 분석에 R을 활용하고 있다. R은 빅데이터 분석에 가장 강력하면서 유용한 도구로 점차 자리를 잡아가고 있다.