Tutorials 01

TeraONE ™ (1 / 5)

TeraONE Super Query ™ 세미나 BigData의 미래와 TeraONE의 방향정이 그대에게 미치는 꽃향기가…

기술 개발의 중요성 강조

세미나 시작에 앞서 이영상 데이터스트림즈 대표는 “데이터스트림즈는 회사 설립 이후 20여 년 동안 데이터라는 한 분야에만 집중해왔다”며 “그동안 개발한 자체기술을 제품에 적용시켜왔으며, 앞으로도 이러한 상황을 계속될 것”이라는 말로 기술개발의 중요성을 얘기했다.

이 대표는 이어 MySQL이 오픈소스라는 점을 강조했다. 현재 데이터스트림즈가 집중하고 있는 빅데이터는 오픈소스가 없었으면 불가능했을 것이라며, 상용소프트웨어의 기술 역시 오픈해 서로 공유함으로써 행복을 추구해나가는 방향으로 발전해야 할 것이라고 주장했다. 또한, 데이터 통합의 중요성에 대해서도 언급, DBMS기술도 중요하지만 저장된 데이터를 활용하기 위한 데이터통합이 무엇보다 필요하다고 덧붙였다.

가장 먼저 주제발표에 나선 김시영 한국오라클 부장은 MySQL에 대해 소개했다. “세계에서 가장 널리 보급된 오픈소스 DB가 ‘MySQL’이다”라고 말한 김 부장은 “MySQL은 클라우드 분야 1위 데이터베이스로 세계 최고 10개 웹사이트 중 9곳이 사용 중이고, 최고 10개 ISV 중 8곳이 자사 솔루션에 MySQL을 임베드해 개발 중이며, 빅데이터 플랫폼의 80%가 하둡과 함께 MySQL을 통합해 사용 중”이라고 주장했다. 실제 아마존을 비롯해 페이스북, 야후, 이베이 등에서 MySQL을 사용 중이며, 국내에서도 삼성을 비롯해 포스코, 쿠팡, NHN, IBK투자증권 등 다양한 산업분야에서 활용되고 있다.

김 부장은 또한 MySQL 엔터프라이즈 에디션은 확장성이 뛰어나고, 고가용성, 보안 감사 등 향상된 기능을 갖고 있을 뿐 아니라, 모니터링, 백업, 개발, 관리, 마이그레이션 등 편리한 관리 툴도 제공한다고 말했다. 김 부장은 MySQL 엔터프라이즈 에디션은 일반 커뮤니티 버전과는 달리 지원이 완벽하다는 점도 내세웠다. 최대 규모의 MySQL 엔지니어링 지원조직을 갖추고 있으며, 전 세계 29개 언어를 지원하는데다, 컨설팅은 물론 횟수에 관계없이 1년 365일 무제한 지원이 가능하다는 것이다. 이외에 MySQL과 관련해 기술교육 및 헬스체크 프로그램을 운영하고 있다는 점도 부각했다.

박시영 데이터스트림즈 상무는 자사 빅데이터 플랫폼인 테라원(TeraONE)을 소개했다. “데이터스트림즈는 빅데이터의 통합, 구현, 데이터거버넌스, IoT 컨버전스 등의 이슈들에 대해 비용효율적이고 간편하며 동시에 풍부한 사용자 경험을 가져다줄 수 있는 솔루션 제공을 목표로 하고 있다”고 밝힌 박 상무는 먼저 전통적인 DW플랫폼과 빅데이터 플랫폼 간 차이에 대해 설명했다. 원천데이터의 ETL과 저장 분석과정은 비슷하나 개발, 구축 시 구현 기술이 상이해, 기존 개발방식과 다른 새로운 빅데이터 생태계(Eco-System)기술을 익혀야 한다는 것이다.

그는 데이터스트림즈의 빅데이터 플랫폼 접근방법으로 ‘빅데이터와 RDBMS를 동시에 처리할 수 있는 플랫폼을 통해 각각의 장점을 살린 아키텍처로 구현 한다’는 점을 들었다. 전통적인 SQL기술 및 ETL, CDC, OLAP 기술에 거버넌스 기술을 활용해 하나의 플랫폼을 구성한다는 것이다.

테라원(TeraONE)을 ‘데이터스트림즈의 수퍼DW 아키텍처 개념을 구현하기 위한 빅데이터 플랫폼’으로 정의한 박시영 상무는 테라원의 장점으로 노드의 추가로 선형적인 성능 증가, GUI를 통한 다양한 M/R프로그램 구현 및 데이터전송 기능제공, 예약 스케줄링 및 워크플로우를 통한 데이터 연계 기반기능 제공, 분석기능 연계 및 SQL온하둡(SQL on Hadoop) 쿼리 브라우즈 기능 제공 등을 들었다.

디스크기반의 대량 배치 데이터처리에서 월등한 성능을 기록하고, 인메모리기능 사용 시 최고의 실시간 스트림 처리 성능을 발휘하며 스쿱(Sqoop) 대비 3배 이상의 데이터 적재성능을 제공한다는 것이 박시영 상무의 주장이다.