1 AI기술을 보유한 기업 솔트룩스의 AI기반 빅데이터 플랫폼 서비스 출시
기사를 요약하면,
AI기술을 보유한 솔트룩스가 AI 기반 빅데이터 플랫폼 서비스 '데이터믹시'를 출시했다.
이용자들은 데이터믹시를 통해 원하는 자료를 수집하고, 자료에 대한 분석을 얻을 수 있다. 여기저기 흩어져 있는 "국내외 뉴스, 트위터, 블로그를 포함한 소셜 데이터 100억건, 공공 데이터 34만건"등을 한 곳에서 내려받을 수 있고, AI기술 기반의 데이터 "주제 분석, 감성 분석, 트렌드 분석, 이슈감지" 등의 고급 분석까지 제공받을 수 있다는 의미이다.
한 마디로 요약하면, 여기저기 돌아다니지 않고도 쉽고 편하게 원하는 자료를 얻을 수 있으며 그 자료에 대한 insight까지 제공받을 수 있다.
빅데이터는 최종 목적이 아니라 특정 문제 해결을 위한 '도구'라는 데에 동의한다면, 과연 빅데이터가 모든 문제를 해결해 줄 만능 도구인가? 에 대해 생각해보지 않을 수 없습니다. 그래서 아래 기사를 읽고 정리해보았습니다.
2 빅데이터를 대하는 자세에 관해
글을 재구성해 보았습니다.
1) 빅데이터가 무조건 좋은 것일까?
데이터를 많이 쌓아 놨다고 해서 그것으로부터 의미있는 분석을 뽑아내는 것은 아니다. 데이터의 크기는 의미있는 분석을 도출할 정도의 규모면 된다.
2) 중요한 건 데이터 정제화 작업이다.
데이터를 수집하고, 그것으로부터 좋은 분석을 찾아내기 위해서는 수집한 데이터들을 정제해야 한다.
3) 빅데이터의 목적은 문제 해결임을 잊어서는 안 된다.
데이터의 수집, 데이터 정제화 작업 그리고 유의미한 분석은 단지 프로세스이다. 그것이 문제해결로 이어져야 한다. 따라서 데이터 수집의 전 단계에서 제대로 된 문제 정의가 필요하다. 문제 정의를 잘 한 뒤에 문제 해결에 꼭 맞는 데이터를 찾아내는 것이 중요하다. 이 과정에서 "데이터에서 의미 있는 맥락을 찾아내는 컨텍스트 능력"이 중요하다.
4) 빅데이터 분야에 뛰어드려는 사람에게...
무작정 빅데이터를 만지려고 하기 보다는 작은 규모의 데이터를 가지고 문제를 해결해 나가는 연습을 해라. "정의부터 해결까지의 하나의 싸이클를 돌려보며 시행착오를 거치고 이를 통해 데이터의 속성을 이해해야 한다."
한마디로 단편적인 데이터들이 가지고 있는 맥락의 의미, 컨텍스트를 파악하는 능력부터 길러라.