background preloader

Big Data

Facebook Twitter

[다시뛰는SW] ⑬이경일 대표 “빅데이터 시대 무임승차 아니다” 정보마이닝과 시맨틱 웹 전문 업체인 솔트룩스 이경일 대표를 만났다. 두 가지가 가장 궁금했다. 이 회사의 설립일은 1979년 6월 1일이다. 30년이 넘었다. 국내 이렇게 오래된 회사가 있었나 하는 생각이 들었다. 또 하나는 ‘빅데이터’ 때문이다. 이경일 대표는 웃으면서 웹사이트 하나를 보여줬다. 그는 “저희가 가진 기술들을 고객들이 확인해 볼 수 있도록 서비스를 하나 제공해 봤습니다. 이경일 대표는 빅데이터는 다양한 기술들이 조합된 인프라를 기반으로 진정한 가치를 찾아내는 상황에서 수많은 업체들이 각자의 강점을 바탕으로 관련 시장에 뛰어들고 있어 고객이나 미디어들이 혼란스러워 할 수 있다고 강조하면서 이미지 한장을 보여줬다. 그는 “이 이미지에서 보듯이 엄청나게 많은 다양한 기술들이 엮여 빅데이터 분석을 위한 기반 플랫폼을 만들어 내게 됩니다. 이 대표는 빅데이터 시장도 기존 IT 시장이 성장해 왔던 방식과 동일한 형태로 발전할 것이라고 내다봤다. 다음은 이경일 대표와 나눈 일문일답. - 지식을 소통하는 일을 하는 회사라는 소개가 인상적이다. . = 사람들 간에 지식을 공유하고, 상호 소통을 하는데, 언어와 시간, 거리, 인식 혹은 관점의 장벽 등 여러 장애물이 있다. . - 2015년에 세계 10대 지식 서비스 기업이 되겠다는 비전을 밝힌 바 있다. . = 다른 사람들은 실현 가능성이 없다고 할 때, 꿈을 실현해 내기 위해 땀을 흘리는 것이 비전과 열정을 품은 사람과 조직이 해야 할 일 아니겠는가. 2003년에 세운 ‘비전 2010′의 목표에 달성하지는 못했지만, 솔트룩스는 생존했고 여전히 곧은 성장을 하고 있다. . - 검색 업체들이 빅데이터 시대의 등장에 무임승차한다는 지적들이 있다. = 검색 기업들은 이미 빅데이터와 가장 익숙한 조직들이다. 또한 빅데이터 처리의 대표적 사례로 얘기되는 IBM의 왓슨컴퓨터도 시맨틱 검색과 텍스트 마이닝, 시맨틱 지식 베이스 기반 추론에 기반을 두고 있다.

. = 빅데이터에 대해 막연한 환상을 갖지 않는 것이 필요하다. . - 마지막 질문이다. NoSQL – 도대체 어떻게 선택해야 할까? | 우승이의 블로그. 오늘 글을 포스팅 하기전에 오래전 얘기를 먼저 해야 할 것 같습니다. 99년도쯤이였나 당시 저는 유닉스에서 개발된 정보 시스템을 MS 윈도우로 전환하면서 이를 웹어플리케이션으로 개발하기 위해서 기술을 검토하던때였습니다. 그래서 당시 COM 이라고 하는 (또는 ActiveX의 서버버전 정도로 생각하셔도 됩니다만 엄밀히 말하면 다르죠.) 기술에 대해서 공부를 하고 이리저리 만져보고 있던 시절입니다. 간단히 말하면 유닉스에서 개발된 C++ 라이브러리를 COM 컴포넌트로 래핑을 해서 서버에 등록해서 MS 웹서버인 ASP에서 사용할 수 있게 만들려고 한 것이죠. 결론만 말하면 실패! 이유는 싱글 프로세스 , 싱글 쓰레드로 구현된 C++ 라이브러리를 멀티쓰레드 환경에서 사용하게 되면서 성능상의 문제, 락킹 문제가 발생하면서 웹에서 적절하게 사용할 수 있지 않은 라이브러리가 된 것입니다.

이러한 기술적 한계가 있다는 결론을 얻는데 3개월이라는 시간이 걸렸었죠. 정작 하고 싶은 얘기는 이제부터입니다. 그 이후 자바기반으로 새로이 웹어플리케이션으로 개발했다고 들었습니다. 각설하고 , 최근들어 NoSQL 이라는 것에 대해서 주위에서 많은 얘기들을 하고 있습니다. 앞서 제가 10여년전 얘기를 들먹거린 이유가 여기에 있습니다. 다만 NoSQL 선택을 할 때 고려해야 할 점 몇가지를 정리하고자 합니다. 아 … 오늘은 본론에 들어가기도 전에 정말 말이 많군요. 1. 그전에 NoSQL 에 대해서 간단히 정리하고 넘어갈까요? 한마디로 관계형 데이터 모델을 사용하지 않고 SQL 을 사용하지 않는 그 이외의 모든 데이터 베이스 시스템 또는 데이터 스토어를 일컬어 NoSQL 이라 칭하게 된 것이죠. 그간에는 수십년간 관계형 데이터베이스라는 것이 데이터를 저장하는데 최적이라고 믿고 있었고 기업 시장에서는 ACID 라는 데이터의 무결성이라는 점에 더 무게를 두었고 무엇보다도 SQL 이라고 하는 언어의 편이성 때문인지 나머지 데이터베이스 시스템들은 그간 주목을 못받아 왔다고 생각하시면 될 것 같습니다. Business Analytics & Business Intelligence Software. 김태연의 스토리보드. 리비젼 CRM ( cafe.daum.net/revisioncrm ) Big Data, Unstructured Information Analysis is More Than Sentiment.

What started many years ago as a driver for a new generation of storage devices, the topic of Big Data is turning mainstream, having made nearly every list of “trends for 2012.” Continued media attention and buzz is making what Big Data actually is more clear. The challenge, is how get value from it. Compared with other trends that fizzled out over time or remained more academic phenomena than anything else (i.e. the Semantic Web), I believe that Big Data is for real: it really can give companies a tremendous opportunity to leverage their data for better business insight through analytics.

The catch is knowing how to use it. More than structured information stored neatly in rows and columns, Big Data actually comes in complex, unstructured formats, everything from web sites, social media and email, to videos, presentations, etc. On this point, the learning curve for most organizations is quite steep. Connect: Authored by: Luca Scagliarini See complete profile. Teradata Magazine Online | Article | Big Data.