빅데이터 분석 도구
넓은 의미: 빅데이터 처리를 목적으로 하는 소프트웨어
좁은 의미: 구체화 업무에 적용되는 통계분석, 시각화, 구조 분석등 기타 특정 분석을 위한 솔루션
등장 배경: 테라바이트급(TB) 이상의 대용량 데이터 처리를 위해
가치 사슬 측면 - 데이터 관리
방대한 양의 빅데이터 부하를 처리할 수 있는 소프트 아키텍처
하둡, 스파크 같은 오픈소스 시스템
데이터베이스 처리 시스템 등 미들웨어 군에 속하는 제품들이 해당
-분산 컴퓨팅
분산 시스템을 연구하는 컴퓨터 사이언스의 한 분야
CPU들을 네트워크로 상호간 연결
전체 작업의 할당 리소스를 분할해서 더 빠르게 처리하는 방식
-병렬 컴퓨팅
다수의 컴퓨터 디바이스로 하나 혹은 그 이상의 작업 할당
한번에 더 많은 연산 처리 가능
더욱 더 신속한 연산 처리 가능
-스토리지 관리
시스템의 리소스 및 하드웨어를 관리하는데 필요한 모든 프로세스
안정성 및 보안성을 확보하고 비용, 성능, 용량 사이 최적의 균형을 추구
-데이터 통합
서로 다른 소스에 있는 데이터를 데이터베이스 형태로 통합
빅데이터와 기존 데이터 간의 상호 공유가 필요해짐에 중요성이 대두
정형(테이블 형태) 및 비정형 데이터를 스키마(특히 실시간 데이터 처리에서 중요)에 따라서 처리
-데이터 분석
대용량 데이터 대상
통계분석, 검색, 마이닝, 시각화 솔루션 (R, SPSS, TABLEAU: 데이터 시각화 솔루션)
=통계분석
데이터 수집 후 적절한 통계 기법을 활용하여 의사결정을 내리는 과정
회귀 분석, 빈도 분석, 평균 분석, 연관 분석 등이 있음
=데이터 마이닝
데이터의 속성을 분석하여 가치 있는 정보를 추출하는 과정
EDA, 다변량 분석, 시계열 분석 등 방법론 존재
=데이터 시각화 : 부석 결솨를 시각적으로 표현하고 전달하는 프로세스
애플리케이션: 실제로 적용되는 산업이나 활동 분야, 구체화된 업무에서 활용할 수 있는 소프트웨어 (UI /UX)
빅데이터 분석 도구 가치 사슬 측면 정리
데이터 관리 | 분산 및 병렬 컴퓨팅 시스템, 스토리지 관리, 데이터 통합, SQL (관계형 데이터베이스)시스템과 같은 인프라 소프트웨어 |
데이터 분석 | 데이터 자체를 대상으로 하는 검색, 마이닝, 통계분석, 시각화 솔루션 |
애플리케이션 | 산업 또는 활동 영역에 적용되는 소프트웨어 |
코딩 VS 노코딩 분석 도구
코딩 분석 도구 | 노 코딩 분석 도구 |
프로그래밍 언어가 필요 | 필요X |
언어 습득 난이도가 높아 진입 장벽이 높음 | 쉽고 간단히 분석 가능 |
수정 및 유지 보수가 간단하고 넓은 범용성을 지님 | 플랫폼 내에 귀속되어서 확정성이나 연결성이 떨어짐 |
Open source vs Closed source
Open source 분석 도구 | Closed source 분석도구 |
소스 코드가 공개된 소프트웨어 | 소스 코드가 공개되지 않는 소프트웨어 |
누구나 자유로운 확인, 수정, 배포 가능 | 확인, 수정, 배포에 제한이 있음 |
파이어폭스, 안드로이드, 리눅스 등 존재 | 윈도우, 어도비, MS오피스 등 존재 |
빅데이터 분석 솔루션
분석 도구를 활용하여 제공하는 특정 문제에 대한 해결책을 의미
일반적으로 패키지 단위의 분석 솔루션을 지원하며, 비용이 높음
'빅데이터 분석' 카테고리의 다른 글
코딩 분석 도구 (0) | 2023.07.23 |
---|---|
노코딩 분석 도구 (0) | 2023.07.23 |
해외 빅데이터 활용 사례 (0) | 2023.07.23 |
국내 빅데이터 활용 사례 (0) | 2023.07.23 |
빅데이터 분석 프로세스 (0) | 2023.07.23 |