하둡 프로그래밍(4) – 빅데이터 – HDFS 하둡 분산 파일 시스템(1)

  1. HDFS HDFS(Hadoop Distributed File System) 는 수십 테라 또는 페타바이트 이상의 대용량 파일을 분산된 서버에 저장하고, 많은 클라이언트가 저장된 데이터를 빠르게 처리할 수 있게 설계된 파일 시스템 입니다. HDFS 와 기존의 대용량 파일시스템의 큰 차이점은 HDFS는 저사양 서버를…

하둡 프로그래밍(2) – 빅데이터 – 하둡 에코시스템

  1. 하둡 에코시스템 하둡은 비지니스에 효율적으로 적용할 수 있게 다양한 서브 프로젝트를 제공합니다 이러한 서브 프로젝트가 상용화되면서 하둡 에코시스템(Hadoop Ecosystem)이 구성됐습니다. 이러한 하둡 에코시스템은 하둡 생태계라고 표현 하기도 합니다. 분산 데이터를 저장하는 HDFS와 분석 데이터를 처리하는 맵리듀스가 하둡 코어…

하둡 프로그래밍(1) – 빅데이터

  1. 빅데이터란 2012년 가트너 그룹은 주목해야 할 IT 기술로 빅데이터 를 선정, IDC 는 2012년이 빅데이터의 해가 될 것 이라고 하였습니다. 그 이후로도 빅데이터 그리고 관련된 기술에 대해서 트랜드가 될 것이다 라던지 향후 유망기술로 매해 ,매번 언급이 되어져 왔고 지금도…