하둡1 Introduction to Hadoop Apache HADOOP은 분산 컴퓨팅 환경에서 실행되는 데이터 처리 애플리케이션을 개발하는 데 사용되는 프레임워크입니다. 개인용 컴퓨터 시스템의 로컬 파일 시스템에 상주하는 데이터와 유사하게, 하둡에서 데이터는 분산 파일(Distributed File)이라고 불리우는 분산 파일 시스템에 상주합니다 프로세싱 모델은 (특이하게도) 빅데이터/분산처리를 위한 연산 로직이 데이터를 포함하는 클러스터 노드(서버)로 전송되어 그 서버에서 동작하게됩니다. 이러한(분산 처리되는) 컴퓨팅 로직은 Java와 같은 고급 언어로 작성된 프로그램의 컴파일된 버전의 소프트웨어일 뿐입니다. 이러한 프로그램은 Hadoop HDFS에 저장된 데이터를 처리합니다. HADOOP은 오픈 소스 기반의 소프트웨어 프레임워크입니다. HADOOP.. 2023. 10. 9. 이전 1 다음