MapReduce
정리중 2011.12.14 MapReduce는 구글이 2004년에 클러스터 환경의 큰 데이터셋의 분산 컴퓨팅을 지원하기 위해 구현한 Software 프레임워크이다. MapReduce 라이브러리는 C++, C#, Erlang, Java, LabVIEW, OCaml, Perl, Python, PHP, Ruby, F#, R 등의 언어로 사용할 수 있다. MapReduce는 많은 컴퓨터(Nodes)를 사용하여 거대한 데이터셋간 고 분산 처리 프레임워크이다. 다시 말하면 클러스터(모든 노드가 같은 하드웨어인 경우) 또는 Grid(노드가 다른 하드위어를 사용)를 말하는 것이다. 프로세스는 비정형적인 파일시스템이나 구조적인 데이터베이터에 데이터를 저장 관리할 수 있다. Map : Master 노드는 입력 Proble..
더보기