MapReduce
정리중 2011.12.14 MapReduce는 구글이 2004년에 클러스터 환경의 큰 데이터셋의 분산 컴퓨팅을 지원하기 위해 구현한 Software 프레임워크이다. MapReduce 라이브러리는 C++, C#, Erlang, Java, LabVIEW, OCaml, Perl, Python, PHP, Ruby, F#, R 등의 언어로 사용할 수 있다. MapReduce는 많은 컴퓨터(Nodes)를 사용하여 거대한 데이터셋간 고 분산 처리 프레임워크이다. 다시 말하면 클러스터(모든 노드가 같은 하드웨어인 경우) 또는 Grid(노드가 다른 하드위어를 사용)를 말하는 것이다. 프로세스는 비정형적인 파일시스템이나 구조적인 데이터베이터에 데이터를 저장 관리할 수 있다. Map : Master 노드는 입력 Proble..
더보기
BSON
가.개요 BSON은 컴퓨터 데이터를 상호 교환하기 위한 양식이다. 이것은 간단한 구조화 결합된 배열을 나타내는 Binary 폼이다. BSON은 Binary JSON의 약어이다. 나.Data Type and Syntax BSON 문서(혹은 객체)는 element들의 리스트로 구성되어 있다. 각각의 Element는 field name, type, value로 구성되어 있다. field name은 문자열이다. type은 string, integer, double, date, byte array(binary), boolean(true/false), null, BSON object, BSON array 을 포함한다. 이는 JSON을 포함한다. (예를 들면, JSON은 byte array가 없다.). 그러나 길이 ..
더보기