대체 데이터 스토리지 도구를 지적하고 오래된 관계형 데이터베이스 대신 사용해야하는 이유를 설명해 주시겠습니까? 제 생각에 대부분의 응용 프로그램은 SQL의 완전한 기능을 거의 사용하지 않습니다.
답변
파일 시스템의 일반 텍스트 파일
- 작성 및 편집이 매우 간단
- 사용자가 간단한 도구 (예 : 텍스트 편집기, grep 등)로 쉽게 조작 할 수 있습니다.
- 이진 문서의 효율적인 저장
디스크의 XML 또는 JSON 파일
- 위와 같지만 구조를 검증 할 수있는 능력이 조금 더 있습니다.
스프레드 시트 / CSV 파일
- 비즈니스 사용자가 이해하기 매우 쉬운 모델
Subversion (또는 유사한 디스크 기반 버전 제어 시스템)
- 데이터 버전 관리에 대한 매우 좋은 지원
버클리 DB (기본적으로 디스크 기반 해시 테이블)
- 개념적으로 매우 간단합니다 (입력되지 않은 키 / 값).
- 꽤 빠른
- 관리 오버 헤드 없음
- 내가 믿는 거래를 지원합니다
- 내가 생각하는 버클리 DB와 매우 유사하지만 호스팅
- 호스팅 및 확장 성
- 문서 별 키-값 스토리지 (즉, 유연한 데이터 모델)
- 문서 초점
- 반 구조 / 문서 기반 데이터의 간단한 저장
모국어 모음 (메모리에 저장되거나 디스크에 직렬화 됨)
- 매우 엄격한 언어 통합
맞춤형 (손으로 쓴) 스토리지 엔진
- 필요한 사용 사례에서 잠재적으로 매우 높은 성능
나는 그들에 대해 아무것도 알지 못한다고 주장 할 수는 없지만 객체 데이터베이스 시스템 을 살펴볼 수도 있습니다 .
답변
Matt Sheppard의 대답은 훌륭하지만 (변신) 스핀들에 대해 생각할 때 다음 요소를 고려할 것입니다.
- 구조 : 분명히 조각으로 나뉘어 있습니까, 아니면 절충하고 있습니까?
- 사용법 : 데이터는 어떻게 분석 / 검색 / 그로 킹됩니까?
- 수명 : 데이터가 얼마나 오래 유용합니까?
- 크기 : 얼마나 많은 데이터가 있습니까?
RDBMS에 비해 CSV 파일의 특별한 장점 중 하나는 압축하고 쉽게 다른 시스템으로 이동할 수 있다는 것입니다. 우리는 큰 데이터 전송을 수행하며 모든 것이 간단하여 하나의 큰 CSV 파일 만 사용하고 rsync와 같은 도구를 사용하여 쉽게 스크립트를 작성할 수 있습니다. 큰 CSV 파일에서 반복을 줄이려면 YAML 과 같은 것을 사용할 수 있습니다 . 중요한 관계 요구 사항이 없으면 JSON 또는 XML과 같은 것을 저장할지 확실하지 않습니다.
언급되지 않은 대안으로는 MapReduce의 오픈 소스 구현 인 Hadoop을 할인하지 마십시오 . 분석해야하는 느슨하게 구조화 된 데이터의 톤이 있고 데이터 처리를 처리 할 시스템을 10 개만 추가 할 수있는 시나리오를 원한다면이 방법이 효과적입니다.
예를 들어, 나는 약 20 대의 컴퓨터에 걸쳐 기록 된 서로 다른 기능의 모든 타이밍 번호 인 성능을 분석하기 시작했습니다. RDBMS에서 모든 것을 고수하려고 시도한 후에는 데이터를 집계 한 후 다시 쿼리 할 필요가 없다는 것을 깨달았습니다. 그리고 그것은 나에게 집계 된 형식에서만 유용합니다. 따라서 로그 파일을 압축하여 압축 한 다음 집계 된 데이터를 DB에 그대로 둡니다.
참고 “큰”크기로 생각하는 데 더 익숙합니다.
답변
파일 시스템의 prety는 이진 데이터를 저장하는 데 편리하며 관계형 데이터베이스에서는 결코 훌륭하게 작동하지 않습니다.
답변
Prevayler를 사용해보십시오.
http://www.prevayler.org/wiki/
Prevayler는 RDBMS의 대안입니다. 이 사이트에는 더 많은 정보가 있습니다.
답변
ACID 가 필요하지 않은 경우 RDBMS의 오버 헤드가 필요하지 않을 수 있습니다. 따라서 먼저 필요한지 결정하십시오. 여기에 제공된 대부분의 비 DBMS 답변 은 ACID를 제공 하지 않습니다 .
답변
맞춤형 (손으로 쓴) 스토리지 엔진 / 필요한 사용 사례에서 잠재적으로 매우 높은 성능
막대한 데이터 세트가있는 경우 직접 롤링하는 대신 계층 데이터 형식 인 HDF를 사용할 수 있습니다.
http://en.wikipedia.org/wiki/Hierarchical_Data_Format :
HDF는 다차원 배열, 래스터 이미지 및 테이블을 포함하여 여러 가지 다른 데이터 모델을 지원합니다.
파일 시스템과 같이 계층 적이지만 데이터는 하나의 마법 이진 파일에 저장됩니다.
HDF5는 매우 크고 복잡한 데이터 수집을 관리 할 수있는 제품군입니다.
페타 바이트의 NASA / JPL 원격 감지 데이터를 생각하십시오.
답변
G’day,
내가 생각할 수있는 한 가지 경우는 모델링하는 데이터를 관계형 데이터베이스에 쉽게 나타낼 수없는 경우입니다.
일단 그러한 예는 이동 전화 사업자들이 이동 전화 네트워크를위한 기지국을 모니터링 및 제어하기 위해 사용하는 데이터베이스이다.
나는 거의 모든 경우에, OO DB 가 상업적 제품이거나 객체의 계층 구조를 허용하는 자체 롤링 시스템으로 사용된다.
나는 이름이 남지 않지만 로고가 적포도주 얼룩 (-:) 인 대기업을위한 3G 모니터링 응용 프로그램을 개발했으며, 이러한 OO DB를 사용하여 회로망.
이러한 DB에 대한 조사는 일반적으로 SQL이 전혀없는 독점 기술을 사용하여 수행됩니다.
HTH.
건배,
롭