[핵심 답변]
관계형 데이터베이스(RDB)는 사전에 엄격하게 정의된 DB schema를 요구하는 table 기반 데이터 구조를 갖습니다.
NoSQL(비관계형 데이터베이스)은 table 형식이 아닌 비정형 데이터를 저장할 수 있도록 지원합니다.
RDB는 엄격한 schema로 인해 데이터 중복이 없기 때문에 데이터 update가 많을 때 유리합니다.
NoSQL의 경우 데이터 중복으로 인해 데이터 update 시 모든 컬렉션에서 수정이 필요하기 때문에 update가 적고 조회가 많을 때 유리합니다.
[면접
TIP]
RDB를 아직 많이 쓰고 있지만 점차 NoSQL를 도입하는 영역이 넓어지고 있습니다. 따라서 프로젝트마다 RDB vs NoSQL중에 더 유리한 것을 채택해서 사용해야 하는데, 이를 위해서는 장단점과 어떤 차이가 있는지를 명확히 알아야 합니다.
이 질문은 면접에서 꽤 자주 나오는 질문이기 때문에 면접 보기 전에 꼭 알고 가시기 바랍니다!
Key-value storage system ( NoSQL )
기존의 관계형 database의 경우에는 단일 기업의 데이터를 다루는데 최적화 되어 있습니다. 하지만 최신 데이터들은 꼭 관계형으로 처리될 필요가 없는 경우도 많고, 다뤄야 하는 데이터의 양도 훨씬 커졌습니다. 즉 Big data라고 일컬어 지는 많은 양의 데이터를를 처리하기 위한 방법으로 다양한 해결책이 나왔는데, 그 중 하나의 방법이 Key-value storage system 입니다.
Key-value stores는 NoSQL system이라고도 불립니다. 그 이유는 SQL을 보통 지원하지 않고 transaction을 지원하지 않는 등 SQL을 사용하는 기존의 RDB와의 차이점 때문입니다.
MongoDB
NoSQL의 종류는 Bigtable, DynamoDB, Cassandra, MongoDB등이 있습니다. 그 중 MongoBD의 예시를 보면서 NoSQL이 어떻게 작동하는지 간단하게 살펴보겠습니다.
db.createCollection("student")
db.student.insert({"id": 2022394, "name": "Nossi", "class": ["Math", "Eng"]})
db.student.insert({"id": 2021921, "name": "Bob", "class": ["Eng"]})
db.student.find() // Fetch all students in JSON format
db.student.findOne({"id": 2022394}) // Find one matching student
db.student.remove({"name": "Nossi"}) // Delete matching students
db.student.drop() // Drops the entire collection
SQL
복사
RDB vs NoSQL
RDB (SQL) | NoSQL | |
데이터 저장 모델 | table | json document / key-value / 그래프 등 |
개발 목적 | 데이터 중복 감소 | 애자일 / 확장가능성 / 수정가능성 |
예시 | Oracle, MySQL, PostgreSQL 등 | MongoDB, DynamoDB 등 |
Schema | 엄격한 데이터 구조 | 유연한 데이터 구조 |
- 명확한 데이터구조 보장
- 데이터 중복 없이 한 번만 저장 (무결성)
- 데이터 중복이 없어서 데이터 update 용이 | - 유연하고 자유로운 데이터 구조
- 새로운 필드 추가 자유로움
- 수평적 확장(scale out) 용이 | |
- 시스템이 커지면 Join문이 많은 복잡한 query가 필요
- 수평적 확장이 까다로워 비용이 큰 수직적 확장(Scale up)이 주로 사용됨.
- 데이터 구조가 유연하지 못함 | - 데이터 중복 발생 가능
- 중복 데이터가 많기 때문에 데이터 변경 시 모든 컬렉션에서 수정이 필요함
- 명확한 데이터구조 보장 X | |
- 데이터 구조가 변경될 여지가 없이 명확한 경우
- 데이터 update가 잦은 시스템 (중복 데이터가 없으므로 변경에 유리) | - 정확한 데이터 구조가 정해지지 않은 경우
- Update가 자주 이루어지지 않는 경우 (조회가 많은 경우)
- 데이터 양이 매우 많은 경우 (scale out 가능) |
수직적 확장Scale-up vs 수평적 확장 Scale-out
DB와 비교하여 NoSQL의 특징은 ACID, Transaction을 지원하지 않는다는 것입니다. RDB는 ACID와 Transaction을 보장하기 위해 수평적 확장이 쉽지가 않습니다. 또한 RDB 같은 경우에는 multiple server로 수평적 확장을 하게 되면 join을 하기 위해 굉장히 복잡한 과정이 필요합니다.
RDB도 수평적 확장이 가능하지만 NoSQL에 비해 훨씬 복잡합니다. RDB를 수평적 확장하려면 샤딩(sharding)(데이터가 수평적으로 분할되고 기기의 모음 전반에 걸쳐 분산되는 경우)이 필요합니다. ACID 준수를 유지하면서 RDB를 샤딩하는 것은 매우 까다로운 작업입니다.
[꼬꼬무 문답]
Q. Nosql은 언제 사용하면 좋을까요?
Q. RDB는 언제 사용하면 좋을까요?