数据库 2023-06-27

浅析nosql在评论数据库设计中的应用 (评论数据库设计 nosql)

浅析NoSQL在评论数据库设计中的应用

随着互联网技术的发展，互联网已逐渐成为人们生活中不可或缺的一部分。在这个互联网时代，各种社交应用、电子商务网站、新闻网站、直播平台等应用纷纷出现。这些应用中必不可少的一个功能就是评论系统。评论系统可以让用户在信息传递的同时，也可以更好地互动和交流。随着评论功能的普及，评论数据库的设计也逐渐成为了开发人员需要考虑的问题之一。在评论数据库的设计中，NoSQL数据库相比于传统的关系型数据库，具有更好的特点和优势，本文将从 NoSQL 在评论数据库设计中的应用方面进行探讨。

1. NoSQL 数据库的简介

NoSQL（Not only SQL），指的是非关系型数据库。相对于关系型数据库，NoSQL 数据库具有存储海量数据、高并发访问、支持分布式等多种优点。NoSQL 数据库常常以键值对的方式进行数据存储，同时也支持文档型、列族型、图型等多种数据存储形式。NoSQL 数据库的种类有多种，包括 MongoDB、Redis、Cassandra、Couchbase 等等。

2. 传统关系型数据库的不足之处

在传统的关系型数据库中，表之间的关系必须要通过外键和主键的方式进行关联。当数据表之间的关系比较复杂时，通过关系型数据库进行数据存储和查询，需要的时间和计算成本也会更高。对于一些需要对数据进行实时处理和查询的应用场景，关系型数据库的能力也无法满足需求。此外，当数据库中存放的数据量过大时，关系型数据库也无法满足高效存储和访问数据的需求，会出现数据库性能下降、响应时间变慢等种种问题。

3. NoSQL 数据库在评论系统设计中的应用

NoSQL 数据库在评论系统的设计中具有很多自身的优势。下面将从以下几个方面进行具体的展开：

3.1 数据库的高性能

评论系统具有高峰期的访问，当有大量用户同时访问系统时，需要数据库能够快速地响应、稳定地输出结果。这就需要数据库具有足够的高性能。相比于传统的关系型数据库，NoSQL 数据库的查询速度更快，同时也可以更好地支持并发访问，能够更好地应对高并发请求。

3.2 数据库的数据模型

NoSQL 数据库支持多种数据模型，包括文档型、键值型、列族型等多种形式，因此在设计评论系统时根据具体应用场景选择相适应的数据模型是很重要的。例如，如果数据的存储方式比较复杂，可以使用文档型数据库，如果是kv型数据，则可以使用Redis数据库，如果数据量巨大，则可以考虑使用列族型数据库。NoSQL 数据库具象化数据库设计，同时也更加符合应用具体的需求。

3.3 数据库的水平扩展

当评论系统需要进行横向扩展时，NoSQL 的水平扩展特点就显得很重要了。NoSQL 数据库支持分布式数据库和数据共享，可以实现系统的多点部署，扩展比较简单，并能够更好地应对数据量的增长和应用负载的变化。

4. NoSQL 在评论系统中的实际应用场景

以博客系统中的评论系统为例：评论系统设计通常包含两个核心表，一个是评论表，另一个是子评论表，分别存储主评论和子评论。评论表的字段一般包含：评论 ID、父评 ID、文章 ID、评论人、评论内容、评论时间、点赞数等。子评论表的字段包含的比较少，但很多字段与父评论表相似或者完全一样。

对于评论表的设计，可以采用文档型数据库 MongoDB 进行存储。一个主评论和所有其相关的子评论可以组成一个文档，而所有的评论可以根据评论的 ID 进行索引和查询。

对于子评论的设计，可以选择 KV 型的 Redis 数据库进行存储，由于子评论信息量较小的特点，便可以存储于 Redis 中。Redis 存储子评论信息，博客的主评论就可以通过 MongoDB 进行存储。这样设计具有很好的性能和可扩展性。

随着互联网应用的扩展，评论系统的设计也越来越受到开发者们的关注。NoSQL 数据库的优势不仅具有高性能、低成本，而且还具有数据模型灵活、水平扩展等优点。采用 NoSQL 数据库对传统关系型数据库进行收束，在评论系统的设计中将具有更优于传统关系型数据库的表现。因此，在实践中引入 NoSQL 数据库技术进行评论数据库的设计，将会给开发者带来更大的便利和提高数据库的性能。

相关问题拓展阅读：

什么是New SQL?分析NewSQL是如何融合NoSQL和RDBMS两者的优势
nosql数据库是什么具有代表性以key-value的形式存储的

什么是New SQL?分析NewSQL是如何融合NoSQL和RDBMS两者的优势

NewSQL是对一类现代

关系型数据库

的统称，这类数据库对于一般的OLTP读写请求提供可横向扩展的性能，同时支持事务的ACID保证。这些系统既拥有NoSQL数据库的扩展性，又保持传统数据库的事务特性。NewSQL重新将“

应用程序

逻辑与数据操作逻辑应该分离”的理念带回到现代数据库的世界，这也验证了历史的发展总是呈现出螺旋上升的形式。

在21世纪00年代中，出现了许多数据仓库系统 (如 Vertica，Greeplum 和AsterData)，这些以处理OLAP 请求为设计目标的系统并不在本文定义的NewSQL范围内。OLAP 数据库更关注针对

海量数据

的灶皮大型、复杂、只读的查询，查询时间可能持续秒级、分钟级甚至更长。

NoSQL的

拥趸

普遍认为阻碍传统数据库横向扩容亏脊、提高可用性的原因在于ACID保证和

关系模型

，因此NoSQL运动的核心就是放弃事务强一致性以及关系模型，拥抱最终一致性和其它

数据模型

(如 key/value，graphs 和Documents)。销辩渗

两个最著名的NoSQL数据库就是Google的BigTable和Amazon的Dynamo，由于二者都未开源，其它组织就开始推出类似的开源替代项目，包括Facebook的 Cassandra (基于BigTable和Dynamo)、PowerSet的 Hbase(基于BigTable)。有一些创业公司也加入到这场NoSQL运动中，它们不一定是受BigTable和Dynamo的启发，但都响应了NoSQL的哲学，其中最出名的就是MongoDB。

在21世纪00年代末，市面上已经有许多供用户选择的

分布式数据库

产品。使用NoSQL的优势在于应用开发者可以更关注应用逻辑本身，而非数据库的扩展性问题；但与此同时许多应用，如金融系统、订单处理系统，由于无法放弃事务的一致性要求被拒之门外。

一些组织，如Google，已经发现他们的许多工程师将过多的精力放在处理数据一致性上，这既暴露了数据库的抽象、又提高了代码的复杂度，这时候要么选择回到传统DBMS时代，用更高的机器配置纵向扩容，要么选择回到

中间件

时代，开发支持

分布式事务

的中间件。这两种方案成本都很高，于是NewSQL运动开始酝酿。

NewSQL数据库设计针对的读写事务有以下特点：

1、耗时短。

2、使用索引查询，涉及少量数据。

3、重复度高，通常使用相同的查询语句和不同的查询参考。

也有一些学者认为NewSQL系统是特指实现上使用Lock-free并发控制技术和share-nothing架构的数据库。所有我们认为是NewSQL的

数据库系统

确实都有这样的特点。

nosql数据库是什么具有代表性以key-value的形式存储的

什么是NoSQL

　　大家有没有听说过“NoSQL”呢?近年，这个词极受关注。看到“NoSQL”这个词，大家可能会误以为是“No!SQL”的缩写，并深感愤怒：“SQL怎么会没有必要了呢?”但实际上，它是“Not Only SQL”的缩写。它的意义是：适用关系型数据库的时候就使用关系型数据库，不适用的时候也没有必要非使用关系型数据库不可，可以考虑使用枣游更加合适的数据存储。

　　为弥补关系型数据库的不足，各种各样的NoSQL数据库应运而生。

　　为了更好地了解本书所介绍的NoSQL数据库，对关系型数据库的理解是必不可少的。那么，就让我们先来看一看关系型数据库的历史、分类和特征吧。

　　关系型数据库简史

　　1969年，埃德加?6?1弗兰克?6?1科德(Edgar Frank Codd)发表了划时代的论文，首次提出了关系数据模型的概念。但可惜的是，刊登论文的《IBM Research Report》只是IBM公司的内部刊物，因此论文反响平平。1970年，他再次在刊物《Communication of the ACM》上发表了题为“A Relational Model of Data for Large Shared Data banks”(大型共享数据库的关系模型)的论文，终于引起了大家的关注。

　　科德所提出的关系数据模型的概念成为了现今关系型数据库的基础。当时的关系型数据库由于硬件性能低劣、处理速度过慢而迟迟没有得到实际应用。但之后随着硬件性能的提升，加之使用简单、性能优越等优点，关系型数据库得到了广泛的应用。

　　通用性及高性能

　　虽然本书是讲解NoSQL数据库的，但有一个重要的大前提，请大家一定不要误激键解。这个大前提就是“关系型数据库的性能绝对不低，它具有非常好的通用性和非常高的性能”。毫无疑问，对于绝大多数的应用来说它都是最有效的解决方案。

　　突出的优势

　　关系型数据库作为应用广泛的通用型数据库，它的突出优势主要有以下几点:

　　保持数据的一致性(事务处理)

　　由于以标准化为前提，数据更新的开销很小(相同的字段基本上都只有一处)

　　可以进行JOIN等复杂查询

　　存在很多明岩巧实际成果和专业技术信息(成熟的技术)

　　这其中，能够保持数据的一致性是关系型数据库的更大优势。在需要严格保证数据一致性和处理完整性的情况下，用关系型数据库是肯定没有错的。但是有些情况不需要JOIN，对上述关系型数据库的优点也没有什么特别需要，这时似乎也就没有必要拘泥于关系型数据库了。

　　关系型数据库的不足

　　不擅长的处理

　　就像之前提到的那样，关系型数据库的性能非常高。但是它毕竟是一个通用型的数据库，并不能完全适应所有的用途。具体来说它并不擅长以下处理：

　　大量数据的写入处理

　　为有数据更新的表做索引或表结构(schema)变更

　　字段不固定时应用

　　对简单查询需要快速返回结果的处理

　　。。。。。。

　　NoSQL数据库

　　为了弥补关系型数据库的不足(特别是最近几年)，NoSQL数据库出现了。关系型数据库应用广泛，能进行事务处理和JOIN等复杂处理。相对地，NoSQL数据库只应用在特定领域，基本上不进行复杂的处理，但它恰恰弥补了之前所列举的关系型数据库的不足之处。

　　易于数据的分散

　　如前所述，关系型数据库并不擅长大量数据的写入处理。原本关系型数据库就是以JOIN为前提的，就是说，各个数据之间存在关联是关系型数据库得名的主要原因。为了进行JOIN处理，关系型数据库不得不把数据存储在同一个服务器内，这不利于数据的分散。相反，NoSQL数据库原本就不支持JOIN处理，各个数据都是独立设计的，很容易把数据分散到多个服务器上。由于数据被分散到了多个服务器上，减少了每个服务器上的数据量，即使要进行大量数据的写入操作，处理起来也更加容易。同理，数据的读入操作当然也同样容易。

　　提升性能和增大规模

　　下面说一点题外话，如果想要使服务器能够轻松地处理更大量的数据，那么只有两个选择：一是提升性能，二是增大规模。下面我们来整理一下这两者的不同。

　　首先，提升性能指的就是通过提升现行服务器自身的性能来提高处理能力。这是非常简单的方法，程序方面也不需要进行变更，但需要一些费用。若要购买性能翻倍的服务器，需要花费的资金往往不只是原来的2倍，可能需要多达5到10倍。这种方法虽然简单，但是成本较高。

　　另一方面，增大规模指的是使用多台廉价的服务器来提高处理能力。它需要对程序进行变更，但由于使用廉价的服务器，可以控制成本。另外，以后只要依葫芦画瓢增加廉价服务器的数量就可以了。

　　不对大量数据进行处理的话就没有使用的必要吗？

　　NoSQL数据库基本上来说为了“使大量数据的写入处理更加容易(让增加服务器数量更容易)”而设计的。但如果不是对大量数据进行操作的话，NoSQL数据库的应用就没有意义吗?

　　答案是否定的。的确，它在处理大量数据方面很有优势。但实际上NoSQL数据库还有各种各样的特点，如果能够恰当地利用这些特点将会是非常有帮助。具体的例子将会在第2章和第3章进行介绍，这些用途将会让你感受到利用NoSQL的好处。

　　希望顺畅地对数据进行缓存(Cache)处理

　　希望对数组类型的数据进行高速处理

　　希望进行全部保存

　　多样的NoSQL数据库

　　NoSQL数据库存在着“key-value存储”、“文档型数据库”、“列存储数据库”等各种各样的种类，每种数据库又包含各自的特点。下一节让我们一起来了解一下NoSQL数据库的种类和特点。

　　NoSQL数据库是什么

　　NoSQL说起来简单，但实际上到底有多少种呢?我在提笔的时候，到NoSQL的官方网站上确认了一下，竟然已经有122种了。另外官方网站上也介绍了本书没有涉及到的图形数据库和对象数据库等各个类别。不知不觉间，原来已经出现了这么多的NoSQL数据库啊。

　　本节将为大家介绍具有代表性的NoSQL数据库。

　　key-value存储

　　这是最常见的NoSQL数据库，它的数据是以key-value的形式存储的。虽然它的处理速度非常快，但是基本上只能通过key的完全一致查询获取数据。根据数据的保存方式可以分为临时性、永久性和两者兼具三种。

　　临时性

　　memcached属于这种类型。所谓临时性就是 “数据有可能丢失”的意思。memcached把所有数据都保存在内存中，这样保存和读取的速度非常快，但是当memcached停止的时候，数据就不存在了。由于数据保存在内存中，所以无法操作超出内存容量的数据(旧数据会丢失)。

　　在内存中保存数据

　　可以进行非常快速的保存和读取处理

　　数据有可能丢失

　　永久性

　　Tokyo Tyrant、Flare、ROMA等属于这种类型。和临时性相反，所谓永久性就是“数据不会丢失”的意思。这里的key-value存储不像memcached那样在内存中保存数据，而是把数据保存在硬盘上。与memcached在内存中处理数据比起来，由于必然要发生对硬盘的IO操作，所以性能上还是有差距的。但数据不会丢失是它更大的优势。

　　在硬盘上保存数据

　　可以进行非常快速的保存和读取处理(但无法与memcached相比)

　　数据不会丢失

　　两者兼具

　　Redis属于这种类型。Redis有些特殊，临时性和永久性兼具，且了临时性key-value存储和永久性key-value存储的优点。Redis首先把数据保存到内存中，在满足特定条件(默认是15分钟一次以上，5分钟内10个以上，1分钟内10000个以上的key发生变更)的时候将数据写入到硬盘中。这样既确保了内存中数据的处理速度，又可以通过写入硬盘来保证数据的永久性。这种类型的数据库特别适合于处理数组类型的数据。

　　同时在内存和硬盘上保存数据

　　可以进行非常快速的保存和读取处理

　　保存在硬盘上的数据不会消失(可以恢复)

　　适合于处理数组类型的数据

　　面向文档的数据库

　　MongoDB、CouchDB属于这种类型。它们属于NoSQL数据库，但与key-value存储相异。

　　不定义表结构

　　面向文档的数据库具有以下特征：即使不定义表结构，也可以像定义了表结构一样使用。关系型数据库在变更表结构时比较费事，而且为了保持一致性还需修改程序。然而NoSQL数据库则可省去这些麻烦(通常程序都是正确的)，确实是方便快捷。

　　可以使用复杂的查询条件

　　跟key-value存储不同的是，面向文档的数据库可以通过复杂的查询条件来获取数据。虽然不具备事务处理和JOIN这些关系型数据库所具有的处理能力，但除此以外的其他处理基本上都能实现。这是非常容易使用的NoSQL数据库。

　　不需要定义表结构

　　可以利用复杂的查询条件

　　面向列的数据库

　　Cassandra、Hbase、HyperTable属于这种类型。由于近年来数据量出现爆发性增长，这种类型的NoSQL数据库尤其引人注目。

　　面向行的数据库和面向列的数据库

　　普通的关系型数据库都是以行为单位来存储数据的，擅长进行以行为单位的读入处理，比如特定条件数据的获取。因此，关系型数据库也被称为面向行的数据库。相反，面向列的数据库是以列为单位来存储数据的，擅长以列为单位读入数据。

　　高扩展性

　　面向列的数据库具有高扩展性，即使数据增加也不会降低相应的处理速度(特别是写入速度)，所以它主要应用于需要处理大量数据的情况。另外，利用面向列的数据库的优势，把它作为批处理程序的存储器来对大量数据进行更新也是非常有用的。但由于面向列的数据库跟现行数据库存储的思维方式有很大不同，应用起来十分困难。

　　高扩展性(特别是写入处理)

　　应用十分困难

　　最近，像Twitter和Facebook这样需要对大量数据进行更新和查询的网络服务不断增加，面向列的数据库的优势对其中一些服务是非常有用的，但是由于这与本书所要介绍的内容关系不大，就不进行详细介绍了。

　　总结：

　　NoSQL并不是No-SQL，而是指Not Only SQL。

　　NoSQL的出现是为了弥补SQL数据库因为事务等机制带来的对海量数据、高并发请求的处理的性能上的欠缺。

　　NoSQL不是为了替代SQL而出现的，它是一种替补方案，而不是解决方案的首选。

　　绝大多数的NoSQL产品都是基于大内存和高性能随机读写的（比如具有更高性能的固态硬盘阵列），一般的小型企业在选择NoSQL时一定要慎重！不要为了NoSQL而NoSQL，可能会导致花了冤枉钱又耽搁了项目进程。

　　NoSQL不是万能的，但在大型项目中，你往往需要它！

关于评论数据库设计 nosql的介绍到此就结束了，不知道你从中找到你需要的信息了吗？如果你还想了解更多这方面的信息，记得收藏关注本站。

数据运维技术 » 浅析nosql在评论数据库设计中的应用 (评论数据库设计 nosql)

分享到：

什么是New SQL?分析NewSQL是如何融合NoSQL和RDBMS两者的优势

nosql数据库是什么 具有代表性以key-value的形式存储的

相关推荐

nosql数据库是什么具有代表性以key-value的形式存储的