您当前所在位置:首页 > 论文 > 计算机论文 > 计算机数据库

探析NoSQL数据库能力和运用

编辑:

2014-11-04

1.2国内外研究现状

NoSQL数据库最早可追溯到1991年Berkeley DB的第一版Berkeley DB是一个键值存储(Key-value Store)的Hash数据库,适用于数据类型相对简单但需要极高的插入和读取速度的嵌入式场合。NoSQL从2007年开始蓬勃发展。Google和Amazon的工程师们分别发表了有关BigTable和Dynamo数据库的论文,描述他们己经在使用的新型数据库的设计思想。BigTable提出了列存储模型,证明了数据持久存储可以扩展到数以千计的节点Dynam。则提出了最终一致性的思想以达到更高的可用性和扩展性。分布式缓存系统Memcached证明了内存分布式数据存储可以达到极高的性能。事实上,Google的BigTable, Amazon的Dynamo和分布式缓存系统Memcached这三者可以说是所有NoSQL数据库的启蒙者。很多公司和组织受到他们思想观点的启发,开发了自己的开源 NoSQL数据库产品,例如Hypertable就是BigTable思想的开源实现。

现如今,国外的NoSQL数据库品种己经超过100个。除了Google的BigTable,Amazon的Dynamo,主流的数据库还有FaceBook的Cassandra,  lOgen的MongoDB, Amazon的SimpleDB, Apache的HBase, Redis, CouchDB, Tokyo Cabinet/Tyrant, MemcacheDB等等。这些数据库在互联网中应用广泛,表现优异。Cassandra的用户包括Twitter, Cisco, Urban等多个公司,已知最大的Cassandra集群有超过400个节点,存储数据量超越300TB,最受欢迎的MongoDB数据库在电子商务、政府、数据存储、实时统计、社交网络、游戏等众多领域都应用广泛,其中著名的有github, sourceforge, Disney等,国内的淘宝网、大众点评和视觉中国也在使用。

第二章 NoSQL技术................. 13-22

2.1 NoSQL概念.................. 13-15

2.2 数据模型.................. 15-16

2.2.1 基于Key值的.................. 15-16

2.2.2 图结构数据..................16

2.3 数据可靠性.................. 16-17

2.3.1 单机可靠性.................. 16

2.3.2 多机可靠性.................. 16-17

2.4 分布式扩展.................. 17-19

2.4.1 哈希分区.................. 17-18

2.4.2 范围分区.................. 18-19

2.4.3 分区策略..................19

2.5 MongoDB简介.................. 19-21

2.5.1 MongoDB的.................. 20

2.5.2 MongoDB的分布.................. 20

2.5.3 MongoDB的复制.................. 20-21

2.5.4 MongoDB的查询.................. 21

2.5.5 MongoDB的应用.................. 21

2.6 本章小结.................. 21-22

第三章 存储机制.................. 22-34

3.1 数据模型.................. 22-25

3.1.1 逻辑模型.................. 22-23

3.1.2 物理模型.................. 23-25

3.2 GridFS文件..................25

3.3 存储架构.................. 25-28

3.4 反范式模式.................. 28-33

3.4.1 理论研究.................. 28-29

3.4.2 实例分析.................. 29-33

3.5 BSON存储.................. 33

3.6 本章小结.................. 33-34

第四章 分布式存储机制.................. 34-46

4.1 自动分片机制.................. 34-37

4.1.1 分区算法.................. 34-35

4.1.2 负载均衡.................. 35-37

4.2 复制集技.................. 37-40

4.2.1 数据同步.................. 37-38

4.2.2 主节点选举.................. 38-39

4.2.3 应用设置.................. 39-40

免责声明

精品学习网(51edu.com)在建设过程中引用了互联网上的一些信息资源并对有明确来源的信息注明了出处,版权归原作者及原网站所有,如果您对本站信息资源版权的归属问题存有异议,请您致信qinquan#51edu.com(将#换成@),我们会立即做出答复并及时解决。如果您认为本站有侵犯您权益的行为,请通知我们,我们一定根据实际情况及时处理。