一、MongoDB简介
1.概述
MongoDB是一个基于分布式文件存储的数据库,由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。
MongoDB介于关系型数据和非关系型数据库之间,是非关系数据库当中功能最丰富,最像关系数据库的。他支持的数据结构非常松散,类似json格式,因此可以存储比较复杂的数据类型。
MongoDB最大的特点是他支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,几乎可以实现类似关系数据库表单查询的绝大部分功能,而且还支持对数据建立索引。
2.和MySQL之间的区别
2.1MySQL
关系型数据库。 查询语句是使用传统的sql语句,拥有较为成熟的体系,成熟度很高。 关系型数据库遵循ACID规则 开源数据库的份额在不断增加,mysql的份额页在持续增长。 缺点:在海量数据处理的时候效率会显著变慢。
2.2MongoDB
非关系型数据库(nosql ),属于文档型数据库。先解释一下文档的数据库,即可以存放xml、json、bson类型系那个的数据。这些数据具备自述性(self-describing),呈现分层的树状数据结构。数据结构由键值(key=>value)对组成。 存储方式:虚拟内存+持久化。 查询语句:是独特的Mongodb的查询方式。 适合场景:事件的记录,内容管理或者博客平台等等。 数据处理:数据是存储在硬盘上的,只不过需要经常读取的数据会被加载到内存中,将数据存储在物理内存中,从而达到高速读写。 成熟度与广泛度:新兴数据库,成熟度较低,Nosql数据库中最为接近关系型数据库,比较完善的DB之一,适用人群不断在增长。 优势: 快速!在适量级的内存的Mongodb的性能是非常迅速的,它将热数据存储在物理内存中,使得热数据的读写变得十分快, 高扩展! 自身的Failover机制! json的存储格式!
2.3二者之间的区别
MySQLMongoDB解释databasedatabase数据库tablecollection数据表/集合row【一条记录,实体】document行/文档columnfield列/字段或者属性table join不支持表连接primary keyprimary key主键
解释
数据库:容器,不管是mysql还是mongodb,一个单一的服务器都可以管理多个数据库
集合:是一组mongodb的文件,等价于mysql中的table,集合中文档可以有不同的字段,也可以有不同的数据类型
文档:一组键值对,具有动态模式【不同的数据可以是不同的格式】
二、MongoDB安装和卸载
1.卸载
执行命令:
sudo apt-get autoremove mongodb
sudo apt-get autoclean mongodb
#清除残留数据
dpkg -l |grep ^rc|awk '{print $2}' |tr ["\n"] [" "]|sudo xargs dpkg -P
2.安装
第1步 – 导入公钥**
Ubuntu软件包管理器apt(高级软件包工具)需要软件分销商的GPG密钥来确保软件包的一致性和真实性。 执行此下面的命令将MongoDB密钥导入到您的服务器:
sudo apt-key adv --keyserver hkp://keyserver.ubuntu.com:80 --recv 2930ADAE8CAF5059EE73BB4B58712A2291FA4AD5
第2步 – 创建源列表文件MongoDB
检查URL http://repo.mongodb.org/apt/ubuntu/dists/。 如果您在该网页上看到一个目录“bionic”,则将下述命令中的单词“xenial”替换为“bionic”一词,【原因:MongoDB尚未发布Bionic Beaver软件包,但Xenial软件包在Ubuntu 18.04 LTS上运行良好】
执行以下命令在/etc/apt/sources.list.d/中创建一个MongoDB列表文件:
echo "deb http://repo.mongodb.org/apt/ubuntu xenial/mongodb-org/3.6 multiverse" | sudo tee /etc/apt/sources.list.d/mongodb-org-3.6.list
第3步 – 更新存储库
使用apt命令更新存储库:
sudo apt-get update
说明:执行完会提示一些失败,不用在意
第4步 – 安装MongoDB
执行以下命令来安装MongoDB:
sudo apt-get install -y mongodb
第5步:启动MongoDB
执行以下命令启动MongoDB并将其添加为在启动时启动的服务
systemctl start mongodb
如果执行完这一步终端没有任何输出,则说明是正确的
如果启动的时候提示:Failed to start mongod.service: Unit mongodb.service not found.
解决办法如下:
1创建配置文件:
在/etc/systemd/system/下
sudo vim mongodb.service
2.在里面追加文本:
[Unit]
Description=High-performance, schema-free document-oriented database
After=network.target
[Service]
User=mongodb
ExecStart=/usr/bin/mongod --quiet --config /etc/mongodb.conf
[Install]
WantedBy=multi-user.target
3.按ctrl+X退出
4.启动服务
sudo systemctl start mongodb
sudo systemctl status mongodb
5.让它永久启动
sudo systemctl enable mongodb第6步:检查MongoDB是否已经启动在27017端口号上
执行下面的命令:
netstat -plntu
第7步:登录MongoDB
mongo
如果出现错误全局初始化失败:BadValue无效或无用户区域设置。 请确保LANG和/或LC_ *环境变量设置正确,请尝试命令:
export LC_ALL=C
mongo补充:ubuntu下如何查看软件安装目录以及安装版本
1.查询版本
aptitude show 软件名 或者 dpkg -l软件名
2.查询安装路径
dpkg -L 软件名 或者 whereis 软件名
三、MongoDB使用
1.创建和删除数据库
1.1创建数据库
语法:
use DATABASE_NAME
注意:如果指定的数据库DATABASE_NAME不存在,则该命令将创建一个新的数据库,否则返回现有的数据库
#mysql中
创建数据库:create database basename;
切换数据库:use basename;数据库命名:
a.不能是空字符串
b.不能包含特殊符号
c.最好全部小写
d.有一些数据库名是保留的,可以直接访问特殊数据库
admin:从权限的角度来说,是root的数据库
local:本地数据
config:配置,用于保存MongoDB的配置信息
演示:
#登录MongoDB rock@rockrong:~$ mongo
MongoDB shell version: 2.6.10
connecting to: test
Welcome to the MongoDB shell.
For interactive help, type "help".
For more comprehensive documentation, see
http://docs.mongodb.org/Questions? Try the support group
http://groups.google.com/group/mongodb-user
#创建数据库并切换到该数据库下
> use mydb1
switched to db mydb1其他命令:
#检查当前选择的数据库
> db
mydb1
#检查已经创建好的数据库列表
> show dbs
admin (empty)
local 0.078GB
#创建的数据库(newdb)不在列表中。要显示数据库,需要至少插入一个文档,空的数据库是不显示出来的
> db.mydb1.insert({'name':'yangyang'})
WriteResult({ "nInserted" : 1 })
> show dbs
admin (empty)
local 0.078GB
mydb1 0.078GB
#退出MongoDB
> exit
bye
rock@rockrong:~$ mongo
MongoDB shell version: 2.6.10
#默认的数据库test
connecting to: test
#如果数据库已经存在,use表示切换数据库
> use mydb1
switched to db mydb1
1.2删除数据库
语法:
db.dropDatabase()
#注意:默认删除当前正在工作的数据库,如果没有通过use命令切换数据库,则删除的是test演示:
#删除当前正在工作的数据库
> db.dropDatabase()
{ "dropped" : "mydb1", "ok" : 1 }
> show dbs
admin (empty)
local 0.078GB
2.创建和删除集合
类似于MySQL中的表
集合存在于数据库中,集合没有固定的结构,意味着可以对集合插入不同格式和不同类型的数据,但是尽量插入集合的时候保证数据的关联性
集合名的规范:
a.不能空字符串
b.集合名不能含有\0【空字符】,表示集合名的结尾
c.集合名不能以"system."开头,为系统集合保留的关键字
d.不能含有保留字符,千万不能含有$
2.1创建集合
语法:
db.createCollection(name, options)
#注意
name的类型为String,是要创建的集合的名称
options的类型是Document,是一个文档,指定相应的大小和索引,是可选参数下面是可以使用的选项列表:
在插入文档时,MongoDB首先检查上限集合
capped
字段的大小,然后检查max
字段。字段类型描述
capped
Boolean
(可选)如果为true
,则启用封闭的集合。上限集合是固定大小的集合,它在达到其最大大小时自动覆盖其最旧的条目。 如果指定true
,则还需要指定size
参数。autoIndexId
Boolean
(可选)如果为true
,则在_id
字段上自动创建索引。默认值为false
。size
数字(可选)指定上限集合的最大大小(以字节为单位)。 如果capped
为true
,那么还需要指定此字段的值。max
数字(可选)指定上限集合中允许的最大文档数。演示:
> use test
switched to db test
#没有options选项的集合的创建
> db.createCollection("myCollection")
{ "ok" : 1 }
#显示当前数据库下的集合列表
> show collections
myCollection
system.indexes
#有options选项的集合的创建
> db.createCollection("mycol",{capped:true,autoIndexId:true,size:1024,max:10000})
{ "ok" : 1 }
> show collections
myCollection
mycol
system.indexes
#如果一个集合不存在,直接向其中插入数据,会自动创建
> db.newcollection.insert({'name':'zhangsan'})
WriteResult({ "nInserted" : 1 })
> show collections
myCollection
mycol
newcollection
system.indexes
2.2删除集合
语法:
db.COLLECTION_NAME.drop()
注意:如果选定的集合成功删除,drop()方法将返回true,否则返回false演示:
> db.newcollection.drop()
true
> show collections
myCollection
mycol
3.文档操作
文档:相当表中的一条记录【实体】
是一组键值对,文档不需要设置相同的字段,并且相同的字段不需要相同的数据类型
注意:
a.文档中的键值对是有序的
b.文档中值除了字符串之外,还可以是其他数据类型【嵌套一个文档】
c.严格区分大小写和数据类型的,mycol myCol
d.文档中不能有重复的键
e.文档中的键基本都是用字符串表示的
文档中键的命名:
a.键不能包含\0
b.$和.有特殊含义
c.以下划线开头的键是保留的,尽量不要使用下划线开头
3.1插入文档
语法:
db.COLLECTION_NAME.insert(document)
注意:在插入的文档中,如果不指定_id参数,那么 MongoDB 会为此文档分配一个唯一的ObjectId
_id为集合中的每个文档唯一的12个字节的十六进制数。 12字节划分如下
_id: ObjectId(4 bytes timestamp, 3 bytes machine id, 2 bytes process id,
3 bytes incrementer)演示:
#插入单条文档
> db.mycol.insert({
... id:100,
... name:'zhangsan',
... age:18,
... hobby:'sing',
... })
WriteResult({ "nInserted" : 1 })
#查看已经插入的文档
> db.mycol.find()
{ "_id" : ObjectId("5b3d8c919e00ffe8882d9705"), "id" : 100, "name" : "zhangsan", "age" : 18, "hobby" : "sing" }
> db.mycol.find().pretty()
{
"_id" : ObjectId("5b3d8c919e00ffe8882d9705"),
"id" : 100,
"name" : "zhangsan",
"age" : 18,
"hobby" : "sing"
}
#批量插入文档
> db.mycol.insert({ id:101, name:"lisi", age:20, hobby:'dance', },{ id:102, name:'jack', age:15, hobby:'write', })
WriteResult({ "nInserted" : 1 })
> db.check.insert([
... {
... _id: 101,
... title: 'MongoDB Guide',
... description: 'MongoDB is no sql database',
... by: 'yiibai tutorials',
... url: 'http://www.yiibai.com',
... tags: ['mongodb', 'database', 'NoSQL'],
... likes: 100
... },
...
... {
... _id: 102,
... title: 'NoSQL Database',
... description: "NoSQL database doesn't have tables",
... by: 'yiibai tutorials',
... url: 'http://www.yiibai.com',
... tags: ['mongodb', 'database', 'NoSQL'],
... likes: 210,
... comments: [
... {
... user:'user1',
... message: 'My first comment',
... dateCreated: new Date(2017,11,10,2,35),
... like: 0
... }
... ]
... },
... {
... _id: 104,
... title: 'Python Quick Guide',
... description: "Python Quick start ",
... by: 'yiibai tutorials',
... url: 'http://www.yiibai.com',
... tags: ['Python', 'database', 'NoSQL'],
... likes: 30,
... comments: [
... {
... user:'user1',
... message: 'My first comment',
... dateCreated: new Date(2018,11,10,2,35),
... like: 590
... }
... ]
... }
... ])
BulkWriteResult({
"writeErrors" : [ ],
"writeConcernErrors" : [ ],
"nInserted" : 3,
"nUpserted" : 0,
"nMatched" : 0,
"nModified" : 0,
"nRemoved" : 0,
"upserted" : [ ]
})
> db.check.find().pretty()
{
"_id" : 101,
"title" : "MongoDB Guide",
"description" : "MongoDB is no sql database",
"by" : "yiibai tutorials",
"url" : "http://www.yiibai.com",
"tags" : [
"mongodb",
"database",
"NoSQL"
],
"likes" : 100
}
{
"_id" : 102,
"title" : "NoSQL Database",
"description" : "NoSQL database doesn't have tables",
"by" : "yiibai tutorials",
"url" : "http://www.yiibai.com",
"tags" : [
"mongodb",
"database",
"NoSQL"
],
"likes" : 210,
"comments" : [
{
"user" : "user1",
"message" : "My first comment",
"dateCreated" : ISODate("2017-12-09T18:35:00Z"),
"like" : 0
}
]
}
{
"_id" : 104,
"title" : "Python Quick Guide",
"description" : "Python Quick start ",
"by" : "yiibai tutorials",
"url" : "http://www.yiibai.com",
"tags" : [
"Python",
"database",
"NoSQL"
],
"likes" : 30,
"comments" : [
{
"user" : "user1",
"message" : "My first comment",
"dateCreated" : ISODate("2018-12-09T18:35:00Z"),
"like" : 590
}
]
}
>其它插入文档的方法【作为了解】
db.collection.insertOne():插入单个文档
db.collection.insertMany():插入多个文档
a.db.collection.insertOne()方法
db.collection.insertOne()
方法将单个文档插入到集合中。 如果文档没有指定
id字段,MongoDB会自动将
id字段与
ObjectId`值添加到新文档演示:
#以下示例将新文档插入到库存集合中
db.invent.insertOne({
item: "canvas",
num: 100,
tags: ["cotton"],
size: {
h: 20,
w: 30,
}
})
#db.collection.insertOne()方法返回包含新插入的文档的`_id```字段值的文档
执行结果如下:
> db.inventory.insertOne(
... { item: "canvas", qty: 100, tags: ["cotton"], size: { h: 28, w: 35.5, uom: "cm" } }
... )
{
"acknowledged" : true,
"insertedId" : ObjectId("5955220846be576f199feb55")
}
>b.db.collection.insertMany()方法
db.collection.insertMany()
方法将多个文档插入到集合中,可将一系列文档传递给
db.collection.insertMany()方法。以下示例将三个新文档插入到库存集合中。如果文档没有指定
id字段,MongoDB会向每个文档添加一个ObjectId值的
id`字段演示:
db.inventory.insertMany([
{ item: "journal", qty: 25, tags: ["blank", "red"], size: { h: 14, w: 21, uom: "cm" } },
{ item: "mat", qty: 85, tags: ["gray"], size: { h: 27.9, w: 35.5, uom: "cm" } },
{ item: "mousepad", qty: 25, tags: ["gel", "blue"], size: { h: 19, w: 22.85, uom: "cm" } }
])
#insertMany()返回包含新插入的文档_id字段值的文档。执行结果如下:
> db.inventory.insertMany([
... { item: "journal", qty: 25, tags: ["blank", "red"], size: { h: 14, w: 21, uom: "cm" } },
... { item: "mat", qty: 85, tags: ["gray"], size: { h: 27.9, w: 35.5, uom: "cm" } },
... { item: "mousepad", qty: 25, tags: ["gel", "blue"], size: { h: 19, w: 22.85, uom: "cm" } }
... ])
{
"acknowledged" : true,
"insertedIds" : [
ObjectId("59552c1c46be576f199feb56"),
ObjectId("59552c1c46be576f199feb57"),
ObjectId("59552c1c46be576f199feb58")
]
}
3.2查询文档
语法:
db.COLLECTION_NAME.find(document)
注意:
find()将以非结构化的方式返回查询结果
要以格式化的方式返回查询结果,可以结合pretty函数使用
db.COLLECTION_NAME.find(document).pretty()
findOne():返回一个文档MongoDB 与 RDBMS的等效MySQL子句
要在一些条件的基础上查询文档,可以使用以下操作:
操作语法示例MySQL等效语句相等
{<key>:<value>}
db.mycol.find({"by":"yiibai"}).pretty()
where by = 'yiibai'
小于{<key>:{$lt:<value>}}
db.mycol.find({"likes":{$lt:50}}).pretty()
where likes < 50
小于等于{<key>:{$lte:<value>}}
db.mycol.find({"likes":{$lte:50}}).pretty()
where likes <= 50
大于{<key>:{$gt:<value>}}
db.mycol.find({"likes":{$gt:50}}).pretty()
where likes > 50
大于等于{<key>:{$gte:<value>}}
db.mycol.find({"likes":{$gte:50}}).pretty()
where likes >= 50
不等于{<key>:{$ne:<value>}}
db.mycol.find({"likes":{$ne:50}}).pretty()
where likes != 50
演示:
a.MongoDB中的AND操作符
语法:
#在find()方法中,如果通过使用’,‘将它们分开传递多个键,则 MongoDB 将其视为AND条件。 以下是AND的基本语法
>db.mycol.find(
{
$and: [
{key1: value1}, {key2:value2}
]
}
).pretty()演示:
db.check.find({$and:[{'by':'yiibai tutorials'},{'title':'Python Quick Guide'}]}).pretty()
{
"_id" : 104,
"title" : "Python Quick Guide",
"description" : "Python Quick start ",
"by" : "yiibai tutorials",
"url" : "http://www.yiibai.com",
"tags" : [
"Python",
"database",
"NoSQL"
],
"likes" : 30,
"comments" : [
{
"user" : "user1",
"message" : "My first comment",
"dateCreated" : ISODate("2018-12-09T18:35:00Z"),
"like" : 590
}
]
}
>
db.check.find({'by':'yiibai tutorials','title':'Python Quick Guide'}).pretty()
{
"_id" : 104,
"title" : "Python Quick Guide",
"description" : "Python Quick start ",
"by" : "yiibai tutorials",
"url" : "http://www.yiibai.com",
"tags" : [
"Python",
"database",
"NoSQL"
],
"likes" : 30,
"comments" : [
{
"user" : "user1",
"message" : "My first comment",
"dateCreated" : ISODate("2018-12-09T18:35:00Z"),
"like" : 590
}
]
}
#等效的SQL的语句
select * from check where by="" and title="";b.MongoDB中的OR操作符
语法:
#在要根据OR条件查询文档,需要使用$or关键字。 以下是OR条件的基本语法
>db.mycol.find(
{
$or: [
{key1: value1}, {key2:value2}
]
}
).pretty()演示:
db.check.find({$or:[{'by':'yiibai tutorials'},{'title':'Python Quick Guide'}]}).pretty()
c.使用 AND 和 OR 联合使用
演示:
> db.check.find({'likes':{$gt:100},$or:[{'title':'NoSQL Database'},{'by':'yiibai tutorials'}]}).pretty()
{
"_id" : 102,
"title" : "NoSQL Database",
"description" : "NoSQL database doesn't have tables",
"by" : "yiibai tutorials",
"url" : "http://www.yiibai.com",
"tags" : [
"mongodb",
"database",
"NoSQL"
],
"likes" : 210,
"comments" : [
{
"user" : "user1",
"message" : "My first comment",
"dateCreated" : ISODate("2017-12-09T18:35:00Z"),
"like" : 0
}
]
}
>
select * from check where likes>100 and (title='' or by='')
3.3更新文档
1>update():更新现有文档中的值
criteria:用于指定一个查询,查询选择将要更新的目标记录
action:用于指定更新信息,也可以使用操作符完成
options:
语法:
db.COLLECTION_NAME.update(SELECTION_CRITERIA, UPDATED_DATA)
演示:
#find():查询指定列的数据
#{'_id':1,'title':1}:表示要检索的字段列表
#注意:当执行find函数的时候,它默认将所有的文档显示,为了限制显示的字段,需要将字段列表的值设置为1,如果不显示可以设置为0
> db.check.find({'title':'MongoDB Guide'},{'_id':1,'title':1})
{ "_id" : 101, "title" : "MongoDB Guide" }
#注意:update默认只更新一个文档,如果要更新多个文档,则添加参数{multi:true})
db.check.update({'title':'MongoDB Guide'},{$set:{'title':'aaaaaa'}},{multi:true})2>save():使用
save()
方法中传递的文档数据替换现有文档语法:
>db.COLLECTION_NAME.save({_id:ObjectId(),NEW_DATA})
演示:
> use mydb1
switched to db mydb1
> db.check.save({'_id':102,'titlt':'bbbb','by':'hello'})
WriteResult({ "nMatched" : 0, "nUpserted" : 1, "nModified" : 0, "_id" : 102 })
> db.check.find({'_id':102},{'_id':1,'title':1,'by':1})
{ "_id" : 102, "by" : "hello" }
3.4删除文档
MongoDB中的
remove()
方法用于从集合中删除文档。remove()
方法接受两个参数。 一个是删除条件,第二个是标志:justOne
。criteria - (可选)符合删除条件的集合将被删除。
justOne - (可选)如果设置为
true
或1
,则只删除一个文档语法:
>db.COLLECTION_NAME.remove(DELLETION_CRITTERIA)
演示:
> db.check.remove({'_id':100})
WriteResult({ "nRemoved" : 0 })
> db.check.find({},{'_id':1,'title':1})
{ "_id" : 102 }
> db.check.remove()
2018-07-05T15:02:29.068+0800 remove needs a query at src/mongo/shell/collection.js:299
> db.check.find({},{'_id':1,'title':1})
{ "_id" : 102 }
> db.check.find().pretty()
4.查询
4.1投影
投影:查询过程中,只显示指定的字段
语法:
>db.COLLECTION_NAME.find({},{KEY:1})
演示:
#在查询文档时只显示文档的标题
> db.mycol.find({}, {'title':1,'_id':0})
##注意,在执行find()方法时,始终都会显示_id字段,如果不想要此字段,则需要将其设置为0
4.2限制筛选记录
1>limit方法
作用:限制MongoDB要返回的记录数
根据指定的参数返回记录数
语法:
> db.COLLECTION_NAME.find().limit(NUMBER)
演示:
#在查询文档时仅显示两个文档
> db.mycol.find({},{"title":1,_id:0}).limit(2)2>skip方法
语法:
>db.COLLECTION_NAME.find().limit(NUMBER).skip(NUMBER)
演示:
> db.mycol.find({},{"title":1,_id:0}).limit(1).skip(2)
#注意:skip()方法中的默认值为0。
4.3对查询记录排序
语法:
>db.COLLECTION_NAME.find().sort({KEY:1})
注意:使用指定顺序进行排序,1表示升序,-1表示降序
演示:
> db.mycol.find({},{'_id':1, 'title':1})
# 按`title`降序排序
> db.mycol.find({},{"title":1,_id:0}).sort({"title":-1})
# 按`title`降序排序
> db.mycol.find({},{"title":1,_id:0}).sort({"title":-1})
4.4分组与聚合函数查询
1>aggregate()方法
语法:
>db.COLLECTION_NAME.aggregate(AGGREGATE_OPERATION)
以下是可用聚合表达式的列表。
表达式描述示例
$sum
从集合中的所有文档中求出定义的值。db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : "$likes"}}}])
$avg
计算集合中所有文档的所有给定值的平均值。db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$avg : "$likes"}}}])
$min
从集合中的所有文档获取相应值的最小值。db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$min : "$likes"}}}])
$max
从集合中的所有文档获取相应值的最大值。db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$max : "$likes"}}}])
$push
将值插入到生成的文档中的数组中。db.mycol.aggregate([{$group : {_id : "$by_user", url : {$push: "$url"}}}])
$addToSet
将值插入生成的文档中的数组,但不会创建重复项。db.mycol.aggregate([{$group : {_id : "$by_user", url : {$addToSet : "$url"}}}])
$first
根据分组从源文档获取第一个文档。 通常情况下,这只适用于以前应用的“$sort
”阶段。db.mycol.aggregate([{$group : {_id : "$by_user", first_url : {$first : "$url"}}}])
$last
根据分组从源文档获取最后一个文档。通常情况下,这只适用于以前应用的“$sort
”阶段。db.mycol.aggregate([{$group : {_id : "$by_user", last_url : {$last : "$url"}}}])
演示:
db.article.aggregate([{$group:{'_id':'$by_user','num_tutorial':{$sum:1}}}])
{ "_id" : "Curry", "num_tutorial" : 1 }
{ "_id" : "Kuber", "num_tutorial" : 1 }
{ "_id" : "Maxsu", "num_tutorial" : 2 }
#等效的sql语句
select by_user, count(*) as num_tutorial from article group by by_user管道:
每一组的输出可以作为另一组的输入,并且生成一组新的文档
$sort
$limit
$skip
$group
5.MongoDB关联关系
MongoDB中的关系表示各个文档在逻辑上的相互关联。关系可以通过嵌入式和引用方法建模。 这种关系可以是
1:1
,1:N
,N:1
或N:N
。假设有一种情况:要存储用户的地址。一个用户可以拥有多个地址,这就是
1:N
关系。以下是用户(
user
)文档示例的文档结构{
"_id":10999110,
"name": "Maxsu",
"contact": "13888990021",
"dob": "1992-10-11"
}以下是地址(
address
)文档的示例文档结构 -{
"_id":12200,
"building": "Hainan Building NO.2100",
"pincode": 571100,
"city": "Haikou",
"province": "Hainan"
}
5.1嵌入式关系建模
在嵌入式方法中,我们将地址(
address
)文档嵌入到用户(user
)文档中。{
"_id": 21000100,
"contact": "13800138000",
"dob": "1991-11-11",
"name": "Maxsu",
"address": [
{
"building": "Hainan Building NO.2100",
"pincode": 571100,
"city": "Haikou",
"province": "Hainan"
},
{
"building": "Sanya Building NO.2100",
"pincode": 572200,
"city": "Sanya",
"province": "Hainan"
},
]
}该方法将所有相关数据保存在单个文档中,这使得检索和维护更容易。可以使用单个查询来在整个文档检索,例如 -
> db.users.findOne({"name":"Maxsu"},{"address":1, "name":1})
请注意,在上述查询中,
db
和users
分别是数据库和集合。缺点是如果嵌入式文档的大小如果不断增长,可能会影响读/写性能。
5.2建模参考关系
这是设计规范化关系的方法。 在这种方法中,用户和地址文件将分别维护,但用户文档将包含一个将引用地址文档的
id
字段的字段。{
"_id":ObjectId("52ffc33321332111sdfaf"),
"contact": "13800138000",
"dob": "1991-11-11",
"name": "Maxsu",
"address_ids": [
ObjectId("123123"),
ObjectId("123412")
]
}如上所示,用户文档包含对应地址的
ObjectId
的数组字段address_ids
。 使用这些ObjectIds,我们可以从那里查询地址文件并获取地址详细信息。 使用这种方法,需要两个查询:首先从用户文档获取address_ids
字段,然后从地址集中获取这些地址。>var result = db.users.findOne({"name":"Maxsu"},{"address_ids":1})
>var addresses = db.address.find({"_id":{"$in":result["address_ids"]}})
6.MongoDB-update多层嵌套数组解决办法
{ "_id" : 1
"user_id": 1,
"message" : "Yes"
"translations" : [
{
"destination" : "fr",
"text": "Oui"
},
{
"destination" : "bf",
"text": "uid"
},
]
}如果是一层数组,可以用如下语句更新数组里指定key的value
db.getCollection('message').update({
'_id': 1,
'translations.destination': 'fr'
},
{
'$set': {
"translations.$.text": "asd"
}
}如果再加一层嵌套
{ "_id" : 1
"user_id": 1,
"message" : "Yes"
"translations" : [
{
"destination" : "fr",
"text": "Oui",
"rating" : [
{ "user_id" : 1,
"rating" : 1
},
{ "user_id" : 2,
"rating" : 1
}
]
}
]
}使用这个更新语句就会报错了
db.getCollection('message').update({
'_id': 1,
'translations.destination': 'fr',
'translations.rating.user_id':'1'
},
{
'$set': {
"translations.$.rating.$.rating": 5
}
}目前mongodb不支持多个$占位符,推荐的方法的修改数据结构,把数据格式改成这样,把数组元素改成key-value形式
{ "_id" : 1
"user_id": 1,
"message" : "Yes"
"translations" : {
"fr": {
"destination" : "fr",
"text": "Oui",
"rating" : [
{ "user_id" : 1,
"rating" : 1
},
{ "user_id" : 2,
"rating" : 1
}
}
},
"en": {...}
]
}执行如下更新语句
db.getCollection('message').update({
'_id': 1,
'translations.destination': 'fr',
'translations.rating.user_id':'1'
},
{
'$set': {
translations.fr.rating.$.rating”: 5
}
}ps:只能使用一个$占位符的问题在社区里已经提了很久了,一直没有得到解决,希望下个版本可以解决。
7.python操作mongodb
安装 pip3 install pymongo
import pymongo
from pymongo import MongoClient
from bson.objectid import ObjectId
#1.建立连接
#创建MongoClient的对象
#方式一
#特点:可以连接默认的主机和端口号
#client = MongoClient()
#方式二
#明确指明主机和端口号
#client = MongoClient('localhost',27017)
#client = MongoClient(host='localhost',port=27017)
#方式三
#使用MongoDB URI的
client = MongoClient('mongodb://localhost:27017')
#2.获取数据库
#MongoDB的一个实例可以支持多个独立的数据库
#可以通过MongoClient的对象的属性来访问数据库
#方式一
db = client.test
print(db)
#方式二
#db = client['test']
#3.获取集合
#集合是存储在MongoDb中的一组文档,可以类似于MySQl中的表
#方式一
collection = db.stuents
#方式二
#collection = db['students']
"""
注意:
MongoDB中关于数据库和集合的创建都是懒创建
以上的操作在MongoDB的服务端没有做任何操作
当第一个文档被插入集合的时候才会创建数据库和集合
"""
#4.文档
#在pymongo中使用字典来表示文档
student1 = {
'id':'20180101',
'name':'jack',
'age':20,
'gender':'male'
}
#5.插入文档
#5.1insert()
#插入单条数据
#注意:MongoDb会自动生成一个ObjectId,insert函数的返回值为objectid
result = collection.insert(student1)
print(result)
#插入多条数据
student2 = {
'id':'20180530',
'name':'tom',
'age':30,
'gender':'male'
}
student3 = {
'id':'20180101',
'name':'bob',
'age':18,
'gender':'male'
}
#result = collection.insert([student2,student3])
#5.2insert_one()
student4 = {
'id':'20180101',
'name':'rose',
'age':25,
'gender':'female'
}
#result = collection.insert_one(student4)
#print(result) #InsertOneResult
#print(result.inserted_id)
#5.3insert_many()
#result = collection.insert_many([student2,student3]);
#print(result) #InsertOneResult
#print(result.inserted_ids)
#6.查询文档
#6.1
#find_one()
result = collection.find_one({'name':'jack'})
print(type(result)) #<class 'dict'>
print(result)
#6.2通过objectid查询
#5b3ed21f2e1016e9ad2dc7b7
#注意:导入模块
result = collection.find_one({'_id':ObjectId('5b3ed21f2e1016e9ad2dc7b7')})
print(result)
#查询不到结果则返回None
#6.3find()
#需求:查询年龄为20的数据
results = collection.find({'age':20})
print(results)
#Cursor相当于是一个生成器,只能通过遍历的方式获取其中的数据
for r in results:
print(r)
#需求:查询年龄大于20的数据
results = collection.find({'age':{'$gt':20}})
#6.4其他用法
#a.count()
#统计所有数据的条数
count1 = collection.find().count()
#统计制定条件的数据条数
count1 = collection.find({'age':20}).count()
#b.sort()
r0 = collection.find().sort('name',pymongo.ASCENDING)
#c.limit(),skip()
r0 = collection.find().sort('name',pymongo.ASCENDING).skip(2)
r0 = collection.find().sort('name',pymongo.ASCENDING).skip(2).limit(5)
#注意事项:在数据库数量非常庞大的情况下,最好不要使用大的 的偏移量,很可能会导致内存溢出
#7.更新文档
#7.1update()
conditon = {'name':'jack'}
student = collection.find_one(conditon);
student['age'] = 30
result = collection.update(conditon,student)
#7.2update_one()
conditon = {'name':'jack'}
student = collection.find_one(conditon);
student['age'] = 30
result = collection.update_one(conditon,{'$set':student})
print(result.matched_count,result.modified_count)
#7.2update_many()
#查询年龄大于20的数据,然后讲年龄增加1
conditon = {'age':{'$gt':20}}
result = collection.update_one(conditon,{'$inc':{'age':1}})
print(result.matched_count,result.modified_count)
#8.删除文档
#8.1remove()
#将符合条件的所有的数据全部删除
result = collection.remove({'name':'rose'})
#8.2delete_one()
result = collection.delete_one({'name':'rose'})
#8.3delete_many()
result = collection.delete_many({'name':'rose'})