我的编程空间,编程开发者的网络收藏夹
学习永远不晚

如何解决MongoDB游标超时问题

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

如何解决MongoDB游标超时问题

这篇文章给大家分享的是有关如何解决MongoDB游标超时问题的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。

当我们使用Python从MongoDB里面读取数据时,可能会这样写代码:

import pymongo

handler = pymongo.MongoClient().db.col

for row in handler.find():
 parse_data(row)

短短4行代码,读取MongoDB里面的每一行数据,然后传入parse_data做处理。处理完成以后再读取下一行。逻辑清晰而简单,能有什么问题?只要parse_data(row)不报错,这一段代码就完美无缺。

但事实并非这样。

你的代码可能会在for row in handler.find()这一行报错。它的原因,说来话长。

要解释这个问题,我们首先就需要知道,handler.find()返回的并不是数据库里面的数据,而是一个游标(cursor)对象。如下图所示:

如何解决MongoDB游标超时问题

只有当你使用for循环开始迭代它的时候,游标才会真正去数据库里面读取数据。

但是,如果每一次循环都连接数据库,那么网络连接会浪费大量时间。

所以pymongo会一次性获取100行,for row in handler.find()循环第一次的时候,它会连上MongoDB,读取一百条数据,缓存到内存中。于是第2-100次循环,数据都是直接从内存里面获取,不会再连接数据库。

当循环进行到底101次的时候,再一次连接数据库,再读取第101-200行内容……

这个逻辑非常有效地降低了网络I/O耗时。

但是,MongoDB默认游标的超时时间是10分钟。10分钟之内,必需再次连接MongoDB读取内容刷新游标时间,否则,就会导

致游标超时报错:

pymongo.errors.CursorNotFound: cursor id 211526444773 not found

如下图所示:

如何解决MongoDB游标超时问题

所以,回到最开始的代码中来,如果parse_data每次执行的时间超过6秒钟,那么它执行100次的时间就会超过10分钟。此时,当程序想读取第101行数据的时候,程序就会报错。

为了解决这个问题,我们有4种办法:

  1. 修改MongoDB的配置,延长游标超时时间,并重启MongoDB。由于生产环境的MongoDB不能随便重启,所以这个方案虽然有用,但是排除。

  2. 一次性把数据全部读取下来,再做处理:

all_data = [row for row in handler.find()]

for row in all_data:
 parse(row)

这种方案的弊端也很明显,如果数据量非常大,你不一定能全部放到内存里面。即使能够全部放到内存中,但是列表推导式遍历了所有数据,紧接着for循环又遍历一次,浪费时间。

  3.让游标每次返回的数据小于100条,这样消费完这一批数据的时间就会小于10分钟:

# 每次连接数据库,只返回50行数据
for row in handler.find().batch_size(50): 
 parse_data(row)

但这种方案会增加数据库的连接次数,从而增加I/O耗时。

  4.让游标永不超时。通过设定参数no_cursor_timeout=True,让游标永不超时:

cursor = handler.find(no_cursor_timeout=True)
for row in cursor:
 parse_data(row)
cursor.close() # 一定要手动关闭游标

然而这个操作非常危险,因为如果你的Python程序因为某种原因意外停止了,这个游标就再也无法关闭了!除非重启MongoDB,否则这些游标会一直留在MongoDB上,占用资源。

当然可能有人会说,使用try...except把读取数据的地方包住,只要抛出了异常,在处理异常的时候关闭游标即可:

cursor = handler.find(no_cursor_timeout=True)
try:
 for row in cursor:
 parse_data(row)
except Exception:
 parse_exception()
finally:
 cursor.close() # 一定要手动关闭游标

其中finally里面的代码,无论有没有异常,都会执行。

但这样写会让代码非常难看。为了解决这个问题,我们可以使用游标的上下文管理器:

with handler.find(no_cursor_timeout=True) as cursor:
 for row in cursor:
  parse_data(row)

只要程序退出了with的缩进,游标自动就会关闭。如果程序中途报错,游标也会关闭。

它的原理可以用下面两段代码来解释:

class Test:
 def __init__(self):
  self.x = 1

 def echo(self):
  print(self.x)

 def __enter__(self):
  print('进入上下文')
  return self

 def __exit__(self, *args):
  print('退出上下文')
  
with Test() as t:
 t.echo()
print('退出缩进')

运行效果如下图所示:

如何解决MongoDB游标超时问题

接下来在with的缩进里面人为制造异常:

class Test:
 def __init__(self):
  self.x = 1

 def echo(self):
  print(self.x)

 def __enter__(self):
  print('进入上下文')
  return self

 def __exit__(self, *args):
  print('退出上下文')
  
with Test() as t:
 t.echo()
 1 + 'a' # 这里一定会报错
print('退出缩进')

运行效果如下图所示:

如何解决MongoDB游标超时问题

无论在with的缩进里面发生了什么,Test这个类中的__exit__里面的代码始终都会运行。

我们来看看pymongo的游标对象里面,__exit__是怎么写的,如下图所示:

如何解决MongoDB游标超时问题

可以看到,这里正是关闭游标的操作。

因此,如果我们使用上下文管理器,就可以放心大胆地使用no_cursor_timeout=True参数了。

感谢各位的阅读!关于“如何解决MongoDB游标超时问题”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

如何解决MongoDB游标超时问题

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

session超时问题如何解决

要解决会话超时问题,可以考虑以下几种方法:1. 增加会话超时时间:可以调整系统设置,延长会话超时时间,以允许用户有更长时间进行操作。但要注意,超时时间过长可能会增加安全风险。2. 提醒用户:在会话即将超时时,通过弹窗、提示音或其他方式提醒用
2023-09-21

mongodb还原超时如何解决

当使用 `mongorestore` 进行数据库还原时,如果超时了,可以尝试以下几种方法解决:1. 增加超时时间:使用 `--timeout` 参数来增加超时时间,例如:`mongorestore --timeout=3600` 将超时时间
2023-08-31

MongoDB超大块数据问题解决

目录引言一、MongoDB服务器管理1、添加服务器2、修改分片中的服务器3、删除分片二、均衡器三、修改块的大小四、超大块1、分发超大块2、分发超大块步骤:3、避免出现超大块4、输出内容详解:五、系统分析器六、一些常见的辅助命令引言最近项目在
2023-02-09

Redis中秒杀场景下超时与超卖问题如何解决

这篇文章主要介绍“Redis中秒杀场景下超时与超卖问题如何解决”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“Redis中秒杀场景下超时与超卖问题如何解决”文章能帮助大家解决问题。超时1.redis连
2023-06-30

如何解决PIP安装python包出现超时问题

这篇文章给大家分享的是有关如何解决PIP安装python包出现超时问题的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。我们在使用pip默认源进行模块安装时,经常会超时问题导致不能下载。如图所示: 下面是解决方法—
2023-06-14

如何解决Linux系统中连接超时的问题

本篇内容主要讲解“如何解决Linux系统中连接超时的问题”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“如何解决Linux系统中连接超时的问题”吧!  IPv6被认为是IPv4—&md
2023-06-13

Redis如何解决库存超卖问题

这篇文章主要介绍“Redis如何解决库存超卖问题”,在日常操作中,相信很多人在Redis如何解决库存超卖问题问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Redis如何解决库存超卖问题”的疑惑有所帮助!接下来
2023-06-06

oracle游标打开数量超过限制如何解决

当Oracle游标打开数量超过限制时,可以考虑以下解决方法:1. 关闭不必要的游标:检查代码中是否存在没有及时关闭的游标,确保在使用完游标后进行关闭操作。2. 使用FOR循环替代显式游标:在一些情况下,可以使用FOR循环来替代显式游标。FO
2023-09-27

解决axios:"timeoutof5000msexceeded"超时的问题

这篇文章主要介绍了解决axios:"timeoutof5000msexceeded"超时的问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
2022-11-13

numpy.sum()坐标轴问题如何解决

今天小编给大家分享一下numpy.sum()坐标轴问题如何解决的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。示例代码如下:i
2023-07-05

如何修改php.ini超时问题

本文小编为大家详细介绍“如何修改php.ini超时问题”,内容详细,步骤清晰,细节处理妥当,希望这篇“如何修改php.ini超时问题”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。修改php.ini超时的方法:1、
2023-07-05

编程热搜

目录