我的编程空间,编程开发者的网络收藏夹
学习永远不晚

Python[10] mongodb模

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

Python[10]  mongodb模

今天和大家分享一个python入库mongodb的脚本。。。

涉及到python和mongodb,那么安装相应的模块四必不可少的,最简单的安装方法,或者非pip不可了。

# pip install pymongo==3.0.4

顺便也记录下源码安装的方式

# wget https://pypi.python.org/packages/source/p/pymongo/pymongo-2.8.tar.gz#md5=23100361c9af1904eb2d7722f2658114 --no-check-certificate
# tar xf pymongo-2.8.tar.gz
# cd pymongo-2.8
# python setup.py install


摘自一则日志

35783   s100    android 47  5   192.168.1.100   2015-09-05 08:03:19    strengthenHeroByHeroes  {"consume_gold":{"ogold":2893821,"cgold":1700,"gold":2892121,"tag":"strengthenHeroByHeroes"},"taskInfo":[{"id":2310033,"progress":2,"status":0}],"delHeroList":{"id":102014,"id":102014,"id":102014,"id":102010,"id":102010},"id":100026,"olevel":46,"oexp":1700,"cexp":1700,"level":46,"exp":3400} 865982021462182     XiaoMi


入库mongodb的python脚本

[root@localhost opt]# cat analytical.py 
#!/usr/bin/env python
#coding:utf8

import os,sys,json
from datetime import * 
from pymongo import MongoClient

def ConMongo(host,port,cur_db,username,password):
    client = MongoClient(host,port)
    db = client[cur_db]
    db.authenticate(username,password)
    table = db.gamelogs
    return table

def parseLog(logfile,table):
    dic = {}
    dl = []
    with open(file_log) as fd:
        for line in fd:
	    try:
	        tokens = line.strip().split('\t')
	        uid = tokens[0]
	        server = tokens[1]
	        system = tokens[2]
	        level = int(tokens[3])
	        vip_level = tokens[4]
	        ip = tokens[5]
	        time = datetime.strptime(tokens[6], "%Y-%m-%d %H:%M:%S")		#将时间字符串转换成时间格式
	        action = tokens[7]
	        result = json.loads(tokens[8])						#特殊字符串转换成json格式
	        uuid = tokens[9]
		if len(tokens) == 12:
	        channel = tokens[11]
		else:
		    channel = ''
	        dic = {'uid':uid,'server':server,'system':system,'level':level,'vip_level':vip_level,'ip':ip,'time':time,'action':action,'result':result,'uuid':uuid,'channel':channel}
		dl.append(dic)
		if len(dl) == 10000:
		    table.insert_many(dl)
		    dl = []
	    except Exception,e:
		    print e, line
	if len(dl) > 0:
	    table.insert_many(dl)

if __name__ == '__main__':
    table = ConMongo('localhost',27017,'talefundb','talefun','123456')
    try:
	    logfile = sys.argv[1]
        parseLog(logfile,table)
    except IndexError,e:
	    print e

注意事项:

(1)insert_many参数是mongodb 3.0.4中新加的,允许你将一个大列表直接insert到mongodb数据库中
(2)脚本中做了限制,如果字典中有2000个值,就向mongodb插入一次数据,这样在效率上得到了保证
(3)不建议直接复制脚本测试,很多粘贴出来后,很多制表符等会出现问题。我会吧脚本放在云盘上大家可以下载,测试用。


wKioL1X6vqHgz6F8AAHb0c8Iosc628.jpg


点击可下载:http://pan.baidu.com/s/1qWtbgjq


Python[10] mongodb模

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

Python[10] mongodb模

今天和大家分享一个python入库mongodb的脚本。。。涉及到python和mongodb,那么安装相应的模块四必不可少的,最简单的安装方法,或者非pip不可了。# pip install pymongo==3.0.4顺便也记录下源码安
2023-01-31

掌握 Python Logging 模块的 10 个技巧

Python Logging 模块是 Python 中一个功能强大的工具,用于管理和记录应用程序事件。掌握其技巧可以显著提高代码的调试性和可维护性。本文介绍了 10 个技巧,帮助您充分利用 Python Logging 模块。
掌握 Python Logging 模块的 10 个技巧
2024-02-20

python 10

os.path.  split(): 返回dirname() basename() 组成元组。  splitext(): 返回(filename,extension) 元组。   信息:   getatime   getctime   ge
2023-01-31

10. Python 帮助

1.      学习查看python的帮助(1)当我们要查看python变量属于哪个数据类型的时候,我们可以用print (type(varible))(2)当我们要查看一个变量有哪些具体方法的时候varible = dict(a=1, b
2023-01-31

Python练习10

无意看到老男孩的博文:合格linux运维人员必会的30道shell编程面试题及讲解http://oldboy.blog.51cto.com/2561410/1632876尝试着用刚开始学的python解答一些,权当练手了!如有错误,还请批评
2023-01-31

【Python】10、python内置数

一、集合1、集合的定义In [74]: s = {}In [74]: s = {}    # 空大括号是空的字典In [75]: type(s)Out[75]: dictIn [77]: type(s)Out[77]: setIn [78]
2023-01-31

Python的MongoDB模块PyMongo操作方法集锦

开始之前当然要导入模块啦:>>> import pymongo下一步,必须本地mongodb服务器的安装和启动已经完成,才能继续下去。 建立于MongoClient 的连接:client = MongoClient('localhost',
2022-06-04

【Python基础】10、MySQLdb

一、MySQLdb模块        python访问mariadb|mysql依赖于第三方模块MySQLdb,在pypi上下载下来路径:https://pypi.python.org/pypi/MySQL-python/ MySQL-py
2023-01-31

#10 Python字符串

前言通过上一节可知,Python6个序列的内置类型中,最常见的是列表和元组,但在Python中,最常用的数据类型却不是列表和元组,而是字符串。要想深入了解字符串,必须先掌握字符编码问题。因此本篇博文将讲解Python字符编码问题和Pytho
2023-01-30

Python练手例子(10)

55、学习使用按位取反~。程序分析:~0=1; ~1=0; (1)先使a右移4位。 (2)设置一个低4位全为1,其余全为0的数。可用~(~0<<4) (3)将上面二者进行&运算。#python3.7if __name__ == '__mai
2023-01-30

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录