我的编程空间,编程开发者的网络收藏夹
学习永远不晚

python 多线程实现定期更新ip库

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

python 多线程实现定期更新ip库

    通过最近监控发现,使用第三方Cdn公司的带宽偏高。由于最近没有增加新的业务。感觉其中肯定有问题。按照我们的Cahe架构,用户首先到我们自建Cache节点获取数据,如果该区域没有我们的节点,会去第三方节点进行取数据。具体架构如下:

     wKioL1N91V7xAStsAAG4qnZgUaw246.jpg


    用户无论在我们自建Cache节点还是第三方Cache节点取数据,域名解析都是通过我们自己的DNS进行解析。所以可以通过DNS 的log查询哪些节点使用了第三方Cdn公司Cache节点。对使用第三方Cdn公司Cache节点的用户,分析用户的Local dns所在的区域,方便优化自建Cache节点覆盖率。



解决方案:

  1. 首先获取所有用户访问第三方用户的localDNS

  2. 然后通过互联网提供的开放API接口,查询local DNS的归属地。

  3. 对查询过后的数据通过文件或者其它数据格式,传送到ip库平台。

  4. 通过ip库平台的ip库记录和获取到用户local dns准确性进行审核,然后经新的ip更新到ip库。

  5. 根据用户覆盖率,对自建Cache节点优化。

    

使用多线程和队列技术,完成前三步工作:

#!/usr/bin/env python
#-*- coding:utf-8 -*-
from subprocess import PIPE, Popen
from Queue import Queue
import time, urllib2, threading
import json

#对请求到第三方Cache节点的数据,筛选出来 。
def parserLog():
    
    cmd = "sed '/ANY/p' dns_logs.0 | awk -F' ' '{print $6}'"
    p = Popen(cmd, shell=True, stdout=PIPE, stderr=PIPE)
    stdout, stderr = p.communicate()
    data = stdout.strip()
    data = data.split('\n')
    return data

#获取所有请求到第三方Cache节点的用户local DNS。
def getIp():
    ld = []
    data = parserLog()
    for i in data:
        if i.split('#')[0] not in ld:
	    ld.append(i.split('#')[0])
    return ld


#使用多线程和队列技术
#通过开放的API接口,将用户local DNS ip地址传给该API接口,返回用户的归属地信息。
#将所有的归属地信息保存至文件,然后通过第三方方式,将该文件传送到IP 库平台
#通过其它程序进行处理
class ThreadClass(threading.Thread):
    def __init__(self, queue):
        threading.Thread.__init__(self)
        self.queue = queue

    def run(self):
	ld=[]
	dc={}
	dt={}
        while True:
            host = self.queue.get()
	    try:
                data = urllib2.urlopen('http://ip.taobao.com/service/getIpInfo.php?ip=%s' % host).read() 	
		with open('dns.txt', 'a') as fd:
		    fd.write(data+'\n')                                                                             
  		                                                                                       
		time.sleep(1)
                self.queue.task_done()                                                                  	
	    except:
	        pass
	
def main():
    queue = Queue()
    for i in range(15):
        t = ThreadClass(queue)
        t.setDaemon(True)
        t.start()

    hosts = getIp()
    for host in hosts:
        queue.put(host)

    queue.join()


if __name__ == "__main__":
    st = time.time()
    main()
    print '%f'%(time.time()-st)

    定期执行该脚本,收集用户Local DNS并查询归属地。然后发送到ip库管理平台对该信息进行格式化和比较,最后入库。

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

python 多线程实现定期更新ip库

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

python 多线程实现定期更新ip库

通过最近监控发现,使用第三方Cdn公司的带宽偏高。由于最近没有增加新的业务。感觉其中肯定有问题。按照我们的Cahe架构,用户首先到我们自建Cache节点获取数据,如果该区域没有我们的节点,会去第三方节点进行取数据。具体架构如下:      
2023-01-31

Python Pyqt5多线程更新UI代码的实例分析

Python Pyqt5多线程更新UI代码的实例分析,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。"""在编写GUI界面中,通常用会有一些按钮,点击后触发事件,比如去下载一
2023-06-21

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录