我的编程空间,编程开发者的网络收藏夹
学习永远不晚

怎么理解PostgreSQL的后台进程autovacuum

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

怎么理解PostgreSQL的后台进程autovacuum

本篇内容介绍了“怎么理解PostgreSQL的后台进程autovacuum”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

一、数据结构

AutoVacuumShmem
主要的autovacuum共享内存结构体,存储在shared memory中,同时WorkerInfo也会存储在其中.

typedef struct{    sig_atomic_t av_signal[AutoVacNumSignals];    pid_t       av_launcherpid;    dlist_head  av_freeWorkers;    dlist_head  av_runningWorkers;    WorkerInfo  av_startingWorker;    AutoVacuumWorkItem av_workItems[NUM_WORKITEMS];} AutoVacuumShmemStruct;static AutoVacuumShmemStruct *AutoVacuumShmem;

avw_dbase
用于跟踪worker中的数据库的结构体

//用于跟踪worker中的数据库的结构体typedef struct avw_dbase{    Oid         adw_datid;    char       *adw_name;    TransactionId adw_frozenxid;    MultiXactId adw_minmulti;    PgStat_StatDBEntry *adw_entry;} avw_dbase;

二、源码解读

rebuild_database_list用于构建出现变化后的DatabaseList,链表中的数据库应出现在pgstats中,在autovacuum_naptime所设定的时间间隔范围内均匀分布。
比如autovacuum_naptime = 60s,有4个数据库db1->db4,那么每隔60s/4就会有启动一个autovacuum worker对相应的DB进行处理。
可能的一个处理时间序列是:db1->XX(时):XX(分):18(秒),db4->XX:XX:33,db4->XX:XX:48,db4->XX:XX:03
后续如需要对db1->db4进行vacuum,那么db1->db4会在下一个18秒、33秒、48秒和03秒触发autovacuum。

static voidrebuild_database_list(Oid newdb){    List       *dblist;    ListCell   *cell;    MemoryContext newcxt;    MemoryContext oldcxt;    MemoryContext tmpcxt;    HASHCTL     hctl;    int         score;    int         nelems;    HTAB       *dbhash;    dlist_iter  iter;        autovac_refresh_stats();    newcxt = AllocSetContextCreate(AutovacMemCxt,                                   "AV dblist",                                   ALLOCSET_DEFAULT_SIZES);    tmpcxt = AllocSetContextCreate(newcxt,                                   "tmp AV dblist",                                   ALLOCSET_DEFAULT_SIZES);    oldcxt = MemoryContextSwitchTo(tmpcxt);        hctl.keysize = sizeof(Oid);    hctl.entrysize = sizeof(avl_dbase);    hctl.hcxt = tmpcxt;    dbhash = hash_create("db hash", 20, &hctl,                           HASH_ELEM | HASH_BLOBS | HASH_CONTEXT);        score = 0;//分值从0开始    if (OidIsValid(newdb))    {        avl_dbase  *db;        PgStat_StatDBEntry *entry;                //只关注存在pgstat条目的数据库        entry = pgstat_fetch_stat_dbentry(newdb);        if (entry != NULL)        {                        db = hash_search(dbhash, &newdb, HASH_ENTER, NULL);                        db->adl_score = score++;                    }    }        //从现存链表中插入到数据库中    dlist_foreach(iter, &DatabaseList)    {        avl_dbase  *avdb = dlist_container(avl_dbase, adl_node, iter.cur);        avl_dbase  *db;        bool        found;        PgStat_StatDBEntry *entry;                entry = pgstat_fetch_stat_dbentry(avdb->adl_datid);        if (entry == NULL)            continue;        db = hash_search(dbhash, &(avdb->adl_datid), HASH_ENTER, &found);        if (!found)        {                        db->adl_score = score++;                    }    }        //插入先前没有处理过的数据库    dblist = get_database_list();    foreach(cell, dblist)    {        avw_dbase  *avdb = lfirst(cell);        avl_dbase  *db;        bool        found;        PgStat_StatDBEntry *entry;                //只考虑存在pgstat的数据库        entry = pgstat_fetch_stat_dbentry(avdb->adw_datid);        if (entry == NULL)            continue;        db = hash_search(dbhash, &(avdb->adw_datid), HASH_ENTER, &found);                if (!found)        {                        db->adl_score = score++;                    }    }    nelems = score;        MemoryContextSwitchTo(newcxt);    dlist_init(&DatabaseList);    if (nelems > 0)    {        TimestampTz current_time;        int         millis_increment;        avl_dbase  *dbary;        avl_dbase  *db;        HASH_SEQ_STATUS seq;        int         i;                //放到数组中        dbary = palloc(nelems * sizeof(avl_dbase));        i = 0;        hash_seq_init(&seq, dbhash);        while ((db = hash_seq_search(&seq)) != NULL)            memcpy(&(dbary[i++]), db, sizeof(avl_dbase));                //排序        qsort(dbary, nelems, sizeof(avl_dbase), db_comparator);                //确定数据库之间的调度间隔:autovacuum_naptime/数据库个数        millis_increment = 1000.0 * autovacuum_naptime / nelems;        if (millis_increment <= MIN_AUTOVAC_SLEEPTIME)            millis_increment = MIN_AUTOVAC_SLEEPTIME * 1.1;        current_time = GetCurrentTimestamp();                for (i = 0; i < nelems; i++)        {            avl_dbase  *db = &(dbary[i]);            current_time = TimestampTzPlusMilliseconds(current_time,                                                       millis_increment);            db->adl_next_worker = current_time;                        dlist_push_head(&DatabaseList, &db->adl_node);        }    }        if (DatabaseListCxt != NULL)        MemoryContextDelete(DatabaseListCxt);    MemoryContextDelete(tmpcxt);    DatabaseListCxt = newcxt;    MemoryContextSwitchTo(oldcxt);}

三、跟踪分析

启动gdb,设置信号处理,设置断点

(gdb) b rebuild_database_listBreakpoint 1 at 0x82eb2a: file autovacuum.c, line 931.(gdb) handle SIGINT print nostop passSIGINT is used by the debugger.Are you sure you want to change it? (y or n) ySignal        Stop  Print   Pass to program DescriptionSIGINT        No    Yes Yes     Interrupt(gdb) cContinuing.^CProgram received signal SIGINT, Interrupt.

进入断点

Breakpoint 1, rebuild_database_list (newdb=0) at autovacuum.c:931931     autovac_refresh_stats();(gdb) n933     newcxt = AllocSetContextCreate(AutovacMemCxt,(gdb) 936     tmpcxt = AllocSetContextCreate(newcxt,(gdb) 939     oldcxt = MemoryContextSwitchTo(tmpcxt);(gdb) 957     hctl.keysize = sizeof(Oid);(gdb) 958     hctl.entrysize = sizeof(avl_dbase);(gdb) 959     hctl.hcxt = tmpcxt;

查看统计信息文件:pg_stat_tmp/global.stat

(gdb) p  *pgstat_stat_filename$1 = 112 'p'(gdb) p  pgstat_stat_filename$2 = 0x203d7e0 "pg_stat_tmp/global.stat"(gdb) n960     dbhash = hash_create("db hash", 20, &hctl,  (gdb) ###[pg12@localhost pg_stat_tmp]$ pwd/data/pgsql/pg121db/pg_stat_tmp[pg12@localhost pg_stat_tmp]$ lltotal 4-rw------- 1 pg12 pg12 237 Dec 11 16:40 global.stat[pg12@localhost pg_stat_tmp]$

构建需处理的数据库链表

964     score = 0;(gdb) 965     if (OidIsValid(newdb))(gdb) p *hctlStructure has no component named operator*.(gdb) p hctl$3 = {num_partitions = 140725872814104, ssize = 34131296, dsize = 32, max_dsize = 0, ffactor = 257, keysize = 4, entrysize = 40, hash = 0xc6afd3, match = 0x208cd60, keycopy = 0x0, alloc = 0x1, hcxt = 0x2090d80,   hctl = 0xfe3a00 <ConfigureNamesString+4864>}(gdb) n984     dlist_foreach(iter, &DatabaseList)(gdb) p *DatabaseListStructure has no component named operator*.(gdb) p DatabaseList$4 = {head = {prev = 0xfd9880 <DatabaseList>, next = 0xfd9880 <DatabaseList>}}(gdb) n1010        dblist = get_database_list();(gdb) 1011        foreach(cell, dblist)(gdb) p *dblist$5 = {type = T_List, length = 7, head = 0x2090ef8, tail = 0x2091240}(gdb) p *dblist->head$6 = {data = {ptr_value = 0x2090e98, int_value = 34147992, oid_value = 34147992}, next = 0x2090fb0}(gdb) p *(Node *)dblist->head->data.ptr_value$7 = {type = 13591}(gdb) p *dblist->head->data.ptr_valueAttempt to dereference a generic pointer.(gdb) n1013            avw_dbase  *avdb = lfirst(cell);(gdb)

如没有统计信息,则不予处理

1019            entry = pgstat_fetch_stat_dbentry(avdb->adw_datid);(gdb) p *avdb$8 = {adw_datid = 13591, adw_name = 0x2090ed0 "postgres", adw_frozenxid = 479, adw_minmulti = 1, adw_entry = 0x0}(gdb) n1020            if (entry == NULL)(gdb) 1011        foreach(cell, dblist)(gdb) 1013            avw_dbase  *avdb = lfirst(cell);(gdb) 1019            entry = pgstat_fetch_stat_dbentry(avdb->adw_datid);(gdb) p *avdb$9 = {adw_datid = 16384, adw_name = 0x2090f90 "testdb", adw_frozenxid = 2921, adw_minmulti = 1, adw_entry = 0x0}(gdb) steppgstat_fetch_stat_dbentry (dbid=16384) at pgstat.c:24382438        backend_read_statsfile();(gdb) stepbackend_read_statsfile () at pgstat.c:56445644        TimestampTz min_ts = 0;(gdb) n5645        TimestampTz ref_ts = 0;(gdb) 5650        if (pgStatDBHash)(gdb) 5651            return;(gdb) 5766    }(gdb) pgstat_fetch_stat_dbentry (dbid=16384) at pgstat.c:24432443        return (PgStat_StatDBEntry *) hash_search(pgStatDBHash,(gdb) 2446    }(gdb) rebuild_database_list (newdb=0) at autovacuum.c:10201020            if (entry == NULL)(gdb) n1011        foreach(cell, dblist)(gdb) 1013            avw_dbase  *avdb = lfirst(cell);(gdb) 1019            entry = pgstat_fetch_stat_dbentry(avdb->adw_datid);(gdb) 1020            if (entry == NULL)(gdb) 1011        foreach(cell, dblist)(gdb) 1013            avw_dbase  *avdb = lfirst(cell);(gdb) 1019            entry = pgstat_fetch_stat_dbentry(avdb->adw_datid);(gdb) 1020            if (entry == NULL)(gdb) 1011        foreach(cell, dblist)(gdb) 1013            avw_dbase  *avdb = lfirst(cell);(gdb) 1019            entry = pgstat_fetch_stat_dbentry(avdb->adw_datid);(gdb) 1020            if (entry == NULL)(gdb) 1011        foreach(cell, dblist)(gdb) 1013            avw_dbase  *avdb = lfirst(cell);(gdb) 1019            entry = pgstat_fetch_stat_dbentry(avdb->adw_datid);(gdb) 1020            if (entry == NULL)(gdb) 1011        foreach(cell, dblist)(gdb) 1013            avw_dbase  *avdb = lfirst(cell);(gdb) 1019            entry = pgstat_fetch_stat_dbentry(avdb->adw_datid);(gdb) 1020            if (entry == NULL)(gdb) 1011        foreach(cell, dblist)(gdb) 1032        nelems = score;(gdb) 1035        MemoryContextSwitchTo(newcxt);(gdb) n1036        dlist_init(&DatabaseList);(gdb)

所有数据库都不需要处理,返回

1038        if (nelems > 0)(gdb) p nelems$10 = 0(gdb) n1089        if (DatabaseListCxt != NULL)(gdb) 1091        MemoryContextDelete(tmpcxt);(gdb) 1092        DatabaseListCxt = newcxt;(gdb) 1093        MemoryContextSwitchTo(oldcxt);(gdb) 1094    }(gdb) AutoVacLauncherMain (argc=0, argv=0x0) at autovacuum.c:625625     while (!got_SIGTERM)(gdb)

“怎么理解PostgreSQL的后台进程autovacuum”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注编程网网站,小编将为大家输出更多高质量的实用文章!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

怎么理解PostgreSQL的后台进程autovacuum

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

怎么理解PostgreSQL的后台进程autovacuum

本篇内容介绍了“怎么理解PostgreSQL的后台进程autovacuum”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!一、数据结构Auto
2023-05-31

Linux后台进程管理的常用命令

这篇文章主要介绍“Linux后台进程管理的常用命令”,在日常操作中,相信很多人在Linux后台进程管理的常用命令问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Linux后台进程管理的常用命令”的疑惑有所帮助!
2023-06-13

解析后台进程对Android性能影响的详解

Android现在这么火,各种的设备也是琳琅满目,高中低等,大小屏幕都有,但是它始终未能达到iOS那样的令人称赞的卓越体验和性能,其操作的流畅度,性能和安全性方面总是略输iOS一筹。据说iPhone4虽然是单核512M内存,但是比Andro
2022-06-06

Linux环境下怎么让进程在后台运行

这篇文章主要介绍“Linux环境下怎么让进程在后台运行”,在日常操作中,相信很多人在Linux环境下怎么让进程在后台运行问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Linux环境下怎么让进程在后台运行”的疑
2023-06-16

linux系统下怎么让进程在后台运行

本篇内容主要讲解“linux系统下怎么让进程在后台运行”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“linux系统下怎么让进程在后台运行”吧!在Linux中,如果要让进程在后台运行,一般情况下,
2023-06-10

Linux中怎么让进程在后台可靠运行

这篇文章主要介绍Linux中怎么让进程在后台可靠运行,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!在登录到Linux服务器后运行某程序,之后断开连接,那之前运行的程序就会被中止掉。这是由于新进程默认都是当前进程的子进
2023-06-28

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录