BeiGang 发表于 2013-1-30 01:25:54

pg启动过程中的那些事四:初始化全局时区global_timezone

 
话说初始化和设置完GUC参数后,改变了当前工作文件夹,给数据集文件夹加了文件锁postmaster.pid,接着就是初始化时区设置,这些都跳过去了,后来发现初始化时区用到了pg里的动态哈希表,决定还是把这个写出来。
动态哈希表在pg里使用的地方很多,pg使用它管理共享内存shared memory、锁、市区timezone等。Linux使用哈希表来管理内存、连接等。后面再讨论pg里的动态哈希表dynmaic hashtable。
 
1先上个图,看一下函数调用过程梗概,中间略过部分细节
 
http://dl.iteye.com/upload/attachment/608144/179fae4e-8aa4-30ac-8ba4-31501d195c11.bmp
 
初始化Timezones的方法调用过程图

 

       这一节写图中红色方框圈起来的部分,上面的部分基本上在前面已经写过了,有小部分有略过。红色框中的部分就是初始化Timezones的过程调用,这主要做了两件事,一是创建了一个 ”Timezones”AllocSet/MemoryContext,二是建了一个pg中的动态哈希表,来管理/存放timezone。

2初始化全局时区global_timezones的过程

话说main()->…->PostmasterMain()->…-> pg_timezone_initialize()(以后用“->” 表示调用),先到前面的文章《pg启动过程中的那些事三》里提到的config_generic **类型的有序GUC参数数组guc_variables里用二分法查找config_string类型参数timezone,此时该参数还没有设置,接着->select_default_timezone()->identify_system_timezone()函数根据OS环境变量识别操作系统的timezone设置,再 ->select_default_timezone()->set_global_timezone()->pg_tzset()在内存里初始化一个静态全局变量动态哈希表static HTAB * timezone_cache,在哈希表timezone_cache里记录时区结构pg_tz_cache类型的实例。然后使pg_tz *类型全局指针变量 global_timezone指向哈希表中的pg_tz_cache结构类型实例中pg_tz结构的成员tz。最后->SetConfigOption()设置GUC参数“timezone”为“ASIA/Hong_Kong”(这个是我PC上跑的结果)。

下面是pg_tz_cache、pg_tz等机构定义。
 

typedef struct

{

    /* tznameupper contains the all-upper-case name of thetimezone */

    char        tznameupper;

    pg_tz       tz;

} pg_tz_cache;

 

struct pg_tz

{

    /* TZname contains the canonically-cased name of thetimezone */

    char        TZname;

    struct state state;

};

 

struct state

{

    int         leapcnt;

    int         timecnt;

    int         typecnt;

    int         charcnt;

    pg_time_t   ats;

    unsigned chartypes;

    struct ttinfo ttis;

    char        chars/* sizeof gmt */ ),

                                          (2 * (TZ_STRLEN_MAX + 1)))];

    struct lsinfo lsis;

};

 

struct ttinfo

{                               /* time type information */

    long        tt_gmtoff;      /* UTC offset inseconds */

    int         tt_isdst;       /* used to settm_isdst */

    int         tt_abbrind;     /* abbreviationlist index */

    int         tt_ttisstd;     /* TRUE iftransition is std time */

    int         tt_ttisgmt;     /* TRUE iftransition is UTC */

};

 

struct lsinfo

{                               /* leap second information */

    pg_time_t   ls_trans;       /* transition time */

    long        ls_corr;        /* correctionto apply */

};

 

pg_tz_cache的结构在内存里看起来是这样的。
 

http://dl.iteye.com/upload/attachment/608142/08e7cfbd-48f9-3441-a72a-086e98a77409.bmp
 
时区相关结构图

 

初始化global_timezone是从->select_default_timezone()->set_global_timezone() ->pg_tzset()->init_timezone_hashtable()->hash_create()开始的(调用过程要是看晕了就看上面的调用过程图吧),先初始化一个AllocSet/MemoryContext类型变量“Timezones”,接着在AllocSet/MemoryContext类型的“Timezones”实例里就是HTAB、HASHHDR、HashSegment、HashBucket、HashElemen等等一堆招呼,初始化成了“Timezones”动态哈希表。熟悉哈希表/哈希算法的同学看着HashBucket、HashElement也能猜出来大概是干什么用的,HashSegment是干什么的?这个和动态哈希表“dynmaic hashtable”的动态,或者说可扩展哈希表的可扩展有关。我认为用“可扩展哈希表”更能体现“dynmaic hashtable”的功能,更贴近中国人用词习惯,以后就用“可扩展哈希表”吧。可扩展哈希表以后再讨论。pg里还有个Shared memory index,也是这个可扩展哈希表类型的,是和共享内存管理有关的东东,到内存管理机制时再讨论。

    经过一连串的调用,hash_create创建的可扩展哈希表“Timezones”是一个由256个HashSegment,256个HashBucket,4个HashSegment+Entry组成的哈希表。在pg里,有的哈希表是放在内存上下文MemoryContext中的,有的哈希表是放在共享内存shared memory里的,这个 “Timezones”哈希表是放在“Timezones”内存上下文里的。为了看起来更清晰,就没有把“Timezones”哈希表放到AllocBlock里的AllocChunk里。结构图在下面。

http://dl.iteye.com/upload/attachment/608146/cad96a94-21fc-31ca-ac89-b13642b5dfe9.bmp
“Timezones”哈希表结构

 

    pg里的timezone文件以PG_BINARY格式存放在%PostgreSQL Home%\share\timezone里。
 

 
页: [1]
查看完整版本: pg启动过程中的那些事四:初始化全局时区global_timezone