技術文章:PostgreSQL pg_resetwal處理機制
pg_resetwal的參數
ControlFile結構及pg_resetwal參數影響的字段

static struct option long_options[] = { {"commit-timestamp-ids", required_argument, NULL, 'c'}, {"pgdata", required_argument, NULL, 'D'}, {"epoch", required_argument, NULL, 'e'}, {"force", no_argument, NULL, 'f'}, {"next-wal-file", required_argument, NULL, 'l'}, {"multixact-ids", required_argument, NULL, 'm'}, {"dry-run", no_argument, NULL, 'n'}, {"next-oid", required_argument, NULL, 'o'}, {"multixact-offset", required_argument, NULL, 'O'}, {"next-transaction-id", required_argument, NULL, 'x'}, {"wal-segsize", required_argument, NULL, 1}, {NULL, 0, NULL, 0} };
介紹
PG11允許用戶在線修改WAL段文件大小。以往版本需要重新編譯,并且不同--wal-segsize設置的PG相互不兼容。這個值范圍1—1024,為2的平方且單位M。當改變大小時建議和-l參數一起使用,設置下一個WAL文件名,防止重復使用之前的名字。下一個段文件名要比當前已存在的都要大,
該工具會將WAL目錄下日志全部刪除,并生成一個新WAL段文件。該文件名起名規則:
1、-l指定的段文件名解析出段號minXlogSegNo
2、FindEndOfXLOG掃描WAL目錄下所有文件得到最大的文件號:
1)newXlogSegNo為pg_control文件中記錄的ckp所屬段號
2)若目錄下由比這個號大的,則更新newXlogSegNo為該段號
3)該段號轉換成WAL長度后,除以新段文件大小得到新段文件段號newXlogSegNo,將之+1作為新段文件的段號
3、原pg_control文件中的ckp作為CHECKPOINT記錄寫入新段文件里面。該段文件僅寫這一個WAL,后面的大小全部清0。
4、新pg_control文件的checkpoint位置為該文件中CHECKPOINT記錄位置。
5、這個工具比較危險,慎用。
6、在主備環境中,備機啟動不起來,且日志損壞時,主機數據量非常大,全量重新拷貝又耗費時間特別長,此時可以嘗試使用這個工具:
1)比較備機和主機的pg_control文件的checkpoint位置,若備機和主機記錄的checkpoint位置相等,則可以執行pg_resetwal,這樣重新啟動后可以正常構建流復制,數據也不會丟
2)若備機的checkpoint小,使用這個pg_control文件進行pg_resetwal可能重啟后構建不起來流復制。使用主機的pg_control文件進行pg_resetwal,重啟后可構建流復制,但丟數據
3)若備機的checkpoint大,使用這個pg_control文件進行pg_resetwal,可能重啟后構建不起來流復制,即使構建起來也丟數據。使用主機的pg_control文件進行pg_resetwal,應該也可以正常。
4)備機的時間線文件需要清理
流程

pg_control文件的更新,然后調用KillExistingXLOG刪除pg_wal目錄下的所有WAL文件:
while(errno = 0, (xlde = readdir(xldir)) != NULL){ if(IsXLogFileName(xlde->d_name) || IsPartialXLogFileName(xlde->d_name)){ snprintf(path,sizeof(path), "%s/%s", XLOGDIR, xlde->d_name); if(unlink(path) < 0){ pg_log_error("couldnot delete file "%s": %m", path); exit(1); } } }
調用函數KillExistingArchiveStatus刪除archive_status目錄下.ready,.done和.partial.ready、.partial.done文件:
while(errno = 0, (xlde = readdir(xldir)) != NULL){ if(strspn(xlde->d_name, "0123456789ABCDEF") == XLOG_FNAME_LEN&& (strcmp(xlde->d_name+ XLOG_FNAME_LEN, ".ready") == 0 || strcmp(xlde->d_name + XLOG_FNAME_LEN,".done") == 0 || strcmp(xlde->d_name + XLOG_FNAME_LEN,".partial.ready") == 0 || strcmp(xlde->d_name + XLOG_FNAME_LEN,".partial.done") == 0)) { snprintf(path,sizeof(path), "%s/%s", ARCHSTATDIR, xlde->d_name); if(unlink(path) < 0){ pg_log_error("couldnot delete file "%s": %m", path); exit(1); } } }
最后調用函數WriteEmptyXLOG創建一個新WAL段文件,并僅寫入一個checkpoint記錄,其中checkpoint記錄來自ControlFile結構。
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
-
11月7日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯網行業年度評選
-
11月20日立即報名>> 【免費下載】RISC-V芯片發展現狀與測試挑戰-白皮書
-
即日-11.25立即下載>>> 費斯托白皮書《柔性:汽車生產未來的關鍵》
-
11月27日立即報名>> 【工程師系列】汽車電子技術在線大會
-
11月28日立即下載>> 【白皮書】精準洞察 無線掌控——283FC智能自檢萬用表
-
12月18日立即報名>> 【線下會議】OFweek 2025(第十屆)物聯網產業大會


分享













