那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

37年歷史的PostgreSQL數(shù)據(jù)庫將進(jìn)行重大架構(gòu)變更

jf_WZTOguxH ? 來源:InfoQ ? 2023-06-25 15:54 ? 次閱讀

在瞬息萬變的開源世界中,軟件項(xiàng)目來得快、去得也快。如今獲得廣泛追捧的工具,很可能在短時間后就被更好的成果取代,再也無人問津。但即使在這樣殘酷的環(huán)境下,也有不少項(xiàng)目能夠長期保持生命力。

PostgreSQL 數(shù)據(jù)庫系統(tǒng)就是其中的典型,其歷史可以追溯到 1986 年的伯克利 POSTGRES 項(xiàng)目。經(jīng)過幾十年的發(fā)展,作為一款跨平臺、免費(fèi)和開源的數(shù)據(jù)庫軟件,PostgreSQL 應(yīng)用已經(jīng)相當(dāng)廣泛:根據(jù) Stack Overflow 2023 開發(fā)者調(diào)查數(shù)據(jù)顯示,PostgreSQL 甚至超越了 MySQL,成為開發(fā)人員首選。

對擁有如此悠久歷史的大型代碼庫做根本性變更絕非易事,但項(xiàng)目開發(fā)團(tuán)隊(duì)正在認(rèn)真考慮這種可能性,希望讓 PostgreSQL 脫離長久以來的面向進(jìn)程模型。

任何 PostgreSQL 實(shí)例都是以大量協(xié)作進(jìn)程的形式保持運(yùn)行,其中包含一個用于所有接入客戶端的進(jìn)程。這些進(jìn)程使用精心設(shè)計(jì)的庫通過多個共享內(nèi)存區(qū)域進(jìn)行彼此通信,而這個庫的作用就是在內(nèi)存設(shè)置各異、映射地址不同的所有進(jìn)程之間建立起復(fù)雜的數(shù)據(jù)結(jié)構(gòu)。

多年以來,這套模型一直兢兢業(yè)業(yè)地支撐整個項(xiàng)目。但隨著項(xiàng)目發(fā)展,現(xiàn)實(shí)世界正在發(fā)生巨大變化。因此,PostgreSQL 開發(fā)團(tuán)隊(duì)意識到必須盡快調(diào)整、順應(yīng)現(xiàn)實(shí)的潮流。

一份提案

今年 6 月初,Heikki Linnakangas 在經(jīng)過一系列線下討論之后,發(fā)布了將 PostgreSQL 轉(zhuǎn)為線程模型的提案。

89bbb4cc-1250-11ee-962d-dac502259ad0.png

我覺得現(xiàn)在大家已經(jīng)達(dá)成了強(qiáng)烈共識,比以往任何時候都更支持這項(xiàng)重大調(diào)整。實(shí)現(xiàn)這個目標(biāo)需要投入大量精力、討論很多細(xì)節(jié),但團(tuán)隊(duì)高層對這個基本思路沒有異議。 這封電子郵件的發(fā)布,就是想把這種沉默的共識變成明確的發(fā)展路線。

其中簡要概括了這項(xiàng)遷移所涉及的種種挑戰(zhàn),并低調(diào)地承認(rèn)轉(zhuǎn)化過程“肯定無法通過單一版本徹底完成”。但郵件中沒有提到推動這項(xiàng)重大變更的原因,好在隨著討論的進(jìn)行,相關(guān)信息很快得到了補(bǔ)充。正如 Andres Freund(PostgreSQL Developer & Committer,EnterpriseDB 高級數(shù)據(jù)庫架構(gòu)師)指出的那樣:

我認(rèn)為原有流程模型開始產(chǎn)生諸多限制,這個問題在大型設(shè)備上體現(xiàn)得尤其明顯??邕M(jìn)程上下文切換所帶來的開銷,原本就比在同一進(jìn)程內(nèi)的不同線程間切換要更高——我估計(jì)這種開銷還將持續(xù)提升。面對大量連接,整個體系最終一定會因 TLB 未命中而浪費(fèi)大量時間。這是進(jìn)程模型無法跨進(jìn)程共享 TLB 的天然屬性造成的必然結(jié)果。

他還提到,進(jìn)程模型也增加了開發(fā)成本,迫使項(xiàng)目不得不維護(hù)大量重復(fù)代碼,包括在同一地址空間內(nèi)保留本不必要的多種內(nèi)存管理機(jī)制。在隨后的消息中,他還補(bǔ)充稱由于線程全部運(yùn)行在同一地址空間之內(nèi),因此可以更高效地實(shí)現(xiàn)狀態(tài)共享。

89e34316-1250-11ee-962d-dac502259ad0.png

但有部分開發(fā)人員反映,Linnakangas 所說的“強(qiáng)烈共識”可能并沒有那么強(qiáng)烈。Postgres 的主要貢獻(xiàn)者 Tom Lane 表示,“我認(rèn)為這將是一場災(zāi)難,大量原有代碼將受到影響?!彼S后補(bǔ)充稱,此次調(diào)整將帶來“巨大”成本,產(chǎn)生“不止一個安全級 bug”,也無法證明其收益超過成本投入。有人提出,目前還有其他一些高優(yōu)先級工作值得早做打算。也有人擔(dān)心隨著進(jìn)程模型被淘汰,原本基于各獨(dú)立進(jìn)程的隔離性將被打破,導(dǎo)致系統(tǒng)的整體健壯性受到破壞。

盡管如此,大部分 PostgreSQL 開發(fā)者還是以謹(jǐn)慎樂觀的態(tài)度支持、至少愿意嘗試這一改動。EnterpriseDB 副總裁、首席數(shù)據(jù)庫科學(xué)家,PostgreSQL 主要貢獻(xiàn)者 Robert Haas 表示,PostgreSQL 在大型系統(tǒng)上的擴(kuò)展性確實(shí)不佳,主要就是因?yàn)樗羞M(jìn)程都在消耗資源。“其他很多數(shù)據(jù)庫并不存在這個問題。如果不進(jìn)行某種重大的架構(gòu)變更,PostgreSQL 將無法克服這個難題?!?/p>

也許單純轉(zhuǎn)向線程模型可能還不夠,但他認(rèn)為這將為其他后續(xù)改進(jìn)開個好頭。

從提案到現(xiàn)實(shí)

將 PostgreSQL 服務(wù)器的核心轉(zhuǎn)移至單一地址空間,幾乎必然帶來諸多挑戰(zhàn)。正如 Haas 等研究人員所指出,其中最大的問題就是服務(wù)器“目前正頻繁使用全局變量”。具體來講,當(dāng)每個服務(wù)器進(jìn)程都擁有自己的集合時,全局變量就能良好運(yùn)作;而在用線程加以替代時則會引發(fā)問題。根據(jù) Konstantin Knizhnik 的說法,PostgreSQL 服務(wù)器目前使用約 2000 個全局變量。

開發(fā)團(tuán)隊(duì)隨后討論了該問題的幾種解決思路。首先是將所有全局變量拉入統(tǒng)一的“會話狀態(tài)”結(jié)構(gòu),而這套結(jié)構(gòu)具備線程本地化屬性。但考慮到需要創(chuàng)建并維護(hù)的是需要容納 2000 個變量成員的復(fù)雜結(jié)構(gòu)時,這個提議因?yàn)榭尚行蕴投芸焓チ宋ΑA硪环N方法是直接把所有全局變量放入線程本地存儲內(nèi),這種方法倒是簡單可行,但大量使用線程本地存儲會導(dǎo)致性能損失,損耗轉(zhuǎn)為線程模型帶來的收益。Haas 指出,對全局變量做明確標(biāo)記(包括將其放入線程本地存儲)本身也有積極的意義,可說為減少全局變量的使用開了個好頭。Freund 贊同這個觀點(diǎn),并表示即使后續(xù)沒有全面轉(zhuǎn)向線程模型,這項(xiàng)調(diào)整也將有所回報(bào)。

但 Freund 也警告稱,將全局變量轉(zhuǎn)移至線程本地存儲只是這項(xiàng)工作中最簡單的部分:

在此之后,重新設(shè)計(jì) postmaster、定義如何處理擴(kuò)展庫、擴(kuò)展兼容性、開發(fā)工具以實(shí)現(xiàn)線程化 postgres、在會話生命周期內(nèi)建立新的內(nèi)存分配和釋放機(jī)制(以往是通過退出進(jìn)程實(shí)現(xiàn)內(nèi)存釋放)、保證變更的可審查性和可移植性等等,全都是更加困難的工作。

這里還有一個討論熱度不高、但卻非常有趣的觀點(diǎn),即 Knizhnik 已經(jīng)完成了 PostgreSQL 的線程端口。他說全局變量的問題并不是那么難以解決。他在配置數(shù)據(jù)、錯誤處理、信號等方面遇到的麻煩還更多。另外,支持由外部維護(hù)的擴(kuò)展也是個重大挑戰(zhàn)??杀M管如此,他還是認(rèn)可轉(zhuǎn)向線程模型所帶來的一系列顯著回報(bào),只是提醒項(xiàng)目決策層在采取任何行動之前,務(wù)必要認(rèn)真做好研究分析。

PostgreSQL 開發(fā)團(tuán)隊(duì)還想到了另一個復(fù)雜問題,即是否可能同時支持基于進(jìn)程和基于線程兩種模式。在繼續(xù)支持進(jìn)程模式的同時引入線程架構(gòu)不僅極為困難,而且會顯著增加項(xiàng)目的總體維護(hù)負(fù)擔(dān)。但 Haas 堅(jiān)持認(rèn)為,PostgreSQL 絕對不可能徹底放棄對進(jìn)程模式的支持。畢竟線程在一部分用例中的性能反而更差,也有不少重要擴(kuò)展無法在線程模式下正常運(yùn)行。他強(qiáng)調(diào)稱,只有在確認(rèn)線程架構(gòu)運(yùn)行良好之后,才可能認(rèn)真討論要不要徹底放棄進(jìn)程支持。

目前無論是從郵件討論還是從社交媒體平臺投票結(jié)果來看,大多數(shù) PostgreSQL 開發(fā)者認(rèn)同架構(gòu)轉(zhuǎn)換的理論收益。

89fccfac-1250-11ee-962d-dac502259ad0.png

并且,數(shù)據(jù)庫管理系統(tǒng) Peloton 早在 2015 年就已經(jīng)嘗試讓 PostgreSQL 多線程化了。至于 PostgreSQL 本身,從討論到具體實(shí)施落地還有很長的路要走,更重要的是,需要有人主動請纓、表示愿意投入時間來推進(jìn)這項(xiàng)工作。

8a22fe7a-1250-11ee-962d-dac502259ad0.png

Peloton 的《Postgres 架構(gòu)變更公告》:

最初,Postgres 采用的是多進(jìn)程架構(gòu)。其中主進(jìn)程名為 Postmaster,負(fù)責(zé)處理 Postgres 接收到的請求,以及啟動、關(guān)閉等系統(tǒng)層面的操作。請注意,Postmaster 本身并不執(zhí)行這些操作,而會派生出子進(jìn)程來執(zhí)行操作。再有,處理用戶查詢的 backend 也是由 Postmaster 分叉而來。這種架構(gòu)非常適合基于磁盤的數(shù)據(jù)庫,因?yàn)榇疟P可以作為大容量共享存儲。由于 peloton 充當(dāng)主內(nèi)存數(shù)據(jù)庫,多進(jìn)程架構(gòu)導(dǎo)致不同后端和 peloton 數(shù)據(jù)庫間的信息共享變得極其困難。在早期的嘗試中,我們曾考慮用共享內(nèi)存讓 peloton 從每個分叉的 backend 處獲取查詢計(jì)劃和其他信息。但結(jié)果證明其性能慢得令人無法接受,因此我們最終決定將 Postgres 轉(zhuǎn)為多線程架構(gòu)!

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)庫
    +關(guān)注

    關(guān)注

    7

    文章

    3846

    瀏覽量

    64686
  • 架構(gòu)
    +關(guān)注

    關(guān)注

    1

    文章

    519

    瀏覽量

    25554
  • MySQL
    +關(guān)注

    關(guān)注

    1

    文章

    829

    瀏覽量

    26743

原文標(biāo)題:這將是一場災(zāi)難?37年歷史的PostgreSQL數(shù)據(jù)庫將進(jìn)行重大架構(gòu)變更

文章出處:【微信號:AI前線,微信公眾號:AI前線】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    dbForge Studio for PostgreSQL:PostgreSQL數(shù)據(jù)庫多功能集成開發(fā)環(huán)境

    數(shù)據(jù)庫模式和表數(shù)據(jù)的比較和同步 高效便捷地生成針對特定列的智能測試數(shù)據(jù) 支持14種格式的數(shù)據(jù)導(dǎo)入和導(dǎo)出 數(shù)據(jù)透視表中的
    的頭像 發(fā)表于 01-16 17:26 ?112次閱讀

    數(shù)據(jù)庫是哪種數(shù)據(jù)庫類型?

    數(shù)據(jù)庫是一種部署在虛擬計(jì)算環(huán)境中的數(shù)據(jù)庫,它融合了云計(jì)算的彈性和可擴(kuò)展性,為用戶提供高效、靈活的數(shù)據(jù)庫服務(wù)。云數(shù)據(jù)庫主要分為兩大類:關(guān)系型數(shù)據(jù)庫
    的頭像 發(fā)表于 01-07 10:22 ?142次閱讀

    如何使用cmp進(jìn)行數(shù)據(jù)庫管理的技巧

    使用 cmp 命令進(jìn)行數(shù)據(jù)庫管理可能不是最直觀的方法,因?yàn)?cmp 通常用于比較兩個文件是否相同。然而,如果你的意圖是使用 cmp 來檢查數(shù)據(jù)庫文件或備份文件的一致性,以下是一些技巧和步驟,可以幫助
    的頭像 發(fā)表于 12-17 09:31 ?180次閱讀

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—Mysql數(shù)據(jù)庫表記錄丟失的數(shù)據(jù)恢復(fù)流程

    Mysql數(shù)據(jù)庫故障: Mysql數(shù)據(jù)庫表記錄丟失。 Mysql數(shù)據(jù)庫故障表現(xiàn): 1、Mysql數(shù)據(jù)庫表中無任何數(shù)據(jù)或只有部分
    的頭像 發(fā)表于 12-16 11:05 ?223次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—Mysql<b class='flag-5'>數(shù)據(jù)庫</b>表記錄丟失的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)流程

    數(shù)據(jù)庫事件觸發(fā)的設(shè)置和應(yīng)用

    數(shù)據(jù)庫無論對于生產(chǎn)管理還是很多的實(shí)際應(yīng)用都非常重要。小編這次聊一下數(shù)據(jù)庫事件觸發(fā)的應(yīng)用。示例使用了postgresql和Python。
    的頭像 發(fā)表于 12-13 15:14 ?216次閱讀

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—MYSQL數(shù)據(jù)庫ibdata1文件損壞的數(shù)據(jù)恢復(fù)案例

    mysql數(shù)據(jù)庫故障: mysql數(shù)據(jù)庫文件ibdata1、MYI、MYD損壞。 故障表現(xiàn):1、數(shù)據(jù)庫無法進(jìn)行查詢等操作;2、使用mysqlcheck和myisamchk無法修復(fù)
    的頭像 發(fā)表于 12-09 11:05 ?222次閱讀

    不用編程不用電腦,快速實(shí)現(xiàn)多臺Modbus協(xié)議的PLC、智能儀表對接SQL數(shù)據(jù)庫

    的參數(shù)按照任務(wù)組自動生成SQL命令語句,實(shí)現(xiàn)多設(shè)備SQL命令與數(shù)據(jù)庫軟件對接,支持MySQL、SQLServer、PostgreSQL、Oracle等。
    的頭像 發(fā)表于 12-09 10:53 ?340次閱讀
    不用編程不用電腦,快速實(shí)現(xiàn)多臺Modbus協(xié)議的PLC、智能儀表對接SQL<b class='flag-5'>數(shù)據(jù)庫</b>

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—通過拼接數(shù)據(jù)庫碎片恢復(fù)SQLserver數(shù)據(jù)庫

    一個運(yùn)行在存儲上的SQLServer數(shù)據(jù)庫,有1000多個文件,大小幾十TB。數(shù)據(jù)庫每10天生成一個NDF文件,每個NDF幾百GB大小。數(shù)據(jù)庫包含兩個LDF文件。 存儲損壞,數(shù)據(jù)庫
    的頭像 發(fā)表于 10-31 13:21 ?336次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—通過拼接<b class='flag-5'>數(shù)據(jù)庫</b>碎片恢復(fù)SQLserver<b class='flag-5'>數(shù)據(jù)庫</b>

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—SQL Server數(shù)據(jù)庫出現(xiàn)823錯誤的數(shù)據(jù)恢復(fù)案例

    SQL Server數(shù)據(jù)庫故障: SQL Server附加數(shù)據(jù)庫出現(xiàn)錯誤823,附加數(shù)據(jù)庫失敗。數(shù)據(jù)庫沒有備份,無法通過備份恢復(fù)數(shù)據(jù)庫。
    的頭像 發(fā)表于 09-20 11:46 ?410次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—SQL Server<b class='flag-5'>數(shù)據(jù)庫</b>出現(xiàn)823錯誤的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    恒訊科技分析:跨境電商網(wǎng)站有哪些數(shù)據(jù)庫系統(tǒng)是推薦使用的?

    聞名,適合處理大量的數(shù)據(jù)和高并發(fā)請求,是電商網(wǎng)站常用的數(shù)據(jù)庫之一 。 2、PostgreSQLPostgreSQL是一個高度可擴(kuò)展的開源對象關(guān)系數(shù)
    的頭像 發(fā)表于 08-12 15:01 ?451次閱讀

    恒訊科技分析:sql數(shù)據(jù)庫怎么用?

    SQL數(shù)據(jù)庫的使用通常包括以下幾個基本步驟: 1、選擇數(shù)據(jù)庫系統(tǒng): 選擇適合您需求的SQL數(shù)據(jù)庫系統(tǒng),如MySQL、PostgreSQL、Microsoft SQL Server、SQ
    的頭像 發(fā)表于 07-15 14:40 ?413次閱讀

    MongoDB數(shù)據(jù)恢復(fù)—MongoDB數(shù)據(jù)庫文件損壞的數(shù)據(jù)恢復(fù)案例

    的情況下,數(shù)據(jù)庫文件拷貝到其他分區(qū)??截愅瓿珊?b class='flag-5'>將原MongoDB數(shù)據(jù)庫所在分區(qū)進(jìn)行了格式化操作,然后
    的頭像 發(fā)表于 04-23 14:48 ?456次閱讀
    MongoDB<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—MongoDB<b class='flag-5'>數(shù)據(jù)庫</b>文件損壞的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    華為云多模數(shù)據(jù)庫 GeminiDB 架構(gòu)與應(yīng)用實(shí)踐直播問答實(shí)錄

    龍通過直播(鏈接見文末)的方式,分享了《華為云多模數(shù)據(jù)庫 GeminiDB 的技術(shù)架構(gòu)及應(yīng)用實(shí)踐》,對 GeminiDB 的技術(shù)特性、架構(gòu)優(yōu)勢等進(jìn)行了全方位解讀。整場直播干貨滿滿,讓觀
    的頭像 發(fā)表于 04-08 18:25 ?1208次閱讀

    PostgreSQL數(shù)據(jù)庫連接報(bào)錯故障分析

    數(shù)據(jù)庫的密碼設(shè)置錯誤或未設(shè)置,在連接到本地服務(wù)后,重新設(shè)置即可。本次錯誤就是大意密碼錯打了一個字母。
    的頭像 發(fā)表于 03-15 10:00 ?1663次閱讀
    <b class='flag-5'>PostgreSQL</b><b class='flag-5'>數(shù)據(jù)庫</b>連接報(bào)錯故障分析

    GSMA最新資訊:IMEI數(shù)據(jù)庫平臺品牌更新與鏈接地址變更告知

    GSMA最新資訊:IMEI數(shù)據(jù)庫平臺品牌更新與鏈接地址變更告知
    的頭像 發(fā)表于 02-19 17:07 ?626次閱讀
    GSMA最新資訊:IMEI<b class='flag-5'>數(shù)據(jù)庫</b>平臺品牌更新與鏈接地址<b class='flag-5'>變更</b>告知
    微信百家乐官网群资源| 百家乐官网乐翻天| 御金娱乐| 明陞百家乐娱乐城| 百家乐图表分析| 七胜百家乐官网娱乐城总统网上娱乐城大都会娱乐城赌场 | 百家乐官网伴侣| 百家乐官网算牌皇冠网| 大发888信誉平台| 百家乐真钱娱乐| 打百家乐官网最好办法| 简阳市| 大发888娱乐城客户端| 深圳百家乐的玩法技巧和规则 | 百家乐官网与龙虎斗怎么玩| 优博在线娱乐| 大发888娱乐场开户注册| 百家乐出庄的概率| 网络百家乐最安全| 索雷尔百家乐官网的玩法技巧和规则| 百家乐官网最好投注| 利记娱乐场| 大发888老虎机手机版下载安装| 茅台百家乐的玩法技巧和规则 | 百家乐官网高档筹码| 百家乐长t恤| 百家乐平台网| KK百家乐官网娱乐城 | 百家乐视频麻将| 神州百家乐官网的玩法技巧和规则| 百家乐官网注册优惠平台| 宣武区| 王牌国际| 大发888娱乐场 888| 疯狂百家乐游戏| 百家乐赢退输进有哪些| 太阳城百家乐试玩优惠| 真人百家乐口诀| 百家乐官网园有限公司| 新加坡百家乐官网的玩法技巧和规则 | 宝马会百家乐的玩法技巧和规则|