PostgreSQL中的查詢:1.查詢執(zhí)行階段
開始關(guān)于PG內(nèi)部執(zhí)行機(jī)制的文章系列。這一篇側(cè)重于查詢計(jì)劃和執(zhí)行機(jī)制。
本系列包括:
1、查詢執(zhí)行階段(本文)
2、統(tǒng)計(jì)數(shù)據(jù)
3、順序掃描
4、索引掃描
5、嵌套循環(huán)連接
6、哈希連接
7、Merge join
本系列針對(duì)PG14編寫。
簡(jiǎn)單查詢協(xié)議
PG客戶端-服務(wù)協(xié)議的基本目的是雙重的:將SQL查詢發(fā)送到服務(wù),接收整個(gè)執(zhí)行結(jié)果作為響應(yīng)。服務(wù)接收到查詢?nèi)?zhí)行要經(jīng)過(guò)幾個(gè)階段。
解析
首先,需要解析查詢文本,這樣服務(wù)才能準(zhǔn)確了解需要執(zhí)行什么。
詞法分析器和解析器。詞法解析器負(fù)責(zé)識(shí)別查詢字符串中的詞位(如SQL關(guān)鍵字、字符串、數(shù)字文字等),而解析器確保生成的詞位集在語(yǔ)法上是有效的。解析器和詞法解析器使用標(biāo)準(zhǔn)工具Bison和Flex實(shí)現(xiàn)。解析的查詢表示位抽象的語(yǔ)法樹。例如:
在這里,將在后臺(tái)內(nèi)存中構(gòu)建一棵樹。下面以高度簡(jiǎn)化的形式表示該樹。樹中節(jié)點(diǎn)用查詢的相應(yīng)部分標(biāo)記:
RTE是一個(gè)晦澀的縮寫,表示“范圍表?xiàng)l目”。PG源碼中“range table”指***查詢、連接結(jié)果--也就是說(shuō)SQL語(yǔ)句操作的任何記錄集。
語(yǔ)法分析器。語(yǔ)法分析器確定數(shù)據(jù)庫(kù)中是否存在查詢中引用的表和其他對(duì)象,用戶是否有訪問(wèn)這些對(duì)象的權(quán)限。語(yǔ)法分析需要的所有信息都在系統(tǒng)catalog中。
語(yǔ)法分析接收分析器傳來(lái)的解析樹并重新構(gòu)建它,并用引用的特定數(shù)據(jù)庫(kù)對(duì)象、數(shù)據(jù)類型信息等來(lái)補(bǔ)充它。如果開啟debug_right_parse,則會(huì)在服務(wù)消息日志中顯示完整的樹信息,盡管這沒(méi)什么實(shí)際意義。
轉(zhuǎn)換
下一步,對(duì)查詢進(jìn)行重寫。
系統(tǒng)內(nèi)核將重寫用于多種目的。其中之一是將解析樹中的視圖名替換為該視圖查詢相對(duì)應(yīng)的子樹。pg_tables是上面例子的一個(gè)視圖,重寫后的解析樹將采用以下形式:
解析樹對(duì)應(yīng)的查詢(經(jīng)所有操作僅在樹上執(zhí)行,而不是在查詢文本上執(zhí)行):
解析樹反映查詢的語(yǔ)法結(jié)構(gòu),而不是執(zhí)行操作的順序。行級(jí)安全性在轉(zhuǎn)換階段實(shí)施。
系統(tǒng)核心使用重寫的另一個(gè)例子是版本14中遞歸查詢的SEARCH和CYCLE子句中實(shí)現(xiàn)。
PG支持自定義轉(zhuǎn)換,用戶可以使用重寫規(guī)則系統(tǒng)來(lái)實(shí)現(xiàn)。規(guī)則系統(tǒng)作為PG主要功能之一。這些規(guī)則得到了項(xiàng)目基礎(chǔ)的支持,并在早期開發(fā)過(guò)程中反復(fù)重新設(shè)計(jì)。這是一個(gè)強(qiáng)大的機(jī)制,但難以理解和調(diào)試。甚至有人提議將規(guī)則從PG中完全刪除,但沒(méi)有得到普遍支持。在大多數(shù)情況下,使用觸發(fā)器而不是規(guī)則更安全、更方便。
如果debug_print_rewritten開啟,則完整重寫的解析樹會(huì)顯示在服務(wù)消息日志中。
計(jì)劃
SQL是一種聲明性語(yǔ)言:查詢指定要檢索什么,但不指定如何檢索它。任何查詢都可以通過(guò)多種方式執(zhí)行。解析樹中的每個(gè)操作都有多個(gè)執(zhí)行選項(xiàng)。例如,您可以通過(guò)讀取整個(gè)表并丟棄不需要的行來(lái)從表中檢索特定記錄,或者可以使用索引來(lái)查詢與您查詢匹配的行。數(shù)據(jù)集總是成對(duì)連接。連接順序的變化會(huì)產(chǎn)生大量執(zhí)行選項(xiàng)。然后有許多方法可以將2組行連接在一起。例如,您可以逐個(gè)遍歷第一個(gè)集合中的行,并在另一個(gè)集合中查找匹配的行,或者您可以先對(duì)2個(gè)集合進(jìn)行排序,然后將他們合并在一起。不同方法在某些情況下表現(xiàn)更好,在另一些情況下表現(xiàn)更差。
最佳計(jì)劃的執(zhí)行速度可能比非最佳計(jì)劃快幾個(gè)數(shù)量級(jí),這就是為什么優(yōu)化解析查詢的執(zhí)行計(jì)劃器是系統(tǒng)最復(fù)雜的元素之一。
計(jì)劃樹。執(zhí)行計(jì)劃也可以表示為樹,但其節(jié)點(diǎn)是對(duì)數(shù)據(jù)的物理操作而不是邏輯操作。
開啟debug_print_plan,則整個(gè)執(zhí)行計(jì)劃樹會(huì)顯示在服務(wù)消息日志中。這是非常不切實(shí)際的,因?yàn)槿罩痉浅;靵y。更方便的選擇是使用EXPLAIN命令:
EXPLAIN
SELECT schemaname, tablename
FROM pg_tables
WHERE tableowner = 'postgres'
ORDER BY tablename;
QUERY PLAN?????????????????????????????????????????????????????????????????????
Sort (cost=21.03..21.04 rows=1 width=128)
Sort Key: c.relname
?> Nested Loop Left Join (cost=0.00..21.02 rows=1 width=128)
Join Filter: (n.oid = c.relnamespace)
?> Seq Scan on pg_class c (cost=0.00..19.93 rows=1 width=72)
Filter: ((relkind = ANY ('{r,p}'::"char"[])) AND (pg_g...
?> Seq Scan on pg_namespace n (cost=0.00..1.04 rows=4 wid...
(7 rows)
該圖顯示了樹的主要節(jié)點(diǎn)。相同的節(jié)點(diǎn)在EXPLAIN輸出中使用箭頭標(biāo)記。Seq Scan節(jié)點(diǎn)表示讀取表操作,而Nested Loop節(jié)點(diǎn)表示表連接操作。這里有2個(gè)優(yōu)趣的點(diǎn)需要注意:
1) 其中一個(gè)初始化表從執(zhí)行計(jì)劃樹中消失了,因?yàn)閳?zhí)行計(jì)劃器指出查詢處理中不需要它
2) 估算要處理的行數(shù)和每個(gè)節(jié)點(diǎn)處理的代價(jià)
計(jì)劃查詢。為找到最佳計(jì)劃,PG使用基于成本的查詢優(yōu)化器。優(yōu)化器會(huì)檢查各種可用的執(zhí)行計(jì)劃并估算需要的資源量,例如IO周期和CPU周期。這個(gè)計(jì)算出的估算值轉(zhuǎn)換成任意單位,被稱為計(jì)劃成本。選擇結(jié)果成本最低的計(jì)劃來(lái)執(zhí)行。
問(wèn)題是,可能的計(jì)劃數(shù)量隨著連接數(shù)量的增加而呈指數(shù)增長(zhǎng),即使對(duì)于相對(duì)簡(jiǎn)單的查詢,也無(wú)法一一篩選所有計(jì)劃。因此,使用動(dòng)態(tài)規(guī)劃和啟發(fā)式限制搜索范圍。這允許在合理的時(shí)間內(nèi)精確第解決查詢中更多表的問(wèn)題,但不能保證所選的計(jì)劃是真正最優(yōu)的。因?yàn)橛?jì)劃其使用簡(jiǎn)化的數(shù)學(xué)模型并可能使用不精確的初始化數(shù)據(jù)。
Ordering joins:可以以特定方式構(gòu)建查詢,以顯著縮小搜索范圍(有可能錯(cuò)過(guò)找到最佳計(jì)劃的機(jī)會(huì)):
1) 公共表表達(dá)式通常與主查詢分開優(yōu)化。從12開始可以使用MATERIALIZE子句來(lái)強(qiáng)制執(zhí)行此操作。
2) 來(lái)自非SQL函數(shù)的查詢和主查詢分開優(yōu)化。(在某些情況下,SQL函數(shù)可以內(nèi)聯(lián)到主查詢中)
3) join_collapse_limit參數(shù)與現(xiàn)式j(luò)oin子句以及from_collapse_limit參數(shù)與子查詢一起可以定義某些連接順序,具體取決于查詢語(yǔ)法。
最后一個(gè)可能需要解釋,下面的查詢調(diào)用FROM子句中的幾個(gè)表,沒(méi)有顯式連接:
SELECT ...FROM a, b, c, d, eWHERE ...
下面是此查詢的解析樹:
在這個(gè)查詢中,規(guī)劃器將考慮所有可能的連接順序。在下一個(gè)示例中,一些連接由JOIN子句顯式定義:
SELECT ...FROM a, b JOIN c ON ..., d, eWHERE ...
解析樹反映了這一點(diǎn):
規(guī)劃器折疊連接樹,有效地將其轉(zhuǎn)換為上一個(gè)示例中的樹。該算法遞歸地遍歷樹并用其組件的平面列表替換每個(gè)JOINEXPR節(jié)點(diǎn)。
但是只有在生成的屏幕列表包含不超過(guò)join_collapse_limit個(gè)元素(默認(rèn)8個(gè))時(shí),才會(huì)發(fā)生這種“扁平化”。在上面示例中,如果將join_collapse_limit設(shè)置5或更少,則不會(huì)折疊JOINEXPR節(jié)點(diǎn)。對(duì)于規(guī)劃器來(lái)說(shuō),這意味著兩件事:表B必須連接到表C(反之亦然,join對(duì)中的join 順序不受限制);表A、D、E以及B到C的連接可以按任意順序連接。
如果join_collapse_limit設(shè)置為1,則將保留任何顯式JOIN順序。注意,無(wú)論該參數(shù)如何,操作FULL OUTER JOIN都不會(huì)折疊。
參數(shù)from_collapse_limit(默認(rèn)也是8)以類似的方式限制子查詢的展平。子查詢似乎與連接沒(méi)有太多共同之處,但當(dāng)它歸結(jié)為解析樹級(jí)別時(shí),相似性顯而易見。
例子:
SELECT ...FROM a, b JOIN c ON ..., d, eWHERE ...
下面是對(duì)應(yīng)樹:
這里唯一的區(qū)別是JOINEXPR節(jié)點(diǎn)被替換成FROMEXPR(因此參數(shù)名稱為FROM)。
遺傳搜索:每當(dāng)生成的扁平樹以太多相同級(jí)別的節(jié)點(diǎn)(表或連接結(jié)果)結(jié)束時(shí),規(guī)劃時(shí)間可能會(huì)飆升,因?yàn)槊總€(gè)節(jié)點(diǎn)都需要單獨(dú)優(yōu)化。如果geqo參數(shù)開啟,當(dāng)同級(jí)節(jié)點(diǎn)數(shù)量達(dá)到geqo_threshold(默認(rèn)12)時(shí),PG將切換到遺傳搜索。遺傳搜索比動(dòng)態(tài)規(guī)劃的方法快得多。但并不能保證找到最佳計(jì)劃。該算法有許多可調(diào)整的選項(xiàng),這時(shí)另一篇文章主題。
選擇最佳計(jì)劃:最佳計(jì)劃的定義因預(yù)期用途而異。當(dāng)需要完整的輸出時(shí),計(jì)劃必須優(yōu)化與查詢匹配的所有行的檢索。另一方面,如果只想要前幾個(gè)匹配的行,則最佳計(jì)劃可能會(huì)完全不同。PG通過(guò)計(jì)算2個(gè)成本組件來(lái)解決這個(gè)問(wèn)題。他們顯示在“成本”一詞之后的查詢計(jì)劃輸出中:
Sort (cost=21.03..21.04 rows=1 width=128)
第一個(gè)組成部分:?jiǎn)?dòng)成本,是為節(jié)點(diǎn)執(zhí)行做準(zhǔn)備的成本;第2個(gè)組成部分,總成本:代表總節(jié)點(diǎn)執(zhí)行成本。
選擇計(jì)劃時(shí),計(jì)劃器首先要檢查是否使用cursor(可以通過(guò)DECLARE命令設(shè)置cursor或者在PL/pgSQL中明確聲明)。如果沒(méi)有,計(jì)劃器假設(shè)需要全部輸出并選擇總成本最低的計(jì)劃。否則,如果使用cursor,則規(guī)劃器會(huì)選擇一個(gè)規(guī)劃,以最佳方式檢索匹配行總數(shù)中等于cursor_tuple_fraction(默認(rèn)0.1)的行數(shù)。或者具體地說(shuō)最低的計(jì)劃:startup cost + cursor_tuple_fraction*(total cost- startup cost)。
成本計(jì)算過(guò)程。要估計(jì)計(jì)劃的成本,必須單獨(dú)估計(jì)其每個(gè)節(jié)點(diǎn)。節(jié)點(diǎn)成本取決于節(jié)點(diǎn)類型(從表中讀取的成本遠(yuǎn)低于對(duì)表排序的成本)和處理的數(shù)據(jù)量(通常,數(shù)據(jù)越多,成本越高)。雖然節(jié)點(diǎn)類型是立即知道的,但要評(píng)估數(shù)據(jù)量,我們首先需要估計(jì)節(jié)點(diǎn)的基數(shù)(輸入行的數(shù)量)和選擇性(剩余用于輸出的行的比例)。為此,我們需要數(shù)據(jù)統(tǒng)計(jì):表大小、跨列的數(shù)據(jù)分布。
因此優(yōu)化依賴于準(zhǔn)確的統(tǒng)計(jì)數(shù)據(jù),這些數(shù)據(jù)由自動(dòng)分析過(guò)程受繼并保持最新。
如果每個(gè)計(jì)劃節(jié)點(diǎn)的基數(shù)估計(jì)準(zhǔn)確,計(jì)算出的總成本通常會(huì)與實(shí)際成本相匹配。場(chǎng)景的計(jì)劃偏差通常是基數(shù)和選擇性估計(jì)不準(zhǔn)確的結(jié)果。這些錯(cuò)誤是由不準(zhǔn)確、過(guò)時(shí)或不可用的統(tǒng)計(jì)數(shù)據(jù)引起的,并在較小程度上是規(guī)劃期所基于的固有模型不完善。
基數(shù)估計(jì)。基數(shù)估計(jì)是遞歸執(zhí)行的。節(jié)點(diǎn)基數(shù)使用2個(gè)值計(jì)算:節(jié)點(diǎn)的字節(jié)的的基數(shù),或輸入行數(shù);節(jié)點(diǎn)的選擇性,或輸出行于輸入行的比例。基數(shù)是這2個(gè)值的成績(jī)。選擇性是一個(gè)介于0和1之間的數(shù)字。接近于零的選擇性值稱為高選擇性,接近1的值稱為低選擇性。這是因?yàn)楦哌x擇性會(huì)消除較高比例的行,而較低的選擇性值會(huì)降低閾值,因此丟棄的行數(shù)回更少。首先處理具有數(shù)據(jù)訪問(wèn)方法的葉節(jié)點(diǎn)。這就是表大小等統(tǒng)計(jì)信息的來(lái)源。應(yīng)用于表的條件的選擇性取決于條件類型。在最簡(jiǎn)單的形式中,選擇性可以是一個(gè)常數(shù)值,但計(jì)劃著回嘗試使用所有可用信息來(lái)產(chǎn)生最準(zhǔn)確的估計(jì)。最簡(jiǎn)單條件的選擇性估計(jì)作為基礎(chǔ),使用不二運(yùn)算構(gòu)建的復(fù)雜條件可以使用以下簡(jiǎn)單公式進(jìn)一步計(jì)算:
selx and y = selx sely
selx or y = 1-(1-selx )(1-sely )=selx + sely - selx sely
在這些公式中,x和y認(rèn)為是獨(dú)立的。如果他們相關(guān),則使用這些公式,會(huì)使估計(jì)不太準(zhǔn)確。對(duì)于連接的基數(shù)估計(jì),計(jì)算2個(gè)值:笛卡爾積的基數(shù)(2個(gè)數(shù)據(jù)集的基數(shù)的乘積)和連接條件的選擇性,這又取決于條件類型。其他節(jié)點(diǎn)類型的基數(shù),例如排序或聚合節(jié)點(diǎn)也是類似計(jì)算的。
請(qǐng)注意,較低節(jié)點(diǎn)中的基數(shù)計(jì)算錯(cuò)誤將向上傳播,導(dǎo)致成本估算不準(zhǔn)確,并最終導(dǎo)致次優(yōu)計(jì)劃。計(jì)劃器只有表的統(tǒng)計(jì)數(shù)據(jù),而不是連接結(jié)果的統(tǒng)計(jì)數(shù)據(jù),這使情況變得更糟。
代價(jià)估算。代價(jià)估算過(guò)程也是遞歸的。子樹的成本包括其子節(jié)點(diǎn)的成本加上父節(jié)點(diǎn)的成本。節(jié)點(diǎn)成本計(jì)算基于其執(zhí)行操作的數(shù)學(xué)模型。已經(jīng)計(jì)算的基數(shù)用于輸入。該過(guò)程計(jì)算啟動(dòng)成本和總成本。有些操作不需要任何準(zhǔn)備,可以立即開始執(zhí)行。對(duì)于這些操作,啟動(dòng)成本是0.其他操作可能有先決標(biāo)記。例如排序節(jié)點(diǎn)通常需要來(lái)自其子節(jié)點(diǎn)的所有數(shù)據(jù)才能開始操作。這些節(jié)點(diǎn)的啟動(dòng)成本不為0。即使下一個(gè)節(jié)點(diǎn)(或客戶端)只需要單行輸出,也必須計(jì)算此成本。
成本是計(jì)劃者的最佳估計(jì)。任何計(jì)劃錯(cuò)誤都會(huì)影響成本與實(shí)際執(zhí)行的相關(guān)程度。成本評(píng)估的注意目的是讓計(jì)劃者在相同條件下比較相同查詢的不同執(zhí)行計(jì)劃。在任何其他情況下,按成本比較查詢(更糟糕的是,不同的查詢)是沒(méi)有意義和錯(cuò)誤的。例如,考慮由于統(tǒng)計(jì)數(shù)據(jù)不準(zhǔn)確而被低估的成本。更新統(tǒng)計(jì)數(shù)據(jù)--成本可能會(huì)發(fā)生變化,但估算會(huì)變得更加準(zhǔn)確,計(jì)劃最終會(huì)得到改進(jìn)。
執(zhí)行
按照計(jì)劃執(zhí)行優(yōu)化后的查詢。在后端內(nèi)存中創(chuàng)建一個(gè)portal對(duì)象。Portal存儲(chǔ)著執(zhí)行查詢需要的狀態(tài)。這個(gè)狀態(tài)以樹的形式表示,其結(jié)構(gòu)與計(jì)劃樹相同。樹的節(jié)點(diǎn)作為裝配線,相互請(qǐng)求和傳遞行記錄:
從root節(jié)點(diǎn)開始執(zhí)行。Root節(jié)點(diǎn)(例子中的SORT節(jié)點(diǎn))向2個(gè)字節(jié)的請(qǐng)求數(shù)據(jù)。當(dāng)它接收到所有請(qǐng)求的數(shù)據(jù)時(shí)會(huì)執(zhí)行排序操作,然后將數(shù)據(jù)向上傳遞給客戶端。
一些節(jié)點(diǎn)(例如NESTLOOP節(jié)點(diǎn))連接來(lái)自不同來(lái)源的數(shù)據(jù)。該節(jié)點(diǎn)向2個(gè)字節(jié)的請(qǐng)求數(shù)據(jù)。在接收到與連接條件匹配的行后,節(jié)點(diǎn)立即將結(jié)果行傳遞給父節(jié)點(diǎn)(和排序不同,排序必須在處理他們之前接收所有行),然后該節(jié)點(diǎn)停止,知道其父節(jié)點(diǎn)請(qǐng)求另一行。因此,如果只需要部分結(jié)果(例如LIMIT設(shè)置),則操作不會(huì)完全執(zhí)行。
2個(gè)SEQSCAN葉節(jié)點(diǎn)是表掃描。根據(jù)父節(jié)點(diǎn)的請(qǐng)求,葉節(jié)點(diǎn)從表中讀取下一行并將其返回。這個(gè)節(jié)點(diǎn)和其他一些節(jié)點(diǎn)根本不存儲(chǔ)行,而只是交付并立即忘記他們。其他節(jié)點(diǎn)例如排序,可能需要一次存儲(chǔ)大量數(shù)據(jù)。為解決這個(gè)問(wèn)題,在后端內(nèi)存分配了一個(gè)work_mem內(nèi)存塊,默認(rèn)是保守的4MB限制;當(dāng)內(nèi)存用完時(shí),多余的數(shù)據(jù)會(huì)被發(fā)送到磁盤上的臨時(shí)文件中。
一個(gè)計(jì)劃可能包含多個(gè)具有存儲(chǔ)要求的節(jié)點(diǎn),因此他可能分配了幾塊內(nèi)存,每個(gè)塊大小為work_mem。查詢進(jìn)程可能占用的總內(nèi)存大小沒(méi)有限制。
擴(kuò)展查詢協(xié)議
使用簡(jiǎn)單的查詢協(xié)議,任何命令即使它一次又一次重復(fù)也會(huì)經(jīng)歷上述所有階段:解析、重寫、規(guī)劃、執(zhí)行。但是沒(méi)有理由一遍又一遍地解析同一個(gè)查詢。如果他們盡在常量上有所不同,也沒(méi)有理由重新解析查詢:解析樹將是相同的。簡(jiǎn)單查詢協(xié)議的另一個(gè)煩惱是客戶端接收完整的輸出,而不管它可能有多長(zhǎng)。
這2個(gè)問(wèn)題都可以通過(guò)使用SQL命令來(lái)解決:為第一個(gè)問(wèn)題準(zhǔn)備一個(gè)查詢并執(zhí)行它,為第二個(gè)問(wèn)題聲明一個(gè)游標(biāo)并獲取所需行。但隨后客戶端將不得不處理命名新對(duì)象,而服務(wù)器將需要解析額外的命令。
擴(kuò)展查詢協(xié)議可以在協(xié)議命令級(jí)別對(duì)單獨(dú)的執(zhí)行階段進(jìn)行精確控制。
準(zhǔn)備
在準(zhǔn)備期間,查詢會(huì)像往常一樣被解析和重寫,但解析樹存儲(chǔ)在后端內(nèi)存中。PG沒(méi)有用于解析查詢的全局緩存。即使一個(gè)進(jìn)程之前已經(jīng)解析過(guò)查詢,其他進(jìn)程也必須再次解析它。然而,這中設(shè)計(jì)也有好處。在高負(fù)載下,全局內(nèi)存緩沖很容易因?yàn)殒i稱為瓶頸。一個(gè)客戶端發(fā)送多個(gè)小命令可能會(huì)影響整個(gè)實(shí)例的性能。在PG中,查詢解析很便宜并與其他進(jìn)程隔離。
可以使用附加參數(shù)準(zhǔn)備查詢。下面是一個(gè)使用SQL命令的例子(同樣,這并不等同于協(xié)議命令級(jí)別的準(zhǔn)備,但最終的效果是一樣的):
PREPARE plane(text) ASSELECT * FROM aircrafts WHERE aircraft_code = $1;
本文的案例都使用demo數(shù)據(jù)庫(kù)“Airlines”。此視圖顯示所有命名的預(yù)準(zhǔn)備語(yǔ)句:
SELECT name, statement, parameter_types
FROM pg_prepared_statements gx
?[ RECORD 1 ]???+??????????????????????????????????????????????????
name | plane
statement | PREPARE plane(text) AS +
| SELECT * FROM aircrafts WHERE aircraft_code = $1;
parameter_types | {text}
該視圖沒(méi)有列出任何未命名的語(yǔ)句(使用擴(kuò)展協(xié)議或PL/pgSQL)。但它也沒(méi)有列出來(lái)其他會(huì)話的準(zhǔn)備好的語(yǔ)句:訪問(wèn)另一個(gè)會(huì)話的內(nèi)存是不可能的。
參數(shù)綁定
在執(zhí)行準(zhǔn)備好的查詢之前,會(huì)綁定當(dāng)前參數(shù)值。
EXECUTE plane('733');
aircraft_code | model | range
???????????????+???????????????+???????
733 | Boeing 737?300 | 4200(1 row)
與文字表達(dá)式的串聯(lián)相比,準(zhǔn)備好的語(yǔ)句的一個(gè)優(yōu)點(diǎn)是可以防止任何類型的SQL注入。因?yàn)閰?shù)值不會(huì)影響已經(jīng)構(gòu)建的解析樹。在沒(méi)有準(zhǔn)備好的聲明的情況下達(dá)到相同的安全級(jí)別,將需要對(duì)來(lái)自不受信任來(lái)源的所有值進(jìn)行廣泛轉(zhuǎn)義。
規(guī)劃和執(zhí)行
執(zhí)行準(zhǔn)備好的語(yǔ)句時(shí),首先會(huì)考慮提供的參數(shù)來(lái)計(jì)劃其查詢,然后發(fā)送選擇的計(jì)劃以執(zhí)行。實(shí)際參數(shù)值對(duì)規(guī)劃者很重要,因?yàn)椴煌瑓?shù)集的最有規(guī)劃也可能不同。例如,在查找高級(jí)航班預(yù)訂時(shí),使用索引掃描(例如Index Scan字樣所示),因?yàn)橛?jì)劃者預(yù)計(jì)匹配的行不多:
CREATE INDEX ON bookings(total_amount);
EXPLAIN SELECT * FROM bookings WHERE total_amount > 1000000;
QUERY PLAN?????????????????????????????????????????????????????????????????????
Bitmap Heap Scan on bookings (cost=86.38..9227.74 rows=4380 wid...
Recheck Cond: (total_amount > '1000000'::numeric)
?> Bitmap Index Scan on bookings_total_amount_idx (cost=0.00....
Index Cond: (total_amount > '1000000'::numeric)
(4 rows)
然而,下一個(gè)條件完全符合所有預(yù)訂。索引掃描在這里沒(méi)用,進(jìn)行順序掃描Seq Scan:
EXPLAIN SELECT * FROM bookings WHERE total_amount > 100;
QUERY PLAN???????????????????????????????????????????????????????????????????
Seq Scan on bookings (cost=0.00..39835.88 rows=2111110 width=21)
Filter: (total_amount > '100'::numeric)
(2 rows)
在某些情況下,除了解析樹外,規(guī)劃器還會(huì)存儲(chǔ)查詢計(jì)劃,以避免再出現(xiàn)時(shí)再次規(guī)劃它。整個(gè)沒(méi)有參數(shù)值的計(jì)劃稱為通用計(jì)劃,而不是使用給定參數(shù)值生成的自定義計(jì)劃。通用計(jì)劃的一個(gè)明顯用例是沒(méi)有參數(shù)的語(yǔ)句。
對(duì)于前4此運(yùn)行,帶有參數(shù)的預(yù)處理語(yǔ)句總是根據(jù)實(shí)際參數(shù)值進(jìn)行優(yōu)化。然后計(jì)算平均計(jì)劃成本。在第5次及以后,如果通用計(jì)劃平均比自定義計(jì)劃代價(jià)低,那么規(guī)劃器從那時(shí)起存儲(chǔ)和使用通用計(jì)劃,并進(jìn)行進(jìn)一步優(yōu)化。
plane準(zhǔn)備好的語(yǔ)句已經(jīng)執(zhí)行過(guò)一次,在接下來(lái)的2次執(zhí)行中,仍然使用自定義計(jì)劃,如查詢計(jì)劃中的參數(shù)值所示:
EXECUTE plane('763');
EXECUTE plane('773');
EXPLAIN EXECUTE plane('319');
QUERY PLAN??????????????????????????????????????????????????????????????????
Seq Scan on aircrafts_data ml (cost=0.00..1.39 rows=1 width=52)
Filter: ((aircraft_code)::text = '319'::text)
(2 rows)
執(zhí)行4次后,規(guī)劃器切換到通用規(guī)劃。在這種情況下,通用計(jì)劃與定制計(jì)劃相同,成本相同,因此更可取。現(xiàn)在EXPLAIN命令顯示參數(shù)編號(hào),而不是實(shí)際值:
EXECUTE plane('320');
EXPLAIN EXECUTE plane('321');
QUERY PLAN??????????????????????????????????????????????????????????????????
Seq Scan on aircrafts_data ml (cost=0.00..1.39 rows=1 width=52)
Filter: ((aircraft_code)::text = '$1'::text)
(2 rows)
不幸的是,只有前4個(gè)定制計(jì)劃比通用計(jì)劃更昂貴,而任何進(jìn)一步的定制計(jì)劃都會(huì)更便宜,但計(jì)劃者會(huì)完全忽略他們。另一個(gè)可能的不完善來(lái)源是計(jì)劃者比較成本估算,而不是要花費(fèi)的實(shí)際資源成本。
這就是為什么在版本12及更高版本中,如果用戶不喜歡自動(dòng)結(jié)果,他們可以強(qiáng)制系統(tǒng)使用通用計(jì)劃或自定義計(jì)劃。這是通過(guò)參數(shù)plan_cache_mode來(lái)完成:
SET plan_cache_mode = 'force_custom_plan';
EXPLAIN EXECUTE plane('CN1');
QUERY PLAN??????????????????????????????????????????????????????????????????
Seq Scan on aircrafts_data ml (cost=0.00..1.39 rows=1 width=52)
Filter: ((aircraft_code)::text = 'CN1'::text)
(2 rows)
14及更高版本中,pg_prepared_statements視圖還顯示計(jì)劃選擇統(tǒng)計(jì)信息:
SELECT name, generic_plans, custom_plans
FROM pg_prepared_statements;
name | generic_plans | custom_plans
???????+???????????????+??????????????
plane | 1 | 6
(1 row)
輸出檢索
擴(kuò)展查詢協(xié)議允許客戶端批量獲取輸出,一次多行,而不是一次全部獲取。借助游標(biāo)也可以實(shí)現(xiàn)相同目的,但成本更高,并且規(guī)劃器將優(yōu)化對(duì)第一個(gè)cursor_tuple_fraction行的檢索:
每當(dāng)查詢返回大量行并且客戶端都需要他們時(shí),一次檢索的行數(shù)對(duì)于整體數(shù)據(jù)傳輸速度至關(guān)重要。單批行越大,往返延遲損失的時(shí)間越少。然而,隨著批量大小的增加,節(jié)省的效率會(huì)下降。例如,從批量大小1切換到批量大小10將顯著增加時(shí)間節(jié)省。但從10切換到100幾乎沒(méi)有任何區(qū)別。
審核編輯 :李倩
-
SQL
+關(guān)注
關(guān)注
1文章
775瀏覽量
44254 -
分析器
+關(guān)注
關(guān)注
0文章
93瀏覽量
12557 -
語(yǔ)法
+關(guān)注
關(guān)注
0文章
44瀏覽量
9865
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論