那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為什么 MySQL 單表不能超過(guò) 2000 萬(wàn)行?

jf_21561199 ? 來(lái)源:jf_21561199 ? 作者:jf_21561199 ? 2023-06-29 16:48 ? 次閱讀

最近看到一篇《我說(shuō) MySQL 每張表最好不要超過(guò) 2000 萬(wàn)數(shù)據(jù),面試官讓我回去等通知》的文章,非常有趣。

文中提到,他朋友在面試的過(guò)程中說(shuō),自己的工作就是把用戶操作信息存到 MySQL 里,因?yàn)閿?shù)據(jù)量超大(5000 萬(wàn)條左右),需要每天定時(shí)生成 3 張表,然后將數(shù)據(jù)取模分別存到這三張表里。

接下來(lái)是兩人的對(duì)話:

wKgZomSdRUyAN2pTAAVeDhr6SHQ69.jpeg

面試后續(xù)暫且不論,不過(guò),互聯(lián)網(wǎng)江湖上的確流傳著一個(gè)說(shuō)法:?jiǎn)伪頂?shù)據(jù)量超過(guò) 500 萬(wàn)行時(shí)就要進(jìn)行分表分庫(kù),已經(jīng)超過(guò) 2000 萬(wàn)行時(shí) MySQL 的性能就會(huì)急劇下降。

那么,MySQL 一張表最多能存多少數(shù)據(jù)?

今天我們就從技術(shù)層面剖析一下,MySQL 單表數(shù)據(jù)不能過(guò)大的根本原因是什么?

猜想 1,是索引深度嗎?

很多人認(rèn)為:數(shù)據(jù)量超過(guò) 500 萬(wàn)行或 2000 萬(wàn)行時(shí),引起 B+tree 的高度增加,延長(zhǎng)了索引的搜索路徑,進(jìn)而導(dǎo)致了性能下降。事實(shí)果真如此嗎?

我們先理一下關(guān)系,MySQL 采用了索引組織表的形式組織數(shù)據(jù),葉子節(jié)點(diǎn)存儲(chǔ)數(shù)據(jù),非葉子節(jié)點(diǎn)存儲(chǔ)主鍵與頁(yè)面號(hào)的映射關(guān)系。若用戶的主鍵長(zhǎng)度是 8 字節(jié)時(shí),MySQL 中頁(yè)面偏移占 4 個(gè)字節(jié),在非葉子節(jié)點(diǎn)的時(shí)候?qū)嶋H上是 8+4=12 個(gè)字節(jié),12 個(gè)字節(jié)表示一個(gè)頁(yè)面的映射關(guān)系。

MySQL 默認(rèn)是 16K 的頁(yè)面,拋開(kāi)它的配置 header,大概就是 15K,因此,非葉子節(jié)點(diǎn)的索引頁(yè)面可放 15*1024/12=1280 條數(shù)據(jù),按照每行 1K 計(jì)算,每個(gè)葉子節(jié)點(diǎn)可以存 15 條數(shù)據(jù)。同理,三層就是 15*1280*1280=24576000 條數(shù)據(jù)。只有數(shù)據(jù)量達(dá)到 24576000 條時(shí),深度才會(huì)增加為 4,所以,索引深度沒(méi)有那么容易增加,詳細(xì)數(shù)據(jù)可參考下表:

搜索路徑延長(zhǎng)導(dǎo)致性能下降的說(shuō)法,與當(dāng)時(shí)的機(jī)械硬盤和內(nèi)存條件不無(wú)關(guān)系。

之前機(jī)械硬盤的 IOPS 在 100 左右,而現(xiàn)在普遍使用的 SSD 的 IOPS 已經(jīng)過(guò)萬(wàn),之前的內(nèi)存最大幾十 G,現(xiàn)在服務(wù)器內(nèi)存最大可達(dá)到 TB 級(jí)。

因此,即使深度增加,以目前的硬件資源,IO 也不會(huì)成為限制 MySQL 單表數(shù)據(jù)量的根本性因素。

那么,限制 MySQL 單表不能過(guò)大的根本性因素是什么?

猜想 2,是 SMO 無(wú)法并發(fā)嗎?

我們可以嘗試從 MySQL 所采用的存儲(chǔ)引擎 InnoDB 本身來(lái)探究一下。

大家知道 InnoDB 引擎使用的是索引組織表,它是通過(guò)索引來(lái)組織數(shù)據(jù)的,而它采用 B+tree 作為索引的數(shù)據(jù)結(jié)構(gòu)。B+Tree 操作非原子,所以當(dāng)一個(gè)線程做結(jié)構(gòu)調(diào)整(SMO,Struction-Modification-Operation)時(shí)一般會(huì)涉及多個(gè)節(jié)點(diǎn)的改動(dòng)。

SMO 動(dòng)作過(guò)程中,此時(shí)若有另一個(gè)線程進(jìn)來(lái)可能會(huì)訪問(wèn)到錯(cuò)誤的 B+Tree 結(jié)構(gòu),InnoDB 為了解決這個(gè)問(wèn)題采用了樂(lè)觀鎖和悲觀鎖的并發(fā)控制協(xié)議。

InnoDB 對(duì)于葉子節(jié)點(diǎn)的修改操作如下:

方法一,先采用樂(lè)觀鎖的方式嘗試進(jìn)行修改。

對(duì)根節(jié)點(diǎn)加 S 鎖(sharedlock,叫共享鎖,也稱讀鎖),依次對(duì)非葉子節(jié)點(diǎn)加 S 鎖。

如果葉子節(jié)點(diǎn)的修改不會(huì)引起 B+Tree 結(jié)構(gòu)變動(dòng),如分裂、合并等操作,那么只需要對(duì)葉子節(jié)點(diǎn)進(jìn)行加 X 鎖(exclusivelock,叫排他鎖,也稱為寫鎖)即可完成修改。如下圖中所示:

wKgaomSdRUyAPI3NAAF9WUKhnP8708.png

方式二,采用悲觀鎖的方式

如果對(duì)葉子結(jié)點(diǎn)的修改會(huì)觸發(fā) SMO,那么會(huì)采用悲觀鎖的方式。

采用悲觀鎖,需要重新遍歷 B+Tree,對(duì)根節(jié)點(diǎn)加全局 SX 鎖(SX 鎖是行鎖),然后從根節(jié)點(diǎn)到葉子節(jié)點(diǎn)可能修改的節(jié)點(diǎn)加 X 鎖)。在整個(gè) SMO 過(guò)程中,根節(jié)點(diǎn)始終持有 SX 鎖(SX 鎖表示有意向修改這個(gè)保護(hù)的范圍,SX 鎖與 SX 鎖、X 鎖沖突,與 S 鎖不沖突),此時(shí)其他的 SMO,則需要等待。

wKgZomSdRU2AAa5AAAIz-TsQpIQ935.png

因此,InnoDB 對(duì)于簡(jiǎn)單的主鍵查詢比較快,因?yàn)閿?shù)據(jù)都存儲(chǔ)在葉子節(jié)點(diǎn)中,但對(duì)于數(shù)據(jù)量大且改操作比較多的 TP 型業(yè)務(wù),并發(fā)會(huì)有很嚴(yán)重的瓶頸問(wèn)題。

在對(duì)葉子節(jié)點(diǎn)的修改操作中,InnoDB 可以實(shí)現(xiàn)較好的 1 與 1、1 與 2 的并發(fā),但是無(wú)法解決 2 的并發(fā)。因?yàn)樵诜绞?2 中,根節(jié)點(diǎn)始終持有 SX 鎖,必須串行執(zhí)行,等待上一個(gè) SMO 操作完成。這樣在具有大量的 SMO 操作時(shí),InnoDB 的 B+Tree 實(shí)現(xiàn)就會(huì)出現(xiàn)很嚴(yán)重的性能瓶頸。

解決方案

目前業(yè)界有一個(gè)更好的方案 B-LinkTree,與 B+Tree 相比,B-LinkTree 優(yōu)化了 B+Tree 結(jié)構(gòu)調(diào)整時(shí)的鎖粒度,只需要逐層加鎖,無(wú)需對(duì) root 節(jié)點(diǎn)加全局鎖,因此,可以做到在 SMO 過(guò)程中寫操作的并發(fā)執(zhí)行,保持高并發(fā)下性能的穩(wěn)定。

主要改進(jìn)點(diǎn)有 2 個(gè):

1.中間節(jié)點(diǎn)增加 link 指針,指向右兄弟節(jié)點(diǎn);

2.每個(gè)節(jié)點(diǎn)內(nèi)增加字段 highkey,存儲(chǔ)該節(jié)點(diǎn)中最大的 key 值。

新增的 link 指針便是為了解決 SMO 過(guò)程中并發(fā)寫的問(wèn)題,在 SMO 過(guò)程中,B-LinkTree 對(duì)修改節(jié)點(diǎn)逐層加鎖,修改完一層即可放鎖,然后去加上一層節(jié)點(diǎn)的鎖繼續(xù)修改。這樣在 InnoDB 引擎中被 SMO 阻塞的寫操作可以有機(jī)會(huì)再 SMO 操作過(guò)程中并發(fā)進(jìn)行。

如下圖所示,在節(jié)點(diǎn) 2 分裂為節(jié)點(diǎn) 2 和 4 的過(guò)程中,只需要在最后一步將父節(jié)點(diǎn) 1 指向新節(jié)點(diǎn) 4 時(shí),對(duì)父節(jié)點(diǎn) 1 加鎖,其他操作均無(wú)需對(duì)父節(jié)點(diǎn)加鎖,更無(wú)需對(duì) root 節(jié)點(diǎn)加鎖,因此,大大提升了 SMO 過(guò)程中寫操作的并發(fā)度。

wKgaomSdRU6AWMOeAAE1dXO5hw0004.png

由此可見(jiàn),和 B+Tree 全局加鎖對(duì)比起來(lái),B-LinkTree 在高并發(fā)操作下的性能是顯著優(yōu)于 B+Tree 的。華為云 GaussDB 當(dāng)前采用的就是 B-LinkTree 索引數(shù)據(jù)結(jié)構(gòu)。

InnoDB 的索引組織表更容易觸發(fā) SMO

索引組織表的葉子節(jié)點(diǎn),存儲(chǔ)主鍵以及應(yīng)對(duì)行的數(shù)據(jù),InnoDB 默認(rèn)頁(yè)面為 16K,若每行數(shù)據(jù)的大小為 1000 字節(jié),每個(gè)葉子節(jié)點(diǎn)僅能存儲(chǔ) 16 行數(shù)據(jù)。

在索引組織表中,當(dāng)葉子節(jié)點(diǎn)的扇出值過(guò)低時(shí),SMO 的觸發(fā)將更加頻繁,進(jìn)而放大了 SMO 無(wú)法并發(fā)寫的缺陷。

目前業(yè)界有一個(gè)堆組織表的數(shù)據(jù)組織方案,也是華為云數(shù)據(jù)庫(kù) GaussDB 采用的方案。它的葉子節(jié)點(diǎn)存儲(chǔ)索引鍵以及對(duì)應(yīng)的行指針(所在的頁(yè)面編號(hào)及頁(yè)內(nèi)偏移),堆組織表葉子節(jié)點(diǎn)可以存更多的數(shù)據(jù),分析可得在同樣的數(shù)據(jù)量與業(yè)務(wù)并發(fā)量下,堆組織表會(huì)比索引組織表發(fā)生 SMO 概率低許多。

性能對(duì)比

在 8U32G 的兩臺(tái)服務(wù)器分別搭建了 MySQL(B+Tree 和索引組織表)與 GaussDB(B-LinkTree 和堆組織表)的環(huán)境,進(jìn)行了如下性能驗(yàn)證:

實(shí)驗(yàn)場(chǎng)景:在基礎(chǔ)表的場(chǎng)景上,測(cè)試增量隨機(jī)插入性能。

1.基礎(chǔ)表總大小 10G,包含主鍵隨機(jī)分布的 1000w 行數(shù)據(jù),每行數(shù)據(jù) 1k;

2.插入主鍵隨機(jī)分布的 1000w 行數(shù)據(jù),每行數(shù)據(jù)大小 1k,測(cè)試并發(fā)插入性能。

結(jié)論:隨著并發(fā)數(shù)的上升,GaussDB 能穩(wěn)步提升系統(tǒng)的 TPS,而 MySQL 并發(fā)數(shù)的提高并不能帶來(lái) TPS 的顯著提升。

wKgZomSdRU-AQJMWAAF-DO3U1Ow056.png

總結(jié)

MySQL 無(wú)法支持大數(shù)據(jù)量下并發(fā)修改的根本原因,是因?yàn)槠渌饕l(fā)控制協(xié)議的缺陷造成的,而 MySQL 選擇索引組織表,又放大了這一缺陷。所以,開(kāi)源 MySQL 數(shù)據(jù)庫(kù)更適用于主鍵查詢?yōu)橹鞯暮?jiǎn)單業(yè)務(wù)場(chǎng)景,如互聯(lián)網(wǎng)類應(yīng)用,對(duì)于復(fù)雜的商業(yè)場(chǎng)景限制比較明顯。

相比之下,采用 B-LinkTree 和堆組織表的 GaussDB 數(shù)據(jù)庫(kù)在性能和場(chǎng)景應(yīng)用方面更勝一籌。

審核編輯黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • MySQL
    +關(guān)注

    關(guān)注

    1

    文章

    829

    瀏覽量

    26742
  • 華為云
    +關(guān)注

    關(guān)注

    3

    文章

    2682

    瀏覽量

    17586
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    誰(shuí)說(shuō)MySQL行數(shù)不要超過(guò)2000W?

    網(wǎng)上看了一篇文章《為什么說(shuō)MySQL行數(shù)不要超過(guò)2000w》,親自實(shí)踐了一下,跟原作者有不同的結(jié)論。原文的結(jié)論是
    的頭像 發(fā)表于 12-15 10:02 ?1141次閱讀
    誰(shuí)說(shuō)<b class='flag-5'>MySQL</b><b class='flag-5'>單</b><b class='flag-5'>表</b>行數(shù)不要<b class='flag-5'>超過(guò)</b><b class='flag-5'>2000</b>W?

    PoE交換機(jī)供電的功率為什么不能超過(guò)30瓦?

    不能那么高,那么供電功率自然就不能那么高。 由于PoE供電時(shí),網(wǎng)線中既有數(shù)據(jù)信號(hào)又有電力信號(hào),為了不相互影響,也為了保證最佳的供電傳輸效果,所以行業(yè)規(guī)定的PoE供電的相關(guān)設(shè)備的端口供電功率
    發(fā)表于 03-17 15:42

    請(qǐng)問(wèn)PADS原理圖庫(kù)管腳名稱是否不能超過(guò)40個(gè)字?

    pads 原理圖庫(kù)管腳名稱不能超過(guò)40個(gè)字?
    發(fā)表于 03-14 07:35

    mysql轉(zhuǎn)列如何操作

    mysql 轉(zhuǎn)列操作
    發(fā)表于 04-28 11:27

    800萬(wàn)行代碼的鴻蒙系統(tǒng),在世界上處于什么水平?

    “800萬(wàn)行的代碼量,讓鴻蒙一躍成為人類有史以來(lái)第4大代碼量的移動(dòng)操作系統(tǒng)。要知道當(dāng)前2.0版本僅包含大屏、手表和車機(jī)系統(tǒng),等到今年12 月手機(jī)系統(tǒng)發(fā)布后,鴻蒙系統(tǒng)的代碼量估計(jì)可超過(guò)1000萬(wàn)行。而這么龐大的工作量,華為僅用2年
    發(fā)表于 09-29 16:04

    【HarmonyOS】800萬(wàn)行代碼的鴻蒙系統(tǒng),在世界上處于什么水平?

    “800萬(wàn)行的代碼量,讓鴻蒙一躍成為人類有史以來(lái)第4大代碼量的移動(dòng)操作系統(tǒng)。要知道當(dāng)前2.0版本僅包含大屏、手表和車機(jī)系統(tǒng),等到今年12 月手機(jī)系統(tǒng)發(fā)布后,鴻蒙系統(tǒng)的代碼量估計(jì)可超過(guò)1000萬(wàn)行
    發(fā)表于 10-27 10:25

    阿里巴巴推出每秒撰寫2萬(wàn)行廣告文案的AI新工具

    北京時(shí)間7月5日下午消息,中國(guó)電子商務(wù)巨頭阿里巴巴發(fā)布一項(xiàng)人工智能工具,可以每秒寫入2萬(wàn)行廣告文案。
    的頭像 發(fā)表于 07-07 10:48 ?3076次閱讀

    濤思數(shù)據(jù)開(kāi)源TDengine,10多萬(wàn)行C代碼,登頂GitHub!

    7月12日,濤思數(shù)據(jù)宣布將TDengine開(kāi)源,10多萬(wàn)行C代碼,包括最核心的存儲(chǔ)引擎和計(jì)算引擎都上傳到了GitHub上。
    的頭像 發(fā)表于 07-31 16:07 ?1.4w次閱讀

    一個(gè)函數(shù)究竟能不能超過(guò)50呢?

    有些讀者可能看到過(guò)類似這樣的描述,而自己做項(xiàng)目時(shí),很多函數(shù)都比較多(超過(guò)50),就會(huì)懷疑自己這樣寫是不是不對(duì)?
    的頭像 發(fā)表于 06-11 12:46 ?4201次閱讀
    一個(gè)函數(shù)究竟能<b class='flag-5'>不能超過(guò)</b>50<b class='flag-5'>行</b>呢?

    MySQL數(shù)據(jù)最大不要超過(guò)多少

    最好不要超過(guò) 2000w”,“超過(guò)
    的頭像 發(fā)表于 06-02 15:30 ?658次閱讀
    <b class='flag-5'>MySQL</b><b class='flag-5'>單</b><b class='flag-5'>表</b>數(shù)據(jù)最大不要<b class='flag-5'>超過(guò)</b>多少<b class='flag-5'>行</b>

    MySQL數(shù)據(jù)最大不要超過(guò)多少?為什么?

    想必大家也聽(tīng)說(shuō)過(guò)數(shù)據(jù)庫(kù)建議最大2kw 條數(shù)據(jù)這個(gè)說(shuō)法。如果超過(guò)了,性能就會(huì)下降得比較厲害。
    的頭像 發(fā)表于 07-06 09:46 ?1190次閱讀
    <b class='flag-5'>MySQL</b><b class='flag-5'>單</b><b class='flag-5'>表</b>數(shù)據(jù)最大不要<b class='flag-5'>超過(guò)</b>多少<b class='flag-5'>行</b>?為什么?

    再創(chuàng)新高!深開(kāi)鴻OpenHarmony社區(qū)代碼貢獻(xiàn)量超過(guò)200萬(wàn)行

    2023年10月10日,據(jù)OpenAtomOpenHarmony(以下簡(jiǎn)稱“OpenHarmony”)官網(wǎng)顯示,深開(kāi)鴻在OpenHarmony社區(qū)主倉(cāng)代碼貢獻(xiàn)量超過(guò)200萬(wàn)行,在華為以外的生態(tài)廠商中
    的頭像 發(fā)表于 10-13 09:54 ?717次閱讀
    再創(chuàng)新高!深開(kāi)鴻OpenHarmony社區(qū)代碼貢獻(xiàn)量<b class='flag-5'>超過(guò)</b>200<b class='flag-5'>萬(wàn)行</b>!

    社區(qū)代碼貢獻(xiàn)企業(yè)啟新篇,深開(kāi)鴻代碼貢獻(xiàn)量超過(guò)200萬(wàn)行

    ,社區(qū)代碼貢獻(xiàn)企業(yè)取得新成績(jī),深開(kāi)鴻成為華為之后,第二家社區(qū)代碼貢獻(xiàn)量超過(guò)百萬(wàn)行的生態(tài)企業(yè)、且總貢獻(xiàn)量累計(jì)突破200萬(wàn)行,為培育和發(fā)展OpenHarmony社區(qū)注入源動(dòng)力!截至目前,華為代碼貢獻(xiàn)占比
    的頭像 發(fā)表于 10-18 16:15 ?793次閱讀

    MySQL數(shù)據(jù)量限制:為何2000萬(wàn)行成為瓶頸?

    很多人認(rèn)為:數(shù)據(jù)量超過(guò)500萬(wàn)行2000萬(wàn)行時(shí),引起B(yǎng)+tree的高度增加,延長(zhǎng)了索引的搜索路徑,進(jìn)而導(dǎo)致了性能下降。事實(shí)果真如此嗎?
    的頭像 發(fā)表于 02-27 10:38 ?6715次閱讀
    <b class='flag-5'>MySQL</b><b class='flag-5'>單</b><b class='flag-5'>表</b>數(shù)據(jù)量限制:為何<b class='flag-5'>2000</b><b class='flag-5'>萬(wàn)行</b>成為瓶頸?

    絲桿模組為什么行程不能超過(guò)兩米?

    絲桿模組為什么行程不能超過(guò)兩米
    的頭像 發(fā)表于 12-24 17:56 ?212次閱讀
    絲桿模組為什么行程<b class='flag-5'>不能超過(guò)</b>兩米?
    百家乐官网二代理解| 澳门百家乐官网骗人| 金皇冠娱乐城| 水果老虎机的程序| 百家乐美国玩法| 大桥下做生意风水好吗| 游戏机百家乐官网的技巧| 百家乐官网休闲游戏| 1737棋牌游戏中心| 威尼斯人娱乐城网| 机器百家乐作弊| 万宝路百家乐官网的玩法技巧和规则| 乐宝百家乐官网娱乐城| 皇冠网小说网站网址| 大发888官网 官方| 威尼斯人娱乐城存取款| 百家乐2号死机| 网上百家乐注册彩金| 最新百家乐官网双面数字筹码| 百家乐官网游戏算牌| 屏东市| 缅甸百家乐官网网络赌博解谜| 新宝娱乐| 大发888客户端下载| 钱隆百家乐破解版| 百家乐官网庄家必赢诀窍| 金沙县| 和乐娱乐| 莆田棋牌迷游戏中心| 全讯网娱乐| 精通百家乐的玩法技巧和规则| 皇冠百家乐代理网址| 百家乐庄闲的分布| 百家乐官网赌博公司| 半圆百家乐官网桌子| 百家乐官网最长的闲| 呼玛县| 百家乐官网平台下载| 海王星| 久胜线上娱乐| 博乐娱乐城|