那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

從內(nèi)存分配的角度來分析下string的實(shí)現(xiàn)機(jī)制

工程師鄧生 ? 來源:高性能架構(gòu)探索 ? 作者:雨樂 ? 2022-09-05 08:58 ? 次閱讀

大家好!對于C++開發(fā)人員來說,string大概是使用最多的標(biāo)準(zhǔn)庫數(shù)據(jù)結(jié)構(gòu)之一,一直以來也就僅限于使用,對于底層實(shí)現(xiàn)似懂非懂。所以,最近抽出點(diǎn)時間,大致研究了下string的底層實(shí)現(xiàn)。今天,就從內(nèi)存分配的角度來分析下string的實(shí)現(xiàn)機(jī)制。

直接分配

大概在08年的時候,手動實(shí)現(xiàn)過string,沒有考慮性能,所以單純是從功能的角度進(jìn)行實(shí)現(xiàn),下面摘抄了部分代碼,如下:

string::string(constchar*s){
size_=strlen(s);
buffer_=newchar[size_+1];
strcpy(buffer_,s);
}

string&string::string(conststring&str){
size_+=str.size_;
char*data=newchar[size_+1];
strcpy(data,buffer_);
strcat(data,str.buffer_);

delete[]buffer_;
buffer_=data;
return*this;
}

上述代碼為string的部分成員函數(shù),從上述實(shí)現(xiàn)可以看出,無論是構(gòu)造還是拷貝,都是重新在堆上(使用new關(guān)鍵字)分配一塊內(nèi)存。這樣做的優(yōu)點(diǎn)是實(shí)現(xiàn)簡單,而缺點(diǎn)呢,因?yàn)槊看味荚诙焉线M(jìn)行分配,而堆上內(nèi)存的分配效率非常差(當(dāng)然是相對棧來說的),所以有沒有更好的實(shí)現(xiàn)方式呢?下面我們看先STL中的基本實(shí)現(xiàn)。

SSO

記得之前在看Redis源碼的時候,對整數(shù)集合(intset)有個優(yōu)化:根據(jù)新元素的類型,擴(kuò)展整數(shù)集合底層數(shù)組的空間大小,并未新元素分配空間,也就是說,假設(shè)在初始的時候,集合中最大的數(shù)為3,那么這個時候集合的類型為INT_16,如果此時新增一個元素為65536,那么就將集合的類型更改為INT_32,并重新為集合分配空間,將之前的數(shù)據(jù)進(jìn)行類型擴(kuò)展。

那么string有沒有類似Redis整數(shù)集合的功能,進(jìn)行類型升級呢?

帶著這個疑問,研究了string源碼,發(fā)現(xiàn)里面使用了一個名為SSO的優(yōu)化策略~~~

SSO為Small String Optimization的簡寫,中文譯為小字符串優(yōu)化,基本原理是:當(dāng)分配大小小于16個字節(jié)時候,從棧上進(jìn)行分配,而如果大于等于16個字節(jié),則在堆上進(jìn)行內(nèi)存分配。PS:需要注意的是,此優(yōu)化自GCC5.1生效,也就是說對于GCC版本小于5的,無論長度為多少,都從堆上進(jìn)行分配。

為了證實(shí)上述結(jié)論,測試代碼如下:

#include
#include
#include

void*operatornew(std::size_tn){
std::cout<

在上述代碼中,我們重載了operator new,以替換string中的new實(shí)現(xiàn),這樣做的好處是,可以通過輸出來發(fā)現(xiàn)是否調(diào)用了new進(jìn)行動態(tài)分配。

G++ 4.9.4版本輸出如下:

0:
[Allocating26bytes]1:=
[Allocating27bytes]2:==
[Allocating28bytes]3:===
[Allocating29bytes]4:====
[Allocating30bytes]5:=====
[Allocating31bytes]6:======
[Allocating32bytes]7:=======
[Allocating33bytes]8:========
[Allocating34bytes]9:=========
[Allocating35bytes]10:==========
[Allocating36bytes]11:===========
[Allocating37bytes]12:============
[Allocating38bytes]13:=============
[Allocating39bytes]14:==============
[Allocating40bytes]15:===============
[Allocating41bytes]16:================
[Allocating42bytes]17:=================
[Allocating43bytes]18:==================
[Allocating44bytes]19:===================
[Allocating45bytes]20:====================
[Allocating46bytes]21:=====================
[Allocating47bytes]22:======================
[Allocating48bytes]23:=======================

GCC5.1 輸出如下:

0:
1:=
2:==
3:===
4:====
5:=====
6:======
7:=======
8:========
9:=========
10:==========
11:===========
12:============
13:=============
14:==============
15:===============
16:[Allocating17bytes]================
17:[Allocating18bytes]=================
18:[Allocating19bytes]==================
19:[Allocating20bytes]===================
20:[Allocating21bytes]====================
21:[Allocating22bytes]=====================
22:[Allocating23bytes]======================
23:[Allocating24bytes]=======================

從GCC5.1的輸出內(nèi)容可以看出,當(dāng)字符串長度小于16的時候,沒有調(diào)用我們的operator new函數(shù),這就從側(cè)面證明了前面的結(jié)論當(dāng)分配大小小于16個字節(jié)時候,從棧上進(jìn)行分配,而如果大于等于16個字節(jié),則在堆上進(jìn)行內(nèi)存分配。(PS:GCC4.9.4版本的輸出,分配字節(jié)數(shù)大于實(shí)際的字節(jié)數(shù),這個是string的又一個優(yōu)化策略,即預(yù)分配策略,在后面的內(nèi)容中將會講到)。

直奔主題

不妨閉上眼睛,仔細(xì)想下,如果讓我們自己來實(shí)現(xiàn)該功能,你會怎么做?

可能大部分人的思路是:定義一個固定長度的char數(shù)組,在進(jìn)行構(gòu)造的時候,判斷字符串的長度,如果長度小于某個定值,則使用該數(shù)組,否則在堆上進(jìn)行分配~~~

好了,為了驗(yàn)證上述思路與具體實(shí)現(xiàn)是否一致,結(jié)合源碼一起來分析~~

首先,摘抄了部分string的源碼,如下:string源碼

template
classbasic_string
{
private:
//Useempty-baseoptimization:http://www.cantrip.org/emptyopt.html
struct_Alloc_hider:allocator_type//TODOcheck__is_final
{
_Alloc_hider(pointer__dat,const_Alloc&__a=_Alloc())
:allocator_type(__a),_M_p(__dat){}

pointer_M_p;//Theactualdata.
};

_Alloc_hider_M_dataplus;
size_type_M_string_length;

enum{_S_local_capacity=15/sizeof(_CharT)};

union
{
_CharT_M_local_buf[_S_local_capacity+1];
size_type_M_allocated_capacity;
};
};

上面抽出了我們需要關(guān)注的部分代碼,只需要關(guān)注以下幾個點(diǎn):

?_M_string_length已分配字節(jié)數(shù)

?_M_dataplus實(shí)際數(shù)據(jù)存放的位置

? union字段:兩個字段中較大的一個_M_local_buf為 16 字節(jié)

?_M_local_buf這是一個用以實(shí)現(xiàn)SSO功能的字段,大小為16(15 + 1其中1為結(jié)束符)個字節(jié)

?_M_allocated_capacity是一種size_t類型,功能類似于vector中的預(yù)分配,其與_M_local_buf不能共存

從上述源碼中,我們看到有個變量_M_local_buf,從字面意思看就是一個本地或者局部buffer,猜測是用來存儲大小不足16字節(jié)的內(nèi)容,為了證實(shí)我們的猜測,下面結(jié)合GDB一起再分析下SSO的實(shí)現(xiàn)機(jī)制,示例代碼如下:

#include

intmain(){
std::stringstr("hello");
return0;
}

gdb調(diào)試代碼如下:

(gdb)s
Singlesteppinguntilexitfromfunctionmain,
whichhasnolinenumberinformation.
std::basic_string,std::allocator>::basic_string(charconst*,std::allocatorconst&)()
at/root/gcc-5.4.0/build/x86_64-unknown-linux-gnu/libstdc++-v3/include/bits/basic_string.h:454
454basic_string(const_CharT*__s,const_Alloc&__a=_Alloc())
(gdb)s
141returnstd::pointer_traits::pointer_to(*_M_local_buf);
(gdb)n
454basic_string(const_CharT*__s,const_Alloc&__a=_Alloc())
(gdb)
456{_M_construct(__s,__s?__s+traits_type::length(__s):__s+npos);}
(gdb)
141returnstd::pointer_traits::pointer_to(*_M_local_buf);
(gdb)
456{_M_construct(__s,__s?__s+traits_type::length(__s):__s+npos);}
(gdb)
267{return__builtin_strlen(__s);}
(gdb)
456{_M_construct(__s,__s?__s+traits_type::length(__s):__s+npos);}
(gdb)
195_M_construct(__beg,__end,_Tag());
(gdb)
456{_M_construct(__s,__s?__s+traits_type::length(__s):__s+npos);}

單從上述信息不能很明確的了解整個構(gòu)造過程,我們留意到構(gòu)造的過程在basic_string.h:454,所以就通過源碼進(jìn)行分析,如下:

basic_string(const_CharT*__s,const_Alloc&__a=_Alloc())
:_M_dataplus(_M_local_data(),__a)
{_M_construct(__s,__s?__s+traits_type::length(__s):__s+npos);}

_M_construct從函數(shù)字面看出是用來構(gòu)造該對象,在后面進(jìn)行分析,下面先分析下M_dataplus函數(shù)實(shí)現(xiàn),

_M_local_data()const
{
#if__cplusplus>=201103L
returnstd::pointer_traits::pointer_to(*_M_local_buf);
#else
returnconst_pointer(_M_local_buf);
#endif
}

在前面內(nèi)容中,提到過_M_dataplus用來指向?qū)嶋H存儲數(shù)據(jù)的地址,在basic_string()函數(shù)的構(gòu)造中,首先將__M_dataplus指向local_buf,然后調(diào)用__M_construct進(jìn)行實(shí)際構(gòu)造,而M_construct最終會調(diào)用如下代碼:

template
template
void
basic_string<_CharT,?_Traits,?_Alloc>::
_M_construct(_InIterator__beg,_InIterator__end,
std::forward_iterator_tag)
{
//NB:Notrequired,butconsideredbestpractice.
if(__gnu_cxx::__is_null_pointer(__beg)&&__beg!=__end)
std::__throw_logic_error(__N("basic_string::"
"_M_constructnullnotvalid"));

size_type__dnew=static_cast(std::distance(__beg,__end));

if(__dnew>size_type(_S_local_capacity))
{
_M_data(_M_create(__dnew,size_type(0)));
_M_capacity(__dnew);
}

//Checkforout_of_rangeandlength_errorexceptions.
__try
{this->_S_copy_chars(_M_data(),__beg,__end);}
__catch(...)
{
_M_dispose();
__throw_exception_again;
}

_M_set_length(__dnew);
}

在上述代碼中,首先計算當(dāng)前字符串的實(shí)際長度,如果長度大于_S_local_capacity即15,那么則通過_M_create在堆上創(chuàng)建一塊內(nèi)存,最后通過_S_copy_chars函數(shù)進(jìn)行內(nèi)容拷貝。

結(jié)語

本文中的測試環(huán)境基于Centos6.8 & GCC5.4,也就是說在本環(huán)境中,string中如果實(shí)際數(shù)據(jù)小于16個字節(jié),則在本地局部存儲,而大于15字節(jié),則存儲在堆上,這也就是string的一個優(yōu)化特性SSO(Small String Optimization)。在查閱了相關(guān)資料,發(fā)現(xiàn)15字節(jié)的限制取決于編譯器和操作系統(tǒng),在fedora和red-hat中,字符串總是存儲在堆中(來自于網(wǎng)絡(luò),由于手邊缺少相關(guān)環(huán)境,所以未能驗(yàn)證,抱歉)。

好了,今天的文章就到這,我們下期見!



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • GCC
    GCC
    +關(guān)注

    關(guān)注

    0

    文章

    108

    瀏覽量

    24890
  • gdb
    gdb
    +關(guān)注

    關(guān)注

    0

    文章

    60

    瀏覽量

    13349
  • string
    +關(guān)注

    關(guān)注

    0

    文章

    40

    瀏覽量

    4748

原文標(biāo)題:string 性能優(yōu)化之存儲:棧或者堆

文章出處:【微信號:C語言與CPP編程,微信公眾號:C語言與CPP編程】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    云計算環(huán)境的IP地址分配方式

    提供商為用戶提供的各種云資源分配網(wǎng)絡(luò)標(biāo)識符,以實(shí)現(xiàn)云資源之間以及云資源與外部網(wǎng)絡(luò)的通信。云計算通常包括基礎(chǔ)設(shè)施即服務(wù)、平臺即服務(wù)和軟件即服務(wù)等多種服務(wù)模式,不同模式IP地址分配方式也
    的頭像 發(fā)表于 12-19 14:02 ?197次閱讀

    什么是虛擬內(nèi)存分頁 Windows系統(tǒng)虛擬內(nèi)存優(yōu)化方法

    虛擬內(nèi)存分頁概述 在Windows操作系統(tǒng)中,虛擬內(nèi)存是通過分頁機(jī)制實(shí)現(xiàn)的。分頁允許系統(tǒng)將內(nèi)存中的數(shù)據(jù)移動到硬盤上,以便為當(dāng)前運(yùn)行的程序騰出
    的頭像 發(fā)表于 12-04 09:16 ?597次閱讀

    轉(zhuǎn)載 golang內(nèi)存分配

    Go 的分配采用了類似 tcmalloc 的結(jié)構(gòu).特點(diǎn): 使用一小塊一小塊的連續(xù)內(nèi)存頁, 進(jìn)行分配某個范圍大小的內(nèi)存需求. 比如某個連續(xù) 8KB 專門用于
    的頭像 發(fā)表于 09-05 14:12 ?311次閱讀
    轉(zhuǎn)載 golang<b class='flag-5'>內(nèi)存</b><b class='flag-5'>分配</b>

    內(nèi)存管理的硬件結(jié)構(gòu)

    常見的內(nèi)存分配函數(shù)有malloc,mmap等,但大家有沒有想過,這些函數(shù)在內(nèi)核中是怎么實(shí)現(xiàn)的?換句話說,Linux內(nèi)核的內(nèi)存管理是怎么實(shí)現(xiàn)
    的頭像 發(fā)表于 09-04 14:28 ?398次閱讀
    <b class='flag-5'>內(nèi)存</b>管理的硬件結(jié)構(gòu)

    原理聊JVM(一):染色標(biāo)記和垃圾回收算法

    更好地優(yōu)化自己的代碼,并解決一些潛在的性能問題。 本文及后續(xù)文章將從原理聊起,對JVM的內(nèi)存分配、GC、編譯等知識進(jìn)行分析和總結(jié)。 1 JVM運(yùn)行時內(nèi)存劃分 1.1 運(yùn)行時數(shù)據(jù)區(qū)域 ?
    的頭像 發(fā)表于 08-20 15:25 ?290次閱讀
    <b class='flag-5'>從</b>原理聊JVM(一):染色標(biāo)記和垃圾回收算法

    Linux內(nèi)核中的頁面分配機(jī)制

    Linux內(nèi)核中是如何分配出頁面的,如果我們站在CPU的角度去看這個問題,CPU能分配出來的頁面是以物理頁面為單位的。也就是我們計算機(jī)中常講的分頁機(jī)制。本文就看下Linux內(nèi)核是如何管
    的頭像 發(fā)表于 08-07 15:51 ?352次閱讀
    Linux內(nèi)核中的頁面<b class='flag-5'>分配機(jī)制</b>

    可以用os_malloc() 分配多少內(nèi)存?有哪些限制?

    我可以用 os_malloc() 分配多少內(nèi)存?有哪些限制?
    發(fā)表于 07-15 06:32

    ESP32S3+LVGL創(chuàng)建一個界面,請問能只在SPIRAM分配內(nèi)存,IRAM不分配嗎?

    各位前輩好。ESP32S3+LVGL的開發(fā)的過程中發(fā)現(xiàn),創(chuàng)建一個界面,會同時在SPIRAM和IRAM分配相同大小的內(nèi)存。請問能只在SPIRAM分配內(nèi)存,IRAM不
    發(fā)表于 06-06 07:45

    HarmonyOS實(shí)戰(zhàn)開發(fā)-內(nèi)存快照Snapshot Profiler功能使用指導(dǎo)

    OpenHarmony API 9及以上版本的Stage工程。 場景示例 本示例設(shè)置兩個頁面,通過內(nèi)存快照來分析頁面跳轉(zhuǎn)場景是否存在內(nèi)存泄露問題。 主頁面代碼如下: import r
    發(fā)表于 05-11 13:51

    FreeRTOS如何在中斷中調(diào)用內(nèi)存分配函數(shù)?

    最近在玩FreeRTOS,遇到一個問題,就是不知如何在中斷中調(diào)用內(nèi)存分配函數(shù)。pvPortMalloc函數(shù)中會調(diào)用xTaskResumeAll,而這個函數(shù)不能再中斷調(diào)用,所以請問在中斷中進(jìn)行內(nèi)存
    發(fā)表于 05-08 08:25

    基于DE1-SOC的String Art實(shí)現(xiàn)

    String Art起源于19世紀(jì)的數(shù)學(xué)家Mary Everest Boole的設(shè)計,隨后發(fā)展成一種利用釘子和線進(jìn)行作畫的藝術(shù),主要是通過線的稠密度表現(xiàn)不同的圖案。
    的頭像 發(fā)表于 04-09 11:02 ?537次閱讀
    基于DE1-SOC的<b class='flag-5'>String</b> Art<b class='flag-5'>實(shí)現(xiàn)</b>

    深入理解Java 8內(nèi)存管理機(jī)制及故障排查實(shí)戰(zhàn)指南

    Java的自動內(nèi)存管理機(jī)制是由 JVM 中的垃圾收集器實(shí)現(xiàn)的,垃圾收集器會定期掃描堆內(nèi)存中的對象,檢測并清除不再使用的對象,以釋放
    的頭像 發(fā)表于 04-04 08:10 ?1060次閱讀
    深入理解Java 8<b class='flag-5'>內(nèi)存</b>管理<b class='flag-5'>機(jī)制</b>及故障排查實(shí)戰(zhàn)指南

    老板角度解讀工廠物料流轉(zhuǎn)機(jī)器人

    老板角度解讀工廠物料流轉(zhuǎn)機(jī)器人傳統(tǒng)的AGV主要是重載/大規(guī)格且針對大型/超大型具有規(guī)范化管理能力(已使用ERP系統(tǒng))的工廠用于物料高效流轉(zhuǎn)轉(zhuǎn)。其優(yōu)勢就是多臺AGV同時使用,具有調(diào)度控制功能且物料
    的頭像 發(fā)表于 03-30 08:13 ?480次閱讀
    <b class='flag-5'>從</b>老板<b class='flag-5'>角度</b><b class='flag-5'>來</b>解讀工廠物料流轉(zhuǎn)機(jī)器人

    Linux內(nèi)核內(nèi)存管理之內(nèi)核非連續(xù)物理內(nèi)存分配

    我們已經(jīng)知道,最好將虛擬地址映射到連續(xù)頁幀,從而更好地利用緩存并實(shí)現(xiàn)更低的平均內(nèi)存訪問時間。然而,如果對內(nèi)存區(qū)域的請求并不頻繁,那么考慮基于通過連續(xù)線性地址訪問非連續(xù)頁幀的分配方案是有
    的頭像 發(fā)表于 02-23 09:44 ?1079次閱讀
    Linux內(nèi)核<b class='flag-5'>內(nèi)存</b>管理之內(nèi)核非連續(xù)物理<b class='flag-5'>內(nèi)存</b><b class='flag-5'>分配</b>

    Linux內(nèi)核內(nèi)存管理之ZONE內(nèi)存分配

    內(nèi)核中使用ZONE分配器滿足內(nèi)存分配請求。該分配器必須具有足夠的空閑頁幀,以便滿足各種內(nèi)存大小請求。
    的頭像 發(fā)表于 02-21 09:29 ?950次閱讀
    一博娱乐| 怎样看百家乐官网路纸| 百家乐优惠现金| 真人游戏 豆瓣| 香港百家乐官网六合彩| 涂山百家乐的玩法技巧和规则| 百家乐官网路单下注| 澳门百家乐庄闲的玩法| 项城市| 太阳城百家乐168| 泗洪县| 宝博百家乐官网娱乐城| 威尼斯人娱乐场官网是多少| 百家乐官网智能分析| 大发888怎么代充| 单机百家乐官网游戏下| 鸿博娱乐| 网上百家乐真的假的| 百家乐官网娱乐城棋牌| 玩百家乐掉房| 基础百家乐官网规则| 边城棋牌中心| 网络百家乐的破解| 网上玩百家乐官网有钱| 新乐园百家乐娱乐城| 百家乐官网机器出千| 海王星线上娱乐| 信誉百家乐博彩网| 真人百家乐官网作假视频| 百家乐赌台| 为什么百家乐官网玩家越来越多选择网上百家乐官网 | 百家乐官网最新分析仪 | CEO百家乐官网现金网| 扑克百家乐麻将筹码防伪| 百家乐官网英皇娱乐场开户注册 | 八卦24方位| 博客| 大发888怎么注册| 百家乐有不有作弊| 百家乐官网在线投注网| 大发888 安装包的微博|