2012軟件水平輔導(dǎo):漫談C++內(nèi)存分配失敗

字號(hào)：小 中 大

2012年軟件水平輔導(dǎo)：漫談C++內(nèi)存分配失敗
    沒(méi)錯(cuò)，是“漫談”，而且“漫”得有點(diǎn)亂。然而，拋磚尚可引玉，想到的事情，縱然脈絡(luò)不那么順，寫下來(lái)也不是壞事。開卷有益，動(dòng)筆也有益。
    一切緣自一位C語(yǔ)言開發(fā)經(jīng)驗(yàn)豐富的的朋友問(wèn)我的一個(gè)問(wèn)題。朋友問(wèn)：“C++中的new在分配內(nèi)存失敗時(shí)會(huì)拋出異常（std：：bad_alloc）而不返回0（一些老的編譯器可能還在返回0，但這樣的編譯器實(shí)在”太老了“），這跟C程序員的做法很不一樣。而且，許多C++程序在使用new創(chuàng)建對(duì)象時(shí)也根本不檢查這種異常。這是一種什么哲學(xué)呢？”他還提到：“一般C程序員總會(huì)判斷一下malloc失敗的情況，就連Linux內(nèi)核中都是如此。”
    當(dāng)時(shí)，我首先想到的是：一般用C++實(shí)現(xiàn)的應(yīng)用層程序，內(nèi)存管理方面自不能與內(nèi)核程序相提并論。OS內(nèi)核需直接管理物理內(nèi)存，所有應(yīng)用程序的地址空間都由它映射而來(lái)，然后依靠它建立的機(jī)制進(jìn)行翻譯。內(nèi)核如果在內(nèi)存管理方面不保險(xiǎn)，應(yīng)用層還怎么過(guò)日子？另外，內(nèi)核中的內(nèi)存分配尚須考慮許多其它問(wèn)題，比如不同區(qū)域的不同特性（像某些DMA使用的buffer要物理連續(xù)且位于特定位置）。應(yīng)用層程序則不一樣，它們一般擁有flat的虛擬內(nèi)存空間，且數(shù)量上通常遠(yuǎn)大于物理內(nèi)存。因此，一個(gè)應(yīng)用程序如果能耗盡虛擬內(nèi)存，那要么是對(duì)數(shù)據(jù)的規(guī)模估計(jì)不足，要么就是一個(gè)必需專門解決的嚴(yán)重bug.耗盡虛擬內(nèi)存跟其它許多嚴(yán)重的bug（再如緩沖區(qū)溢出導(dǎo)致的堆棧破壞）一樣，即使能檢測(cè)到也常常無(wú)計(jì)可施，如果“有計(jì)可施”，那何不早施此計(jì)？何苦等它發(fā)生再亡羊補(bǔ)牢呢？反過(guò)來(lái)想，該失敗的時(shí)候痛痛快快的快速失敗，這不算壞事。至少，比帶著問(wèn)題繼續(xù)運(yùn)行半小時(shí)，然后在某個(gè)完全不相干的地方發(fā)生莫名其妙又難以重現(xiàn)的bug要好得多。
    這是我當(dāng)時(shí)給朋友的回答，朋友勉強(qiáng)同意了，至少不再糾結(jié)C++程序員因何不在new的時(shí)候檢查std：：bad_alloc了。然而，順著這個(gè)問(wèn)題，我自己又聯(lián)想到好多東西。
    （1）首先想到的是Java語(yǔ)言的做法。Java中的變量都是引用（基本類型的除外），而被引用的對(duì)象是用new在堆（heap）上創(chuàng)建的。在Java中new一個(gè)對(duì)象的時(shí)候，理論上也有可能引發(fā)java.lang.OutOfMemoryError.當(dāng)然，這是個(gè)Error，不是從java.lang.Exception派生的“異?！保虼苏Z(yǔ)言并沒(méi)強(qiáng)制我們catch它。然而，語(yǔ)言是否要求并不重要，語(yǔ)言為什么不要求才是重要的。顯然，如果問(wèn)題真的很嚴(yán)重，即使語(yǔ)言不要求，Java程序員也會(huì)在每一處new的周圍包上try/catch.可Java程序員沒(méi)有這么做。為什么？我想關(guān)鍵的原因跟上面是一樣的：一個(gè)應(yīng)用程序耗盡虛擬內(nèi)存，要么是對(duì)數(shù)據(jù)的規(guī)模估計(jì)不足（是否應(yīng)通過(guò)java命令的-Xm系列參數(shù)設(shè)置更大的heap呢？），要么就是一個(gè)必須專門解決的bug.同時(shí)，相對(duì)C++來(lái)說(shuō)，Java程序中采用這一決策還有更充分的理由：因?yàn)橛蠫C機(jī)制，Java程序中不太會(huì)有因?yàn)榇中脑斐傻膬?nèi)存泄露（頂多有因不良設(shè)計(jì)造成的內(nèi)存?zhèn)涡孤叮?BR>    （2）C++中的“new”還不只是分配內(nèi)存那么簡(jiǎn)單。對(duì)于用戶自定義的類型來(lái)說(shuō)，“new T；”相當(dāng)于operator new再加上對(duì)T的構(gòu)造函數(shù)的調(diào)用。由于類的構(gòu)造函數(shù)完全可能引發(fā)異常，于是，就算內(nèi)存分配一切順利，一條new語(yǔ)句還是可能產(chǎn)生異常?？磥?lái)，需要catch的不止std：：bad_alloc.
    （3）暫不考慮“哲學(xué)”因素，如果有人仍然覺(jué)得應(yīng)該像C程序那樣嚴(yán)格檢查內(nèi)存分配，可不可以呢？當(dāng)然可以，畢竟它還能拋出異常么，它能拋出我們就能捕捉。于是人們自然會(huì)想：C++或Java程序員用駝鳥策略對(duì)付內(nèi)存分配的失敗，異常在使用上比較麻煩會(huì)不會(huì)是原因之一呢？表面看是顯然的：每分配內(nèi)存都要包上一層try/catch，跟C中的針對(duì)返回值的if/else風(fēng)格比起來(lái)凌亂多了。
    實(shí)際上，那不是使用異常的正確方法。如果異常只是if/else的簡(jiǎn)單語(yǔ)法替代物，那它根本就沒(méi)有存在的必要。異常的好處之一（真的只是“之一”）是：一個(gè)異常只需一個(gè)地方處理就足夠了。比如下面這樣：view plain void f1（） { try { // ……
    f2（）；} catch （const some_exception& e） { // ……
    }
    void f2（） { // ……
    f3（）；}
    void f3（） { // ……
    f4（）；}
    void f4（） { // ……
    throw some_exception（）；} f4惹禍，f1收?qǐng)觯虚gf2和f3只是一臉無(wú)辜地把異?！巴高^(guò)去”了（在Java中尚需聲明一下）--原因很可能是它們不具備足夠的上下文來(lái)處理這個(gè)異常。于是，我們不用像使用返回值那樣，從發(fā)生問(wèn)題的地方開始，到處理問(wèn)題的地方“之下”，中間每一層都要判斷一下，從而寫下一層層諸如：view plain x = f（）；if（x 《 0）
    return x；之類的語(yǔ)句。這也有利于邏輯分層。
    值得一提的是，在異?；貪L的過(guò)程中，棧上已經(jīng)構(gòu)造好的對(duì)象都會(huì)正常析構(gòu)。當(dāng)然，這要求程序員在設(shè)計(jì)類的時(shí)候要考慮“異常安全”的因素。
    關(guān)于異常處理的思想和異常的使用，完全可以講一本書。更有興趣的朋友可以去找些相關(guān)書籍看看。
    （4）事實(shí)上，C++中并非只有拋出異常的new，也有不拋異常的new，即通常所說(shuō)的“nothrow new”?？梢赃@樣使用它：view plain #include 《new》 // ……
    T* p = new （std：：nothrow） T（/* …… */）；其中，nothrow是頭文件《new》中定義的一個(gè)類型為std：：nothrow_t的常量，我們可以直接使用它。這時(shí)，如果內(nèi)存分配失敗，p的值將為空（0），且不會(huì)有異常拋出，跟C的malloc很像了。
    nothrow new實(shí)際是標(biāo)準(zhǔn)庫(kù)中實(shí)現(xiàn)的operator new和operator new［］的重載。我們也可以根據(jù)需要自己重載operator new/operator new［］，可以有全局的，也可以針對(duì)某個(gè)類重載。但實(shí)踐中用的不多。
    注意，使用nothrow new創(chuàng)建對(duì)象時(shí)，只能保證不會(huì)因?yàn)閛perator new或operator new［］的失敗而拋出std：：bad_alloc，但難保對(duì)象的構(gòu)造函數(shù)不會(huì)拋出其它異常，甚至就拋出std：：bad_alloc.
    （5）說(shuō)到C++的內(nèi)存分配，還有必要提一下set_new_handler.它允許你設(shè)置一個(gè)可以在operator new和operator new［］分配內(nèi)存失敗時(shí)可以回調(diào)的函數(shù)。如果你覺(jué)得還有什么辦法能釋放一些內(nèi)存的話，這個(gè)回調(diào)函數(shù)就是后的救命稻草了。
    （6）話說(shuō)回來(lái)，多線程程序中，尤其是所謂的worker thread中，在線程函數(shù)退出之前使用“catch（……）”捕捉一下所有異常（不止std：：bad_alloc）也不是完全沒(méi)用。別指望能恢復(fù)什么，只求不要因?yàn)橐粋€(gè)線程而掛掉整個(gè)程序，同時(shí)盡量保證一下數(shù)據(jù)一致性就好。另外，也別指望catch（……）能捕獲一切“問(wèn)題”或“bug”，沒(méi)有那么好的事情。它只能捕獲C++的異常，其它的問(wèn)題，比如前面提到的堆棧破壞，再比如野指針訪問(wèn)，哪有那么容易檢測(cè)得到。
    通常一個(gè)線程crash會(huì)導(dǎo)致整個(gè)進(jìn)程crash，有人因?yàn)檫@個(gè)原因而更傾向于使用多進(jìn)程，尤其是在類Unix的環(huán)境中。我個(gè)人對(duì)此雖不反對(duì)也不是特別贊同，因?yàn)榍穫偸且€的，這也包括“技術(shù)債務(wù)”：有bug遲早還是要解決。不過(guò)，使用多進(jìn)程還有別的好處，因?yàn)檫M(jìn)程間共享數(shù)據(jù)比同一個(gè)進(jìn)程的線程之間要麻煩得多，這會(huì)“迫使”開發(fā)者做出減少共享，從而既能減少并發(fā)問(wèn)題又能提高并發(fā)效率的設(shè)計(jì)。
    （7）后，我的另一個(gè)好朋友兼同事認(rèn)為：程序crash沒(méi)有那么可怕。它可能是多數(shù)客戶難以忍受的bug，但那只是源于社會(huì)心理，不見得是真正嚴(yán)重的bug.

2012軟件水平輔導(dǎo):漫談C++內(nèi)存分配失敗

字號(hào)： 小 中 大

字號(hào)：小中大