觸屏版
全國服務(wù)熱線:0571-87205688
登錄
注冊
客戶中心
關(guān)注云客
如今,互聯(lián)網(wǎng)上關(guān)于數(shù)據(jù)庫優(yōu)化方面的文章很多,但是有的寫的似是而非,有的不切實際,對一個數(shù)據(jù)庫來說,只能做到更優(yōu),不可能最優(yōu),并且由于實際需求不同,優(yōu)化方案還是有所差異的,根據(jù)實際需要關(guān)心的方面(速度、存儲空間、可維護(hù)性、可拓展性)來優(yōu)化數(shù)據(jù)庫,而這些方面往往又是相互矛盾的。
一個系統(tǒng)的性能的提高,不單單是試運行或者維護(hù)階段的性能調(diào)優(yōu),也不單單是開發(fā)階段的事情,而是在整個軟件生命周期都需要注意,所以,我按照軟件生命周期的不同階段來總結(jié)數(shù)據(jù)庫性能優(yōu)化相關(guān)的方法及注意事項。
一、為什么要優(yōu)化數(shù)據(jù)庫?
數(shù)據(jù)庫的應(yīng)用程序優(yōu)化通??煞譃閮蓚€方面:源代碼和SQL語句。
由于涉及到對程序邏輯的改變,源代碼的優(yōu)化在時間成本和風(fēng)險上代價很高,而對數(shù)據(jù)庫系統(tǒng)性能的提升收效有限,那么,我們?yōu)槭裁匆獌?yōu)化SQL語句呢?
1、SQL語句是對數(shù)據(jù)庫進(jìn)行操作的惟一途徑,對數(shù)據(jù)庫系統(tǒng)的性能起著決定性的作用。
2、SQL語句消耗了70%至90%的數(shù)據(jù)庫資源。
3、SQL語句獨立于程序設(shè)計邏輯,對SQL語句進(jìn)行優(yōu)化不會影響程序邏輯。
4、SQL語句有不同的寫法,在性能上的差異非常大。
5、SQL語句易學(xué),但難精通。
優(yōu)化SQL語句的傳統(tǒng)方法是通過手工重寫來對SQL語句進(jìn)行優(yōu)化,DBA或資深程序員通過對SQL語句執(zhí)行計劃的分析,依靠經(jīng)驗,嘗試重寫SQL語句,然后對結(jié)果和性能進(jìn)行比較,以試圖找到性能較佳的SQL語句。
這種傳統(tǒng)上的作法無法找出SQL語句的所有可能寫法,且依賴于人的經(jīng)驗,非常耗費時間。
二、分析階段
一般來說,在系統(tǒng)分析階段往往有太多需要關(guān)注的地方,系統(tǒng)各種功能性、可用性、可靠性、安全性需求往往吸引了我們大部分的注意力。
但是,馬海祥必須提醒大家要注意一點,性能是很重要的非功能性需求,必須根據(jù)系統(tǒng)的特點確定其實時性需求、響應(yīng)時間的需求、硬件的配置等,最好能有各種需求的量化的指標(biāo)。
另一方面,在分析階段應(yīng)該根據(jù)各種需求區(qū)分出系統(tǒng)的類型,大的方面,區(qū)分是OLTP(聯(lián)機(jī)事務(wù)處理系統(tǒng))和OLAP(聯(lián)機(jī)分析處理系統(tǒng))。
三、設(shè)計階段
設(shè)計階段可以說是以后系統(tǒng)性能的關(guān)鍵階段,在這個階段,有一個關(guān)系到以后幾乎所有性能調(diào)優(yōu)的過程—數(shù)據(jù)庫設(shè)計。
在數(shù)據(jù)庫設(shè)計完成后,可以進(jìn)行初步的索引設(shè)計,好的索引設(shè)計可以指導(dǎo)編碼階段寫出高效率的代碼,為整個系統(tǒng)的性能打下良好的基礎(chǔ)。
對于性能要求設(shè)計階段,我們需要注意以下幾點:
1、數(shù)據(jù)庫邏輯設(shè)計的規(guī)范化
數(shù)據(jù)庫邏輯設(shè)計的規(guī)范化就是我們一般所說的范式,我們可以這樣來簡單理解范式:
第1規(guī)范:沒有重復(fù)的組或多值的列,這是數(shù)據(jù)庫設(shè)計的最低要求。
第2規(guī)范:每個非關(guān)鍵字段必須依賴于主關(guān)鍵字,不能依賴于一個組合式主關(guān)鍵字的某些組成部分,消除部分依賴,大部分情況下,數(shù)據(jù)庫設(shè)計都應(yīng)該達(dá)到第二范式。
第3規(guī)范:一個非關(guān)鍵字段不能依賴于另一個非關(guān)鍵字段。消除傳遞依賴,達(dá)到第三范式應(yīng)該是系統(tǒng)中大部分表的要求,除非一些特殊作用的表。
更高的范式要求這里就不再作介紹了,在馬海祥看來,如果全部達(dá)到第二范式,大部分達(dá)到第三范式,系統(tǒng)會產(chǎn)生較少的列和較多的表,因而減少了數(shù)據(jù)冗余,也利于性能的提高。
2、合理的冗余
完全按照規(guī)范化設(shè)計的系統(tǒng)幾乎是不可能的,除非系統(tǒng)特別的小,在規(guī)范化設(shè)計后,有計劃地加入冗余是必要的。
冗余可以是冗余數(shù)據(jù)庫、冗余表或者冗余字段,不同粒度的冗余可以起到不同的作用。
冗余可以是為了編程方便而增加,也可以是為了性能的提高而增加。
從性能角度來說,冗余數(shù)據(jù)庫可以分散數(shù)據(jù)庫壓力,冗余表可以分散數(shù)據(jù)量大的表的并發(fā)壓力,也可以加快特殊查詢的速度,冗余字段可以有效減少數(shù)據(jù)庫表的連接,提高效率。
3、主鍵的設(shè)計
主鍵是必要的,SQL SERVER的主鍵同時是一個唯一索引,而且在實際應(yīng)用中,我們往往選擇最小的鍵組合作為主鍵,所以主鍵往往適合作為表的聚集索引,聚集索引對查詢的影響是比較大的,這個在下面索引的敘述。
在有多個鍵的表,主鍵的選擇也比較重要,一般選擇總的長度小的鍵,小的鍵的比較速度快,同時小的鍵可以使主鍵的B樹結(jié)構(gòu)的層次更少。
主鍵的選擇還要注意組合主鍵的字段次序,對于組合主鍵來說,不同的字段次序的主鍵的性能差別可能會很大,一般應(yīng)該選擇重復(fù)率低、單獨或者組合查詢可能性大的字段放在前面。
4、外鍵的設(shè)計
外鍵作為數(shù)據(jù)庫對象,很多人認(rèn)為麻煩而不用,實際上,外鍵在大部分情況下是很有用的,理由是:
外鍵是最高效的一致性維護(hù)方法,數(shù)據(jù)庫的一致性要求,依次可以用外鍵、CHECK約束、規(guī)則約束、觸發(fā)器、客戶端程序,一般認(rèn)為,離數(shù)據(jù)越近的方法效率越高。
謹(jǐn)慎使用級聯(lián)刪除和級聯(lián)更新,級聯(lián)刪除和級聯(lián)更新作為SQL SERVER 2000當(dāng)年的新功能,在2005作了保留,應(yīng)該有其可用之處。
馬海祥這里說的謹(jǐn)慎,是因為級聯(lián)刪除和級聯(lián)更新有些突破了傳統(tǒng)的關(guān)于外鍵的定義,功能有點太過強(qiáng)大,使用前必須確定自己已經(jīng)把握好其功能范圍,否則,級聯(lián)刪除和級聯(lián)更新可能讓你的數(shù)據(jù)莫名其妙的被修改或者丟失。
從性能看級聯(lián)刪除和級聯(lián)更新是比其他方法更高效的方法。
5、字段的設(shè)計
字段是數(shù)據(jù)庫最基本的單位,其設(shè)計對性能的影響是很大的,對此,馬海祥提醒大家要注意以下幾點:
A、數(shù)據(jù)類型盡量用數(shù)字型,數(shù)字型的比較比字符型的快很多。
B、數(shù)據(jù)類型盡量小,這里的盡量小是指在滿足可以預(yù)見的未來需求的前提下的。
C、 盡量不要允許NULL,除非必要,可以用NOT NULL+DEFAULT代替。
D、少用TEXT和IMAGE,二進(jìn)制字段的讀寫是比較慢的,而且,讀取的方法也不多,大部分情況下最好不用。
E、自增字段要慎用,不利于數(shù)據(jù)遷移。
6、數(shù)據(jù)庫物理存儲和環(huán)境的設(shè)計
在設(shè)計階段,可以對數(shù)據(jù)庫的物理存儲、操作系統(tǒng)環(huán)境、網(wǎng)絡(luò)環(huán)境進(jìn)行必要的設(shè)計,使得我們的系統(tǒng)在將來能適應(yīng)比較多的用戶并發(fā)和比較大的數(shù)據(jù)量。
這里需要注意文件組的作用,適用文件組可以有效把I/O操作分散到不同的物理硬盤,提高并發(fā)能力。
7、系統(tǒng)設(shè)計
整個系統(tǒng)的設(shè)計特別是系統(tǒng)結(jié)構(gòu)設(shè)計對性能是有很大影響的,對于一般的OLTP系統(tǒng),可以選擇C/S結(jié)構(gòu)、三層的C/S結(jié)構(gòu)等,不同的系統(tǒng)結(jié)構(gòu)其性能的關(guān)鍵也有所不同。
系統(tǒng)設(shè)計階段應(yīng)該歸納一些業(yè)務(wù)邏輯放在數(shù)據(jù)庫編程實現(xiàn),數(shù)據(jù)庫編程包括數(shù)據(jù)庫存儲過程、觸發(fā)器和函數(shù),用數(shù)據(jù)庫編程實現(xiàn)業(yè)務(wù)邏輯的好處是減少網(wǎng)絡(luò)流量并可更充分利用數(shù)據(jù)庫的預(yù)編譯和緩存功能。
8、索引的設(shè)計
在設(shè)計階段,可以根據(jù)功能和性能的需求進(jìn)行初步的索引設(shè)計,這里需要根據(jù)預(yù)計的數(shù)據(jù)量和查詢來設(shè)計索引,可能與將來實際使用的時候會有所區(qū)別。
關(guān)于索引的選擇,馬海祥提醒大家要注意以下幾點:
A、根據(jù)數(shù)據(jù)量決定哪些表需要增加索引,數(shù)據(jù)量小的可以只有主鍵。
B、根據(jù)使用頻率決定哪些字段需要建立索引,選擇經(jīng)常作為連接條件、篩選條件、聚合查詢、排序的字段作為索引的候選字段。
C、把經(jīng)常一起出現(xiàn)的字段組合在一起,組成組合索引,組合索引的字段順序與主鍵一樣,也需要把最常用的字段放在前面,把重復(fù)率低的字段放在前面。
D、一個表不要加太多索引,因為索引影響插入和更新的速度。
評論(0人參與,0條評論)
發(fā)布評論
最新評論