轉載songdeyouxiang 1、資料庫命名規範採用26個英文字母(區分大小寫)和0-9的自然數(經常不需要)加上下劃線'_'組成;命名簡潔明確(長度不能超過30個字元);例如：user, stat, log, 也可以wifi_user, wifi_stat, wifi_log給資料庫加個首碼; ...

轉載 songdeyouxiang

1、資料庫命名規範
採用26個英文字母(區分大小寫)和0-9的自然數(經常不需要)加上下劃線'_'組成;
命名簡潔明確(長度不能超過30個字元);
例如：user, stat, log, 也可以wifi_user, wifi_stat, wifi_log給資料庫加個首碼;
除非是備份資料庫可以加0-9的自然數：user_db_20151210;

2、資料庫表名命名規範
    採用26個英文字母(區分大小寫)和0-9的自然數(經常不需要)加上下劃線'_'組成;
    命名簡潔明確,多個單詞用下劃線'_'分隔;
    例如：user_login, user_profile, user_detail, user_role, user_role_relation,
        user_role_right, user_role_right_relation
    表首碼'user_'可以有效的把相同關係的表顯示在一起;

3、資料庫表欄位名命名規範
    採用26個英文字母(區分大小寫)和0-9的自然數(經常不需要)加上下劃線'_'組成;
    命名簡潔明確,多個單詞用下劃線'_'分隔;
    例如：user_login表欄位 user_id, user_name, pass_word, eamil, tickit, status, mobile, add_time;
    每個表中必須有自增主鍵,add_time(預設系統時間)
    表與表之間的相關聯欄位名稱要求儘可能的相同;

4、資料庫表欄位類型規範
    用儘量少的存儲空間來存數一個欄位的數據;
    例如：能使用int就不要使用varchar、char,能用varchar(16)就不要使用varchar(256);
    IP地址最好使用int類型;
    固定長度的類型最好使用char,例如：郵編;
    能使用tinyint就不要使用smallint,int;
    最好給每個欄位一個預設值,最好不能為null;

5、資料庫表索引規範
    命名簡潔明確,例如：user_login表user_name欄位的索引應為user_name_index唯一索引;
    為每個表創建一個主鍵索引;
    為每個表創建合理的索引;
    建立複合索引請慎重;

6、簡單熟悉資料庫範式
    第一範式(1NF)：欄位值具有原子性,不能再分(所有關係型資料庫系統都滿足第一範式);
        例如：姓名欄位,其中姓和名是一個整體,如果區分姓和名那麼必須設立兩個獨立欄位;

    第二範式(2NF)：一個表必須有主鍵,即每行數據都能被唯一的區分;
        備註：必須先滿足第一範式;

    第三範式(3NF)：一個表中不能包涵其他相關表中非關鍵欄位的信息,即數據表不能有沉餘欄位;
        備註：必須先滿足第二範式;

    備註：往往我們在設計表中不能遵守第三範式,因為合理的沉餘欄位將會給我們減少join的查詢;
          例如：相冊表中會添加圖片的點擊數欄位,在相冊圖片表中也會添加圖片的點擊數欄位;

MYSQL資料庫設計原則

1、核心原則
    不在資料庫做運算;
    cpu計算務必移至業務層;
    控制列數量(欄位少而精,欄位數建議在20以內);
    平衡範式與冗餘(效率優先；往往犧牲範式)
    拒絕3B(拒絕大sql語句：big sql、拒絕大事物：big transaction、拒絕大批量：big batch);

2、欄位類原則
    用好數值類型(用合適的欄位類型節約空間);
    字元轉化為數字(能轉化的最好轉化,同樣節約空間、提高查詢性能);
    避免使用NULL欄位(NULL欄位很難查詢優化、NULL欄位的索引需要額外空間、NULL欄位的複合索引無效);
    少用text類型(儘量使用varchar代替text欄位);

3、索引類原則
    合理使用索引(改善查詢,減慢更新,索引一定不是越多越好);
    字元欄位必須建首碼索引;
    不在索引做列運算;
    innodb主鍵推薦使用自增列(主鍵建立聚簇索引,主鍵不應該被修改,字元串不應該做主鍵)(理解Innodb的索引保存結構就知道了);
    不用外鍵(由程式保證約束);

4、sql類原則
    sql語句儘可能簡單(一條sql只能在一個cpu運算,大語句拆小語句,減少鎖時間,一條大sql可以堵死整個庫);
    簡單的事務;
    避免使用trig/func(觸發器、函數不用客戶端程式取而代之);
    不用select *(消耗cpu,io,記憶體,帶寬,這種程式不具有擴展性);
    OR改寫為IN(or的效率是n級別);
    OR改寫為UNION(mysql的索引合併很弱智);
        select id from t where phone = ’159′ or name = ‘john’;
        =>
        select id from t where phone=’159′
        union
        select id from t where name=’jonh’
    避免負向%;
    慎用count(*);
    limit高效分頁(limit越大，效率越低);
    使用union all替代union(union有去重開銷);
    少用連接join;
    使用group by;
    請使用同類型比較;
    打散批量更新;

5、性能分析工具
    show profile;
    mysqlsla;
    mysqldumpslow;
    explain;
    show slow log;
    show processlist;

複製代碼
資料庫的設計原則

複製代碼

原始單據與實體之間的關係
　　可以是一對一、一對多、多對多的關係。在一般情況下，它們是一對一的關係：即一張原始單據對應且只對應一個實體。
在特殊情況下，它們可能是一對多或多對一的關係，即一張原始單證對應多個實體，或多張原始單證對應一個實體。
這裡的實體可以理解為基本表。明確這種對應關係後，對我們設計錄入界面大有好處。

　　〖例1〗：一份員工履歷資料，在人力資源信息系統中，就對應三個基本表：員工基本情況表、社會關係表、工作簡歷表。
　　　　　　這就是“一張原始單證對應多個實體”的典型例子。

主鍵與外鍵
　　一般而言，一個實體不能既無主鍵又無外鍵。在E—R 圖中, 處於葉子部位的實體, 可以定義主鍵，也可以不定義主鍵
　　(因為它無子孫), 但必須要有外鍵(因為它有父親)。

　　主鍵與外鍵的設計，在全局資料庫的設計中，占有重要地位。當全局資料庫的設計完成以後，有個美國資料庫設計專
　　家說：“鍵，到處都是鍵，除了鍵之外，什麼也沒有”，這就是他的資料庫設計經驗之談，也反映了他對信息系統核
　　心(數據模型)的高度抽象思想。因為：主鍵是實體的高度抽象，主鍵與外鍵的配對，表示實體之間的連接。

基本表的性質
　　基本表與中間表、臨時表不同，因為它具有如下四個特性：
　　 (1) 原子性。基本表中的欄位是不可再分解的。
　　 (2) 原始性。基本表中的記錄是原始數據（基礎數據）的記錄。
　　 (3) 演繹性。由基本表與代碼表中的數據，可以派生出所有的輸出數據。
　　 (4) 穩定性。基本表的結構是相對穩定的，表中的記錄是要長期保存的。
　　理解基本表的性質後，在設計資料庫時，就能將基本表與中間表、臨時表區分開來。
範式標準
　　基本表及其欄位之間的關係, 應儘量滿足第三範式。但是，滿足第三範式的資料庫設計，往往不是最好的設計。
　　為了提高資料庫的運行效率，常常需要降低範式標準：適當增加冗餘，達到以空間換時間的目的。

　　〖例2〗：有一張存放商品的基本表，如表1所示。“金額”這個欄位的存在，表明該表的設計不滿足第三範式，
　　因為“金額”可以由“單價”乘以“數量”得到，說明“金額”是冗餘欄位。但是，增加“金額”這個冗餘欄位，
　　可以提高查詢統計的速度，這就是以空間換時間的作法。
　　在Rose 2002中，規定列有兩種類型：數據列和計算列。“金額”這樣的列被稱為“計算列”，而“單價”和
　　“數量”這樣的列被稱為“數據列”。

　　表1 商品表的表結構
　　商品名稱商品型號單價數量金額
　　電視機 29吋 2,500 40 100,000 　　

通俗地理解三個範式
　　通俗地理解三個範式，對於資料庫設計大有好處。在資料庫設計中，為了更好地應用三個範式，就必須通俗地理解
　　三個範式(通俗地理解是夠用的理解，並不是最科學最準確的理解)：
　　第一範式：1NF是對屬性的原子性約束，要求屬性具有原子性，不可再分解；
　　第二範式：2NF是對記錄的惟一性約束，要求記錄有惟一標識，即實體的惟一性；
　　第三範式：3NF是對欄位冗餘性的約束，即任何欄位不能由其他欄位派生出來，它要求欄位沒有冗餘。

　　沒有冗餘的資料庫設計可以做到。但是，沒有冗餘的資料庫未必是最好的資料庫，有時為了提高運行效率，就必須降
　　低範式標準，適當保留冗餘數據。具體做法是：在概念數據模型設計時遵守第三範式，降低範式標準的工作放到物理
　　數據模型設計時考慮。降低範式就是增加欄位，允許冗餘。

要善於識別與正確處理多對多的關係
　　若兩個實體之間存在多對多的關係，則應消除這種關係。消除的辦法是，在兩者之間增加第三個實體。這樣，原來一
　　個多對多的關係，現在變為兩個一對多的關係。要將原來兩個實體的屬性合理地分配到三個實體中去。這裡的第三個
　　實體，實質上是一個較複雜的關係，它對應一張基本表。一般來講，資料庫設計工具不能識別多對多的關係，但能處
　　理多對多的關係。

　　〖例3〗：在“圖書館信息系統”中，“圖書”是一個實體，“讀者”也是一個實體。這兩個實體之間的關係，是一
　　個典型的多對多關係：一本圖書在不同時間可以被多個讀者借閱，一個讀者又可以借多本圖書。為此，要在二者之
　　間增加第三個實體，該實體取名為“借還書”，它的屬性為：借還時間、借還標誌(0表示借書，1表示還書)，另外，
　　它還應該有兩個外鍵(“圖書”的主鍵，“讀者”的主鍵)，使它能與“圖書”和“讀者”連接。

註視：

圖書 1 和該實體取名為“借還書” n
讀者 1 和該實體取名為“借還書” n

主鍵PK的取值方法
　　 PK是供程式員使用的表間連接工具，可以是一無物理意義的數字串, 由程式自動加1來實現。也可以是有物理意義
　　的欄位名或欄位名的組合。不過前者比後者好。當PK是欄位名的組合時，建議欄位的個數不要太多，多了不但索引
　　占用空間大，而且速度也慢。
正確認識數據冗餘
　　主鍵與外鍵在多表中的重覆出現, 不屬於數據冗餘，這個概念必須清楚，事實上有許多人還不清楚。非鍵欄位的重
　　復出現, 才是數據冗餘！而且是一種低級冗餘，即重覆性的冗餘。高級冗餘不是欄位的重覆出現，而是欄位的派生出現。

　　〖例4〗：商品中的“單價、數量、金額”三個欄位，“金額”就是由“單價”乘以“數量”派生出來的，它就是冗餘，
　　而且是一種高級冗餘。冗餘的目的是為了提高處理速度。只有低級冗餘才會增加數據的不一致性，因為同一數據，可
　　能從不同時間、地點、角色上多次錄入。因此，我們提倡高級冗餘(派生性冗餘)，反對低級冗餘(重覆性冗餘)。

E--R圖沒有標準答案
　　信息系統的E--R圖沒有標準答案，因為它的設計與畫法不是惟一的，只要它覆蓋了系統需求的業務範圍和功能內容，
　　就是可行的。反之要修改E--R圖。儘管它沒有惟一的標準答案，並不意味著可以隨意設計。好的E—R圖的標準是：
　　結構清晰、關聯簡潔、實體個數適中、屬性分配合理、沒有低級冗餘。

10 . 視圖技術在資料庫設計中很有用
　　與基本表、代碼表、中間表不同，視圖是一種虛表，它依賴數據源的實表而存在。視圖是供程式員使用資料庫的
　　一個視窗，是基表數據綜合的一種形式, 是數據處理的一種方法，是用戶數據保密的一種手段。為了進行複雜處理、
　　提高運算速度和節省存儲空間, 視圖的定義深度一般不得超過三層。若三層視圖仍不夠用, 則應在視圖上定義臨時表,
　　在臨時表上再定義視圖。這樣反覆交迭定義, 視圖的深度就不受限制了。

　　對於某些與國家政治、經濟、技術、軍事和安全利益有關的信息系統，視圖的作用更加重要。這些系統的基本表完
　　成物理設計之後，立即在基本表上建立第一層視圖，這層視圖的個數和結構，與基本表的個數和結構是完全相同。
　　並且規定，所有的程式員，一律只准在視圖上操作。只有資料庫管理員，帶著多個人員共同掌握的“安全鑰匙”，
　　才能直接在基本表上操作。請讀者想想：這是為什麼？

中間表、報表和臨時表
　　中間表是存放統計數據的表，它是為數據倉庫、輸出報表或查詢結果而設計的，有時它沒有主鍵與外鍵(數據倉
　　庫除外)。臨時表是程式員個人設計的，存放臨時記錄，為個人所用。基表和中間表由DBA維護，臨時表由程式員
　　自己用程式自動維護。
完整性約束表現在三個方面
　　域的完整性：用Check來實現約束，在資料庫設計工具中，對欄位的取值範圍進行定義時，有一個Check按鈕，通
　　過它定義欄位的值城。
　　參照完整性：用PK、FK、表級觸發器來實現。
　　用戶定義完整性：它是一些業務規則，用存儲過程和觸發器來實現。
防止資料庫設計打補丁的方法是“三少原則”
　　 (1) 一個資料庫中表的個數越少越好。只有表的個數少了，才能說明系統的E--R圖少而精，去掉了重覆的多餘的
　　　　實體，形成了對客觀世界的高度抽象，進行了系統的數據集成，防止了打補丁式的設計；

　　 (2) 一個表中組合主鍵的欄位個數越少越好。因為主鍵的作用，一是建主鍵索引，二是做為子表的外鍵，所以組
　　　　合主鍵的欄位個數少了，不僅節省了運行時間，而且節省了索引存儲空間；

　　 (3) 一個表中的欄位個數越少越好。只有欄位的個數少了，才能說明在系統中不存在數據重覆，且很少有數據冗
　　　　餘，更重要的是督促讀者學會“列變行”，這樣就防止了將子表中的欄位拉入到主表中去，在主表中留下許
　　　　多空餘的欄位。所謂“列變行”，就是將主表中的一部分內容拉出去，另外單獨建一個子表。這個方法很簡
　　　　單，有的人就是不習慣、不採納、不執行。

　　資料庫設計的實用原則是：在數據冗餘和處理速度之間找到合適的平衡點。“三少”是一個整體概念，綜合觀點，
　　不能孤立某一個原則。該原則是相對的，不是絕對的。“三多”原則肯定是錯誤的。試想：若覆蓋系統同樣的功
　　能，一百個實體(共一千個屬性) 的E--R圖，肯定比二百個實體(共二千個屬性) 的E--R圖，要好得多。

　　提倡“三少”原則，是叫讀者學會利用資料庫設計技術進行系統的數據集成。數據集成的步驟是將文件系統集成
　　為應用資料庫，將應用資料庫集成為主題資料庫，將主題資料庫集成為全局綜合資料庫。集成的程度越高，數據
　　共用性就越強，信息孤島現象就越少，整個企業信息系統的全局E—R圖中實體的個數、主鍵的個數、屬性的個數
　　就會越少。

　　提倡“三少”原則的目的，是防止讀者利用打補丁技術，不斷地對資料庫進行增刪改，使企業資料庫變成了隨意
　　設計資料庫表的“垃圾堆”，或資料庫表的“大雜院”，最後造成資料庫中的基本表、代碼表、中間表、臨時表
　　雜亂無章，不計其數（即動態創表而增加表數量），導致企事業單位的信息系統無法維護而癱瘓。

　　 “三多”原則任何人都可以做到，該原則是“打補丁方法”設計資料庫的歪理學說。“三少”原則是少而精的
　　原則，它要求有較高的資料庫設計技巧與藝術，不是任何人都能做到的，因為該原則是杜絕用“打補丁方法”
　　設計資料庫的理論依據。

提高資料庫運行效率的辦法
　　在給定的系統硬體和系統軟體條件下，提高資料庫系統的運行效率的辦法是：
　　 (1) 在資料庫物理設計時，降低範式，增加冗餘, 少用觸發器, 多用存儲過程。
　　 (2) 當計算非常複雜、而且記錄條數非常巨大時(例如一千萬條)，複雜計算要先在資料庫外面，以文件系統方
　　　　式用C++語言計算處理完成之後，最後才入庫追加到表中去。這是電信計費系統設計的經驗。
　　 (3) 發現某個表的記錄太多，例如超過一千萬條，則要對該表進行水平分割。水平分割的做法是，以該表主鍵
　　　　PK的某個值為界線，將該表的記錄水平分割為兩個表（即可以表維護表行數過大手動分割為兩個建個兩表union的視圖對程式透明）。若發現某個表的欄位太多，例如超過八十個，則
　　　　垂直分割該表，將原來的一個表分解為兩個表。
　　 (4) 對資料庫管理系統DBMS進行系統優化，即優化各種系統參數，如緩衝區個數。
　　 (5) 在使用面向數據的SQL語言進行程式設計時，儘量採取優化演算法。
　　　　總之，要提高資料庫的運行效率，必須從資料庫系統級優化、資料庫設計級優化、程式實現級優化，這三
　　　　個層次上同時下功夫。

　　上述十四個技巧，是許多人在大量的資料庫分析與設計實踐中，逐步總結出來的。對於這些經驗的運用，讀者不能生幫硬套，死記硬背，而要消化理解，實事求是，靈活掌握。並逐步做到：在應用中發展，在發展中應用。

轉載自：http://www.javaeye.com/topic/281611

=================================

denormalization在DATABASE里怎麼解釋？給個例子
2008-04-01 21:16
辭典:反向規格化, 阻礙正常化
就是我們通常所說的逆規範化.
比如在一個表裡設置兩個主鍵.
比如在兩個表之間的關係為多對多關係.
等等都是違反標準範式的
無論是規範化還是逆規範化都是為了提高資料庫性能.
初學者還是儘量做到規範化的好

MySQL資料庫設計規範

轉載songdeyouxiang

轉載 songdeyouxiang