持久化(Persistence) 即把數據(如記憶體中的對象)保存到可永久保存的存儲設備中(如磁碟)。持久化的主要應用是將記憶體中的對象存儲在關係型的資料庫中,當然也可以存儲在磁碟文件中、XML數據文件中等等。 持久化是將程式數據在持久狀態和瞬時狀態間轉換的機制。 JDBC就是一種持久化機制。文件IO也 ...
持久化(Persistence) 即把數據(如記憶體中的對象)保存到可永久保存的存儲設備中(如磁碟)。持久化的主要應用是將記憶體中的對象存儲在關係型的資料庫中,當然也可以存儲在磁碟文件中、XML數據文件中等等。 持久化是將程式數據在持久狀態和瞬時狀態間轉換的機制。 JDBC就是一種持久化機制。文件IO也是一種持久化機制。 持久化是一種對象服務,就是把記憶體中的對象保存到外存中,讓以後能夠取回。需要實現至少3個介面: void Save(object o) 把一個對象保存到外存中 Object Load(object oid) 通過對象標識從外存中取回對象 boolExists(object oid) 檢查外存中是否存在某個對象 為什麼需要持久化服務呢?那是由於記憶體本身的缺陷引起的:
序列化
我們先跳開一下,看看另一個類似的有用概念:序列化也是一種對象服務,就是把記憶體中的對象序列化成流、或者把流反序列化成對象。需要實現2個介面: void Serialize(Stream stream,object o) 把對象序列化到流中 object Deserialize(Stream stream) 把流反序列化成對象 序列化和持久化很相似,有些人甚至混為一談,其實還是有區別的,序列化是為瞭解決對象的傳輸問題,傳輸可以線上程之間、進程之間、記憶體外存之間、主機之間進行。我之所以在這裡提到序列化,是因為我們可以利用序列化來輔助持久化,可以說凡是可以持久化的對象都可以序列化,因為序列化相對容易一些(也不是很容易),所以主流的軟體基礎設施,比如.net和java,已經把序列化的框架完成了。 持久化方案可以分為關係資料庫方案、文件方案、對象資料庫方案、xml資料庫方案,現今主流的持久化方案是關係資料庫方案,關係資料庫方案不僅解決了併發的問題,更重要的是,關係資料庫還提供了持久化服務之外的價值:統計分析功能。剛纔我說到,凡是可以序列化的對象都可以持久化,極端的說,我們可以只建立一個表Object(OID,Bytes),但基本上沒有人這麼做,因為一旦這樣,我們就失去了關係資料庫額外的統計分析功能。 關係資料庫和麵向對象之間有一條鴻溝,因為2中模式不匹配,所以就存在一個OR映射問題。 何謂“持久化”持久(Persistence),即把數據(如記憶體中的對象)保存到可永久保存的存儲設備中(如磁碟)。持久化的主要應用是將記憶體中的數據存儲在關係型的資料庫中,當然也可以存儲在磁碟文件中、XML數據文件中等等。
說說持久化(Persistence)與序列化(Serialization),我以前總是將他們混淆,其實兩者的差距確實並不大,它們相似的地方都是企圖將對象和其他東西進行轉化,不同之處在於持久化是希望能把它持久保存起來併在需要的時候再得到而序列化關心的是如何把對象變為位元組流,實質上從實用角度上來講,兩者有很大程度的相互覆蓋,序列化機制是將類的值轉化為一個一般的(即連續的)位元組流,然後將該流寫到磁碟文件或任何其他流化目標上的一個過程,這本身也可以稱之為持久化。當然所謂反序列化,顧名思義就是將序列化過程顛倒過來,由流目標得到對象的過程了。
序列化的過程就是對象寫入位元組流和從位元組流中讀取對象。將對象狀態轉換成位元組流之後,
可以用java.io包中的各種位元組流類將其保存到文件中,管道到另一線程中或通過網路連接
將對象數據發送到另一主機。對象序列化功能非常簡單、強大,在RMI、Socket、JMS、EJB
都有應用。對象序列化問題在網路編程中並不是最激動人心的課題,但卻相當重要,具有
許多實用意義。
一:對象序列化可以實現分散式對象。主要應用例如:RMI要利用對象序列化運行遠程主機上的服務,就像在本地機上運行對象時一樣。
二:java對象序列化不僅保留一個對象的數據,而且遞歸保存對象引用的每個對象的數據。可以將整個對象層次寫入位元組流中,可以保存在文件中或在網路連接上傳遞。利用對象序列可以進行對象的"深複製",即複製對象本身及引用的對象本身。序列化一個對象可能得到整個對象序列。
從上面的敘述中,我們知道了對象序列化是java編程中的必備武器,那麼讓我們從基礎開始,好好學習一下它的機制和用法。
java序列化比較簡單,通常不需要編寫保存和恢復對象狀態的定製代碼。實java.io.Serializable介面的類對象可以轉換成位元組流或從位元組流恢復,不需要在類中增加任何代碼。只有極少數情況下才需要定製代碼保存或恢復對象狀態。這裡要註意:不是每個類都可序列化,有些類是不能序列化的,例如涉及線程的類與特定JVM有非常複雜的關係。
序列化機制:
序列化分為兩大部分:序列化和反序列化。序列化是這個過程的第一部分,將數據分解成位元組流,以便存儲在文件中或在網路上傳輸。反序列化就是打開位元組流並重構對象。對象序列化不僅要將基本數據類型轉換成位元組表示,有時還要恢複數據。恢複數據要求有恢複數據的對象實例。ObjectOutputStream中的序列化過程與位元組流連接,包括對象類型和版本信息。反序列化時,JVM用頭信息生成對象實例,然後將對象位元組流中的數據複製到對象數據成員中。
下麵我們分兩大部分來闡述:
處理對象流:
(序列化過程和反序列化過程)
java.io包有兩個序列化對象的類。ObjectOutputStream負責將對象寫入位元組流,ObjectInputStream從位元組流重構對象。
我們先瞭解ObjectOutputStream類吧。ObjectOutputStream類擴展DataOutput介面。writeObject()方法是最重要的方法,用於對象序列化。如果對象包含其他對象的引用,則writeObject()方法遞歸序列化這些對象。每個ObjectOutputStream維護序列化的對象引用表,防止發送同一對象的多個拷貝。(這點很重要)由於writeObject()可以序列化整組交叉引用的對象,因此同一ObjectOutputStream實例可能不小心被請求序列化同一對象。這時,進行反引用序列化,而不是再次寫入對象位元組流。
下麵,讓我們從例子中來瞭解ObjectOutputStream這個類吧。
Java代碼
// 序列化 today's date 到一個文件中. FileOutputStream f = new FileOutputStream("tmp"); ObjectOutputStream s = new ObjectOutputStream(f); s.writeObject("Today"); s.writeObject(new Date()); s.flush();現在,讓我們來瞭解ObjectInputStream這個類。它與ObjectOutputStream相似。它擴展DataInput介面。ObjectInputStream中的方法鏡像DataInputStream中讀取Java基本數據類型的公開方法。readObject()方法從位元組流中反序列化對象。每次調用readObject()方法都返迴流中下一個Object。對象位元組流並不傳輸類的位元組碼,而是包括類名及其簽名。readObject()收到對象時,JVM裝入頭中指定的類。如果找不到這個類,則readObject()拋出ClassNotFoundException,如果需要傳輸對象數據和位元組碼,則可以用RMI框架。ObjectInputStream的其餘方法用於定製反序列化過程。
例子如下: Java代碼
//從文件中反序列化 string 對象和 date 對象 FileInputStream in = new FileInputStream("tmp"); ObjectInputStream s = new ObjectInputStream(in); String today = (String)s.readObject(); Date date = (Date)s.readObject();定製序列化過程:
序列化通常可以自動完成,但有時可能要對這個過程進行控制。java可以將類聲明為serializable,但仍可手工控制聲明為static或transient的數據成員。
例子:一個非常簡單的序列化類。 public class simpleSerializableClass Java代碼
implements Serializable{ String sToday="Today:"; transient Date dtToday=new Date(); } ... 序列化時,類的所有數據成員應可序列化除了聲明為transient或static的成員。將變數聲明為transient告訴JVM我們會負責將變元序列化。將數據成員聲明為transient後,序列化過程就無法將其加進對象位元組流中,沒有從transient數據成員發送的數據。後面數據反序列化時,要重建數據成員(因為它是類定義的一部分),但不包含任何數據,因為這個數據成員不向流中寫入任何數據。記住,對象流不序列化static或transient。我們的類要用writeObject()與readObject()方法以處理這些數據成員。使用writeObject()與readObject()方法時,還要註意按寫入的順序讀取這些數據成員。 關於如何使用定製序列化的部分代碼如下: Java代碼 收藏代碼 //重寫writeObject()方法以便處理transient的成員。 public void writeObject(ObjectOutputStream outputStream) throws IOException...{ outputStream.defaultWriteObject();//使定製的writeObject()方法可以 利用自動序列化中內置的邏輯。 outputStream.writeObject(oSocket.getInetAddress()); outputStream.writeInt(oSocket.getPort()); } //重寫readObject()方法以便接收transient的成員。 private void readObject(ObjectInputStream inputStream) throws IOException,ClassNotFoundException...{ inputStream.defaultReadObject();//defaultReadObject()補充自動序列化 InetAddress oAddress=(InetAddress)inputStream.readObject(); int iPort =inputStream.readInt(); oSocket = new Socket(oAddress,iPort); iID=getID(); dtToday =new Date(); }完全定製序列化過程:
如果一個類要完全負責自己的序列化,則實現Externalizable介面而不是Serializable介面。Externalizable介面定義包括兩個方法writeExternal()與readExternal()。利用這些方法可以控制對象數據成員如何寫入位元組流.類實現Externalizable時,頭寫入對象流中,然後類完全負責序列化和恢複數據成員,除了頭以外,根本沒有自動序列化。這裡要註意了。聲明類實現Externalizable介面會有重大的安全風險。writeExternal()與readExternal()方法聲明為public,惡意類可以用這些方法讀取和寫入對象數據。如果對象包含敏感信息,則要格外小心。這包括使用安全套接或加密整個位元組流。