什么是序列化對(duì)象?
我們把對(duì)象(變量)從內(nèi)存中編程可存儲(chǔ)或傳輸?shù)倪^程稱之為序列化,在python中稱為pickle,其他語言稱之為serialization,marshalling,flatterning等等,都是一個(gè)意思。
序列化之后,就可以把序列化后的內(nèi)容寫入磁盤,或者通過網(wǎng)絡(luò)傳輸?shù)絼e的機(jī)器上(因?yàn)橛脖P或網(wǎng)絡(luò)傳輸時(shí)只接受bytes)。
反過來,把變量?jī)?nèi)容從序列化的對(duì)象重新讀到內(nèi)存里稱之為反序列化,即unpacking。
為什么要序列化?
舉個(gè)例子,你在打游戲過程中,打累了,停下來,想過兩天再玩,兩天之后,游戲又從你上次停止的地方繼續(xù)運(yùn)行,你上次游戲的進(jìn)度肯定保存到硬盤上了,那么是以何種形式呢?游戲過程中產(chǎn)生的很多臨時(shí)數(shù)據(jù)是不規(guī)律的,可能在你關(guān)掉游戲時(shí)正好是10個(gè)列表,3個(gè)嵌套字典的數(shù)據(jù)集合在內(nèi)存里面,需要存下來,你如何存?把列表變成文件里的多行多列形式?那嵌套字典呢?根本沒法存吧,所以,若是有種辦法可以直接把內(nèi)存數(shù)據(jù)存到硬盤上,下次程序再啟動(dòng),再從硬盤上讀出來,還是原來的格式,那是最好的,所以這就是我們要說的序列化。
1、持久保存狀態(tài)
一個(gè)軟件/程序的執(zhí)行就在處理一系列狀態(tài)的變化,在編程語言中,‘狀態(tài)’會(huì)以各種各樣有結(jié)構(gòu)的數(shù)據(jù)類型(也可以簡(jiǎn)單的理解為變量)的形式被保存在內(nèi)存中
內(nèi)存是無法永久保存數(shù)據(jù)的,當(dāng)程序運(yùn)行了一段時(shí)間,我們斷電或者重啟程序,內(nèi)存中關(guān)于這個(gè)程序的之前一段時(shí)間的數(shù)據(jù)(有結(jié)構(gòu))都被清空了。
在斷電或重啟程序之前將程序當(dāng)前內(nèi)存中所有的數(shù)據(jù)都保存下來(保存到文件中),以便于下次程序執(zhí)行能夠從文件中載入之前的數(shù)據(jù),然后繼續(xù)執(zhí)行,這就是序列化。
2、跨平臺(tái)數(shù)據(jù)交互
序列化之后,不僅可以把序列化后的內(nèi)容寫入磁盤,還可以通過網(wǎng)絡(luò)傳輸?shù)絼e的機(jī)器上,如果收發(fā)的雙方約定好使用一種序列化的格式,那么變打破了平臺(tái)/語言差異化帶來的限制,實(shí)現(xiàn)了跨平臺(tái)的數(shù)據(jù)交互。
反過來,把變量?jī)?nèi)容從序列化的對(duì)象重新讀到內(nèi)存里稱之為反序列化,即unpickling.
什么可以序列化操作?
在python中,可以使用pickle和json兩個(gè)模塊對(duì)數(shù)據(jù)進(jìn)行序列化操作
其中:
json可以用于字符串或者字典等與python數(shù)據(jù)類型之間的序列化與反序列化操作
pickle可以用于python特有類型與python數(shù)據(jù)類型之間的序列化與反序列化操作
提問:這時(shí)候有人肯定要問,兩個(gè)都可以對(duì)數(shù)據(jù)進(jìn)行序列化,為什么不只學(xué)習(xí)一個(gè)就好了,非要學(xué)習(xí)兩個(gè)呢?
這個(gè)問題問的好,我們下面詳細(xì)講一下兩個(gè)的區(qū)別。
關(guān)于json
優(yōu)點(diǎn):跨語言,體積小
缺點(diǎn):只能支持int(整形),str(字符串),list(列表),tuple(元祖),dict(字典)
關(guān)于pickle
優(yōu)點(diǎn):專門為python設(shè)計(jì),只支持python所有的數(shù)據(jù)類型
缺點(diǎn):只能在python中使用,存儲(chǔ)數(shù)據(jù)占空間大
以上內(nèi)容為大家介紹了python序列化及其相關(guān)模塊,希望對(duì)大家有所幫助,如果想要了解更多Python相關(guān)知識(shí),請(qǐng)關(guān)注IT培訓(xùn)機(jī)構(gòu):千鋒教育。