pickle——保存python中数据结构的模块

原創

2020-06-25 10:55

前些天自己借用《machine learning in action》一书中的FP-Growth代码，实现了频繁项集的发现和关联规则的挖掘。由于数据量比较大，在用python跑的时候有时会出现kernel die的提示，kernel重启后又要重新从数据库里读数据、整理、发现频繁项集，实在不要太麻烦。于是就想基于spark实现，没准儿这些七七八八的毛病就好了呢？

在spark上实现后，尴尬的事情发生了。同一算法，spark上算出的频繁项集个数竟然和《machine learning in action》中的代码算出来的个数不同。好奇宝宝于是想一探究竟，怎么比较两段代码得到的频繁项集呢？没错，就是利用pickle模块！

python的pickle模块（泡菜模块）可以将python的数据结构，如list、tuple、dict等等都存在一个文件中，方便这些结构的持久化，同时也简化了代码。简单用法如下:

import pickle

#数据保存
temp_dict1 = {'001':'hello', '002':'world'}
file = open('test.pkl', 'wb')
pickle.dump(temp_dict1, file)
file.close()

#数据加载
file = open('test.pkl', 'rb')
temp_dict2 = pickle.load(file) #取出的temp_dict2 就可以为我们所用了
file.close()

这样，就已经可以满足我比较两个列表的想法了

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

快速识别你家的猫猫狗狗，教你用ModelBox开发AI萌宠应用

本文分享自華爲雲社區《ModelBox-AI應用開發：動物目標檢測【玩轉華爲雲】》，作者：陽光大貓。一、準備環境 ModelBox端雲協同AI開發套件（Windows）環境準備【視頻教程】二、應用開發 1. 創建工程在Model

2024-06-13 10:57:03

MoneyPrinterPlus:AI自动短视频生成工具,赚钱从来没有这么容易过

這是一個輕鬆賺錢的項目。短視頻時代，誰掌握了流量誰就掌握了Money! 所以給大家分享這個經過精心打造的MoneyPrinterPlus項目。它可以：使用AI大模型技術,一鍵批量生成各類短視頻。它可以：一鍵混剪短視頻，批量生成短視頻不

2024-06-12 21:38:20

一文带你搞清楚Python的多线程和多进程

本文分享自華爲雲社區《Python中的多線程與多進程編程大全【python指南】》，作者：檸檬味擁抱。 Python作爲一種高級編程語言，提供了多種併發編程的方式，其中多線程與多進程是最常見的兩種方式之一。在本文中，我們將探討Python中

2024-06-12 10:56:55

爬取京东商品图片的Python实现方法

引言在數據驅動的商業環境中，網絡爬蟲技術已成爲獲取信息的重要手段。京東作爲中國領先的電商平臺，擁有海量的商品信息和圖片資源。本文將詳細介紹如何使用Python編寫爬蟲程序，爬取京東商品的圖片，並提供完整的代碼實現過程。爬蟲基礎在開

2024-06-12 00:06:03

华为云短信服务教你用C++实现Smgp协议

本文分享自華爲雲社區《華爲雲短信服務教你用C++實現Smgp協議》，作者：張儉。引言&協議概述中國聯合網絡通信有限公司短消息網關係統接口協議（SGIP）是中國網通爲實現短信業務而制定的一種通信協議，全稱叫做Short Message

2024-06-11 10:57:30

一文搞懂DevOps、DataOps、MLOps、AIOps：所有“Ops”的比较

引言近年來，"Ops"一詞在 IT 運維領域的使用迅速增加。IT 運維正在向自動化過程轉變，以改善客戶交付。傳統的應用程序開發採用 DevOps 實施持續集成（CI）和持續部署（CD）。但對於數據密集型的機器學習和人工智能（AI）應用，精

2024-06-07 14:08:38

盘点一个Pandas数据分组的问题

大家好，我是Python進階者。一、前言前幾天在Python白銀交流羣【上海新年人】問了一個Pandas數據分組的問題，問題如下： list1 = '電子稅票號碼徵收稅務機關社保經辦機構單位編號費種徵收品目徵收子目費款所屬

2024-06-07 10:02:02

sublime text4 定制记录

經過測試sublime text4用於python開發時，使用pyright做爲lsp服務比較好，能夠提示出numpy的各種函數。但有時提示也太多了，類似於idea，會把所有能查到的變量都提示出來，我更需要的是類似 vs.net 那樣的精確

2024-06-07 01:14:07

sublime text定制

經過測試sublime text4用於python開發時，使用pyright做爲lsp服務比較好，能夠提示出numpy的各種函數。但有時提示也太多了，類似於idea，會把所有能查到的變量都提示出來，我更需要的是類似 vs.net 那樣的精確

2024-06-07 01:14:04

无需搭建环境，零门槛带你体验Open-Sora文生视频应用

本文分享自華爲雲社區《Open-Sora 文生視頻原來在AI Gallery上也能體驗了》，作者：碼上開花_Lancer。體驗鏈接：Open-Sora 文生視頻案例體驗不久前，OpenAI Sora 憑藉其驚人的視頻生成效果迅速走紅，在

2024-06-06 10:56:52

有没有python在flask框架下开发的实际案例？

大家好，我是Python進階者。一、前言前幾天在Python鑽石交流羣【進擊的python】問了一個Python web開發的問題，問題如下：各位大佬，有沒有python在flask框架下開發的實際案例？？？求分享二、實現過程 git

2024-06-06 10:01:59

[oeasy]python020在游戏中体验数值自由_勇闯地下城_终端文字游戏

繼續運行 ?* 回憶上次內容上次使用shell環境中的命令命令作用 c

2024-06-05 12:31:14

Python网络爬虫要清理cookies 才能再爬，有啥解决方法嘛？

大家好，我是Python進階者。一、前言前幾天在Python鑽石交流羣【大寫一個Y】問了一個Python基網絡爬蟲的問題，問題如下：大佬們請教個問題我做了個在某眼查抓地址數據的爬蟲，程序中做了隨機2-5秒的循環延時，現在大概爬8

2024-06-05 10:02:06

自动化Reddit图片收集：Python爬虫技巧

引言 Reddit，作爲一個全球性的社交平臺，擁有海量的用戶生成內容，其中包括大量的圖片資源。對於數據科學家、市場研究人員或任何需要大量圖片資源的人來說，自動化地從Reddit收集圖片是一個極具價值的技能。本文將詳細介紹如何使用Pyth

2024-06-05 00:06:19

什么是LLM大模型训练，详解Transformer结构模型

本文分享自華爲雲社區《LLM 大模型學習必知必會系列(四)：LLM訓練理論篇以及Transformer結構模型詳解》，作者：汀丶。 1.模型/訓練/推理知識介紹深度學習領域所謂的“模型”，是一個複雜的數學公式構成的計算步驟。爲了便於理解

2024-06-04 11:09:34

24小時熱門文章

最新文章

最新評論文章