原创 第一章—計算機網絡體系結構
1. 計算機網絡定義 計算機網絡是一個將分散的、具有獨立功能的計算機系統,通過通信設備與線路連接起來,由功能完善的軟件(網絡通信協議、信息交換方式、網絡操作系統)實現資源共享和信息傳遞的系統。簡言之,計算機網絡就是一些互連的、自治
原创 第三章—數據鏈路層
1. 數據組幀 (1)幀定界、幀同步、透明傳輸 幀定界:確定幀的邊界 幀同步:接受方應當能從接受到的二進制比特流中區分出幀的起始與終止。 透明傳輸:不管所傳數據
原创 第二章—物理層
1. 通信基礎 (1)基本概念:數據、信號、碼元、信源、信道、信宿、速率、波特、帶寬 數據:傳送信息的實體 信號:數據的電氣或電磁的表現 碼元:用一個固定時長的信號波形,表示一位K進制
原创 FPTree算法筆記
FPTree算法筆記: FPTree算法引入一些數據結構來臨時的存儲數據 數據結構分爲三個部分 第一部分是一個項頭表:記錄所有1項頻繁項集出現的次數,按照次數降序排列 第二部分是FP Tree: 將原始數據映射到一顆FP樹。 第
原创 爬取貓眼TOP100的電影信息 urllib+mongdb
import pymongo import time import urllib.request import re print("開始") #鏈接數據庫 client=pymongo.MongoClient(host='localho
原创 數據倉庫在數據挖掘的數據模型
數據倉庫在數據挖掘的數據模型 數據倉庫的數據模型:星型模型、雪花模型、星型雪花型模型 數據倉庫的數據=事實數據+維度數據 星型架構:維度只會與事實表生成關係,維度與維度之間不會發生關係。 雪花型架構:可合併在一起使用的維度數據 星型
原创 數據挖掘流程
數據挖掘的定義: 1.從大量數據中發現非平凡的、先前不知道的、有價值規律的過程。 2.從大量數據中自動化的發現有價值規律的過程。 與傳統數據分析方法的區別: 數據源:數據量大、數據有噪聲、非結構化 CRISP-DM(Cross In
原创 數據倉庫技術的簡單闡述
數據倉庫技術的簡單闡述 數據倉庫定義: 數據倉庫是在企業管理和就決策中 1.面向主題的 2.集成的 3.與時間相關的 4.不可修改的數據集合 數據倉庫模型三層次 1.概念模型: 概念模型是對真實世界中問題域內的事物的描述
原创 關聯規則筆記
關聯規則筆記: 如記錄的集合D中有記錄A以及記錄B。記錄A推記錄B(關聯規則) 支持度:記錄A和記錄B同時出現佔總個數比例。 置信度:記錄A中出現記錄B的個數比例。 如果挖掘的關聯規則滿足最小的支持度閾值和最小置信度的閾值,則關聯
原创 Java中容器類的線程安全與否問題
非線程安全:ArrayList、LinkedList、HashMap、StringBuilder 線程安全:Vector、HashTable、StringBuffer 線程安全與否的區別 在10個線程中同時向一個容器中添加10個元素
原创 Java集合類的總結
集合類庫考慮到“容納自己對象”的問題,並將其分割成兩個明確的概念: 1:集合(Collection):一組單獨的元素。一個List(列表)必須按特定的順序容納元素,而一個Set(集)不可包含任何重複的元素。 2:映射(Map):一系列“鍵