原创 第一章—計算機網絡體系結構

1. 計算機網絡定義     計算機網絡是一個將分散的、具有獨立功能的計算機系統,通過通信設備與線路連接起來,由功能完善的軟件(網絡通信協議、信息交換方式、網絡操作系統)實現資源共享和信息傳遞的系統。簡言之,計算機網絡就是一些互連的、自治

原创 第三章—數據鏈路層

1. 數據組幀    (1)幀定界、幀同步、透明傳輸             幀定界:確定幀的邊界             幀同步:接受方應當能從接受到的二進制比特流中區分出幀的起始與終止。             透明傳輸:不管所傳數據

原创 第二章—物理層

1. 通信基礎 (1)基本概念:數據、信號、碼元、信源、信道、信宿、速率、波特、帶寬          數據:傳送信息的實體          信號:數據的電氣或電磁的表現          碼元:用一個固定時長的信號波形,表示一位K進制

原创 FPTree算法筆記

FPTree算法筆記: FPTree算法引入一些數據結構來臨時的存儲數據 數據結構分爲三個部分 第一部分是一個項頭表:記錄所有1項頻繁項集出現的次數,按照次數降序排列 第二部分是FP Tree: 將原始數據映射到一顆FP樹。 第

原创 爬取貓眼TOP100的電影信息 urllib+mongdb

import pymongo import time import urllib.request import re print("開始") #鏈接數據庫 client=pymongo.MongoClient(host='localho

原创 數據倉庫在數據挖掘的數據模型

數據倉庫在數據挖掘的數據模型 數據倉庫的數據模型:星型模型、雪花模型、星型雪花型模型 數據倉庫的數據=事實數據+維度數據 星型架構:維度只會與事實表生成關係,維度與維度之間不會發生關係。 雪花型架構:可合併在一起使用的維度數據 星型

原创 數據挖掘流程

數據挖掘的定義: 1.從大量數據中發現非平凡的、先前不知道的、有價值規律的過程。 2.從大量數據中自動化的發現有價值規律的過程。 與傳統數據分析方法的區別: 數據源:數據量大、數據有噪聲、非結構化 CRISP-DM(Cross In

原创 數據倉庫技術的簡單闡述

數據倉庫技術的簡單闡述 數據倉庫定義: 數據倉庫是在企業管理和就決策中 1.面向主題的 2.集成的 3.與時間相關的 4.不可修改的數據集合 數據倉庫模型三層次 1.概念模型: 概念模型是對真實世界中問題域內的事物的描述

原创 關聯規則筆記

關聯規則筆記: 如記錄的集合D中有記錄A以及記錄B。記錄A推記錄B(關聯規則) 支持度:記錄A和記錄B同時出現佔總個數比例。 置信度:記錄A中出現記錄B的個數比例。 如果挖掘的關聯規則滿足最小的支持度閾值和最小置信度的閾值,則關聯

原创 Java中容器類的線程安全與否問題

非線程安全:ArrayList、LinkedList、HashMap、StringBuilder 線程安全:Vector、HashTable、StringBuffer 線程安全與否的區別 在10個線程中同時向一個容器中添加10個元素

原创 Java集合類的總結

集合類庫考慮到“容納自己對象”的問題,並將其分割成兩個明確的概念: 1:集合(Collection):一組單獨的元素。一個List(列表)必須按特定的順序容納元素,而一個Set(集)不可包含任何重複的元素。 2:映射(Map):一系列“鍵