原创 3種不應放入數據庫中的東西

Images, files, and binary data 對於大的文件,文件系統比數據庫讀寫快 如果存入數據庫中,數據庫冷熱備份更消耗時間 存入數據庫中的話,範圍文件要穿越應用層和DB層 Ephemeral data 生命週期短的

原创 DBSCAN聚類算法

基於密度定義,我們將點分爲: 稠密區域內部的點(核心點) 稠密區域邊緣上的點(邊界點) 稀疏區域中的點(噪聲或背景點). DBSCAN算法的本質就是隨大流,邊界點緊緊圍繞着核心點,他們抱團,不帶噪點玩兒 小團體多了,聯繫比較密切的小

原创 kNN分類算法python實現

安裝python Matplotlib依賴於Python和NumPy,所以在unbuntu上安裝python的快捷方法就是直接安裝Matplotlib >sudo apt-get install python-matplotlib kNN

原创 oracle觸發器

類型 行級觸發器: FOR EACH ROW 影響的每一行都會執行觸發器 語句級出發器 默認的模式,一句話才執行一次觸發器 觸發器不能嵌套,不能含有事務控制語句 何時觸發 Before:條件運行前 After:條件運行後 I

原创 排序

內排序 插入排序 直接插入排序 將數組A中元素A[i]插入到已有序子序列A[0] , A[1] , … A[i-1]中 1.比較 查找A[i]在A[0] , A[1] , … A[i-1]中的位置pos 2.移位 將A[pos]

原创 Django入門

研究生考試告一段落了,可以踏踏實實地學點技術了。實話說,學過的東西雖然很多,但也很雜,不成體系,並沒有什麼特別擅長的,出去找工作什麼的太沒有競爭力。 這裏記錄一下入門過程 參考資料: 主要:Growth系列 參考:Django簡易流程

原创 Matlab 概率分佈

概述 區別 對於離散型隨機變量 X F(x)=P{X<=x}爲其分佈函數,自變量x P{X=x}爲離散型隨機變量的概率分佈,或者分佈(規)律 對於連續型隨機變量 X F(x)=P{X<=x}爲其分佈函數 ,自變量x 單獨考察P{

原创 C/C++筆記

數組指針與指針數組 數組指針 a pointer to an array 指針數組 array of pointers 二者區別 int(*a)[4] 數組指針 表示 : 指向數組a的指針 元素表示 : (*a)[i] 取數組a的小

原创 k均值聚類算法

算法描述 輸入:簇的數目k和包含n個對象的數據庫。 輸出:k個簇,使平方誤差準則最小。 算法步驟: 1.爲每個聚類確定一個初始聚類中心,這樣就有K 個初始聚類中心。 2.將樣本集中的樣本按照最小距離原則分配到最鄰近聚類

原创 Oracle將數據庫從非歸檔模式修改爲自動歸檔模式

查看數據庫的現行日誌和自動歸檔模式的設置 sys@ORCL> archive log list; 數據庫日誌模式 非存檔模式 自動存檔 禁用 存檔終點 USE_DB_R

原创 Oracle查看錶或者視圖的定義語句

查看當前用戶有什麼表或者視圖 select * from tab;  查看錶的定義 select dbms_metadata.get_ddl('TABLE','T1') from dual; 查看視圖的定義語句 select dbms_m

原创 oracle函數與存儲過程

首先是常用的查詢 查看當前用戶創建的所有函數,存儲過程,觸發器 select distinct name,type from all_source where owner='HR'; 函數 函數是有名稱的pl/sql塊 函數有返回值

原创 層次聚類算法

算法描述 輸入:包含n個對象的數據集 輸出:簇的分層結構 算法步驟: 計算鄰近度矩陣 每個點作爲一個簇 Repeat 合併最接近的兩個簇 更新鄰近度矩陣 Until 僅剩下一個簇 特點 如果兩個類被合併,那麼將不能被恢

原创 PL/SQL

hello world sys@ORCL> edit 已寫入 file afiedt.buf 1 declare 2 var_name varchar2(30); 3 var_id number; 4 begin

原创 Oracle常用查詢

sysdba身份登錄 sqlplus sys/***密碼* as sysdba; 查看所有用戶默認表空間 select username,default_tablespace from dba_users; 查看當前用戶所有的表名和視圖