原创 文本挖掘-詞的發現
最近開始關注一些數據挖掘的東東,大概瞭解了一下文本挖掘中詞發現的方法,呃,原來是介個樣子滴。。。 一. 對“疑似詞”需要計算下列數值 (1)出現頻度; (2)凝固度; 即,字組合在一起的概率有多大。 例如:
原创 前端優化技術
1.前端負載均衡 通過DNS的負載均衡器(一般在路由器上根據路由的負載重定向)可以把用戶的訪問均勻地分散在多個Web服務器上。 兩種常用的負載均衡方法: A. RR-DNS(Round-Robin Domain Name
原创 Centos 6.5 final 安裝 xtrabackup 2.2.11 小記
(1)下載xtrabackup wget https://www.percona.com/downloads/XtraBackup/Percona-XtraBackup-2.2.11/binary/redhat/6/x86_64/perc
原创 mysql語句執行超時設置
對於 Saas 系統來說,設置語句執行超時時間是必要的,原因有二: (1)避免一些有性能問題的語句長時間執行佔用大量資源,影響其他用戶的使用; (2)避免請求都被中斷了服務端還在長時間的執行SQL語句,無謂的消耗資源; 有兩種方式來設
原创 pt-online-schema-change 參數 critical-load 的使用
由於使用了 Tokudb 引擎的分區表,修改單表時,open數都會超1k。併發pt修改加上觸發的analyze操作,會導致open file 超限。因此,希望通過設置 critical-load 參數,當 TOKUDB_DB_OPEN_C
原创 如何讓WMI進程獨立固定端口
問題介紹 最近在學習Powershell的取證,涉及到了WMI(Window Management Instrumentation)服務的監控。這個服務通常情況下是和一些其他的服務一塊兒宿主到svchost的netsvcs進程中。查看該服
原创 解決 Redis Desktop Manager 黑屏問題
遠程服務器,安裝 Redis Desktop Manager,運行後發現黑屏。 解決: (1)修改服務器的RDP配置 管理工具-》遠程桌面服務-》遠程桌面會話主機配置-》RDP-TCP-》屬性-》客戶端設置-》顏色深度-》限制最大顏
原创 SSD及其在數據庫中的應用 (三)服務器SSD的選型
一. 企業級 vs 消費級 選擇在服務器上使用的SSD,首先面臨的選擇是,用企業級還是消費級的SSD? 企業級的SSD在價格上,是消費級SSD的10~20倍。他們的不同體現在下面的幾點: (1)Wafer取用部位的不同(可
原创 SQLServer分頁功能性能優化
1. 基礎數據 RtlBill行數: 54754 RtlDetail行數:4723291 如果不分頁,結果集行數:198 2. 常用的分頁方式:用 With + Row_Number
原创 下載文件時的中文文件名問題(asp.net)
1. IE 使用:URL編碼之後的UTF-8文件名 FileName = System.Web.HttpUtility.UrlEncode(FileName, System.Text.Encoding.UTF8);
原创 MySQL的Update語句Set順序問題
1. 測試一 create table test(id int, tag int, num int); insert into test (id, tag, num) values(1, 1, 1), (2,2, 2), (3,3,3
原创 SSD定期做Secure Erase
SSD有很好的隨機讀性能,越來越多的開發機使用消費級的SSD做系統盤。但由於SSD存儲單元的可擦寫次數有限及錯誤診斷策略的影響,也會出現一些意想不到的狀況。 前段時間,一同事的SSD掛了,BOIS都無法識別。雖然子在保固期
原创 網絡設備丟棄ECN包導致的慢響應問題
客戶反映,接口訪問不定期的會出現慢響應的情況,單個請求,耗時近10s。 用 WireShark 抓包並過濾本地端口,單個訪問流: 包序列解析: (1)No.9813:第一個包是 [SYN, ECN, CwR] 包,說明啓用了 ECN,發
原创 SSD及其在數據庫中的應用 (四)SQLServer中的應用
一. 首先,回顧一下 SSD 的讀寫特性 (1)有限次數寫; (2)隨機讀性能最好; (3)順序讀性能好; (4)順序寫性能差; (5)隨機寫性能最差。 從存儲上來
原创 SSD及其在數據庫中的應用 (一)技術介紹
1. SSD卡內部結構 爲什麼SSD比傳統的HDD快很多? 首先,它沒有尋道等機械操作的時間,另外一個重要因素,是因爲,NAND芯片之間是並行的讀寫。 這也就是爲什麼麼,同一系列的SSD,容量更大的讀寫速度更快