原创 weka之如何利用kmeans算法分析數據的聚類效果

聚類算法之k-means算法的數據集分析: 1. K均值聚類的步驟: K均值算法首先隨機的指定K個簇中心。然後: 1)將每個實例分配到距它最近的簇中心,得到K個簇; 2)計分別計算各簇中所有實例的均值,把它們作爲各簇新的簇中心。重複1)和

原创 關於sql中的規範化理論

1NF:列字段不可再分,即屬性的原子性 2NF:主鍵的一部分(比如組合主鍵)不能決定其他非鍵字段,即消除部分依賴 3NF:表中非鍵字段不能確定非鍵字段,即消除傳遞依賴 BCNF:非鍵字段不能確定主鍵的一部分 4NF:全鍵表(所有字

原创 Petri網之XML文件設計代碼(傳入一個矩陣生成Petri網)

 XML文件之Petri文件結構 Petri網XML文件結構圖: Petri網中XML根結點爲net,其屬性有id、type,其子結點有四個,分別爲token,place,transition,arc。具體結構圖如下: 1)根結點下有4個

原创 Hive基本所有的application狀態一直處於ACCPETED狀態

最近早上來發現hive集羣調度平臺所有的任務都處於ACCPETED狀態,之前以爲是集羣的原因,重啓了之後感覺好了,結果第二天來還是同樣的情況,排查了情況沒看到報錯信息,倒是看到了如下關鍵日誌: not starting applicati

原创 數據倉庫-shell腳本實現hive hdfs文件上傳到目標ftp

總的來說就是一行一行的linux命令,組裝起來就變成一個腳本了!   #!/bin/bash cd /web/data/file/tmpjf rm -rf bm_jingfeng_export_zte_login_d_{Date_N

原创 Hive之自定義函數UDF使用&實現時間段轉小時批次demo

目錄 0.需求來源 1.創建maven項目 2.上傳jar包到hdfs上 3.創建函數 4.使用函數 0.需求來源 最近,接到這麼一個需求,需要統計用戶在一天中的各個時間段(比如02:00-09:00點)的電影播放時長,評估了一下需求,使

原创 關於apache不能啓動的問題

出現這個問題,基本都是80端口被佔用了的原因,樓樓已經不是第一次遇到這個問題了, 估計衆多網友也經常遇到吧  在這裏寫一篇博客說說我的解決辦法: 首先,找到你的apache安裝的文件夾,然後找到conf文件夾--》打開  --》 選中h

原创 DOM

1.DOM 是什麼? document-object-model: 文檔對象模型的縮寫 ,其實就是一套應用程序接口。 2.DOM用來幹什麼? 用來訪問和操作HTML、XHTML、XML等文檔,現在基本所有的瀏覽器都支持W3C協議發佈的D

原创 關於結構體裏面的字符串指針輸出出現亂碼的問題與結構體數組作爲參數傳值的問題

首先,結構體裏面的字符串指針輸出出現亂碼的問題: 相信很多遇到過這種問題的人都跟我一樣寫過這樣的代碼(好吧,或許不一樣。。。): #include<stdio.h> #include<string.h> typedef struct{

原创 c語言中的自增運算和指針的優先級問題

阿彌陀佛,工作以後又回來補這些知識了,果然時間久了就容易忘,記錄在這裏以後好翻閱: 首先來看看一個比較簡單的自增運算的例子: a=i++; b=++i; 相信這個大家都比較清楚吧 對於 a來說,先賦值i的值給a,然後i自己加1; 對於b來

原创 二.面向對象的三大特性,封裝、繼承、多態

2.1 java裏的封裝 1.封裝的概念 將類的信息隱藏在類內部,不允許外部程序直接訪問,而是通過該類提供的方法來實現對隱藏信息的操作和訪問 2.封裝的好處 只能通過規定的方法訪問數據,隱藏類的實現細節,方便修改和實現 3.封裝的實現步驟

原创 java中的類

1.2 java中的類 1.類在java中的重要性 類是java程序的組織單元 2.類的組成 屬性和方法 3.屬性和方法如何聲明 修飾符+返回類型+方法名/屬性名 1.3 java中對象的使用 1.創建對象 類名 對象名=new 類名()

原创 Java基礎之類與對象

1.1 關於類和對象 1.對象是什麼 萬物皆對象,任何客觀存在的事物都可以叫做對象  2.面向對象是什麼 顧名思義,我們關注對象,我們對所有客觀事物的關注 3.類是什麼 類是對象的類型,是具有相同屬性和方法的一組對象的集合 4.類和對象的