原创 SQL學習:mysql數據庫備份和使用日誌恢復+python調用mysql方法(4)

<span style="font-size:14px;">--EmpAndDept5 --主要關於更新表格、數據庫備份、日誌的開啓、刪除和通過python來調用mysql --將select的數據返回創建一個新表 create t

原创 關於C的指針,Java/Python的引用,形參與實參個人理解

最近稍微學習了下Go語言,Go語言真是大融合即視感,明明是靜態語言,卻結合了動態語言的諸多優點,寫起來感覺就像個動態語言,卻有着不輸給靜態語言的執行速度。略屌,可是現在應用還是比較窄,編程語言排行榜上前五十基本看不到他,囧。 然後Go裏面

原创 [閱讀] 偶爾一本經典書:by G. POLYA

        隨着學的越深,越發現影響一個人將來發展的東西其實一直都沒變:①對某個領域的先驗知識 ②個人的思維方式。         對某個領域的知識,隨着學習的深入,我們總能掌握它,當然,這是在不考慮難度的情況下,畢竟越深入的東西,需

原创 Spark 學習: spark 原理簡述與 shuffle 過程介紹

Spark學習: 簡述總結 Spark 是使用 scala 實現的基於內存計算的大數據開源集羣計算環境.提供了 java,scala, python,R 等語言的調用接口. Spark學習 簡述總結 引言 1 Hado

原创 [腦洞] 將機器學習運用到計算機儲存圖像上?

今天晚上在看圖像處理文獻的時候,突然腦洞了一下,我們在儲存圖像和顯示圖像的時候,都是基於抽象數據,也就是他的RGB值來的,所以在圖像識別的時候,我們還要特地將這種抽象數據識別成一種帶有某種特徵的“對象”,那如果從一開始我們在儲存圖像的時候

原创 機器學習:決策樹ID3\C4.5\CART\隨機森林總結及python上的實現 (2)

本文主要根據Mitchell的機器學習總結歸納,圖片大多來源於此,同時結合網上搜索到的資料和幾篇較新的文獻,自己寫的決策樹總結,當中的python算法摘自《集體智慧編程》,算法可在python2.7環境下運行。(本來想自己寫的。。可是不懂

原创 [總結]算法中的P問題、NP問題、NP完全問題和NP難問題

在討論算法的時候,常常會說到這個問題的求解是個P類問題,或者是NP難問題等等,於是我特地搜了這方面的資料,自己總結了下,估計研究算法的大家應該都知道,要是我總結的哪裏不對,歡迎一起探討~ 在講P類問題之前先介紹兩個個概念:多項式,時間複

原创 機器學習:介紹及分類 (1)

自己歸納下最近在學的機器學習的知識,主要來源於在coursera上聽的機器學習基石這門課,這門課是臺灣大學的林軒田老師開的,側重介紹了機器學習的原理,講述了什麼時候可以使用機器學習,爲什麼可以使用機器學習,機器可以怎麼學習,怎麼讓機器學的

原创 python學習:編碼中遇到的問題原因及解決方案

最近學python,2跟3版本的都有用到,兩者在編碼上還有點區別,特地查了點資料,自己歸納整理一下。可能會有點小錯誤,歡迎大家一起討論~ 一、首先明確一下幾大編碼格式: ASCII        #1個字符佔用1個字節 GBK    

原创 博客轉移-自搭博客啦

自己用django寫了個博客,歡迎大家關注我的新blog,嘿嘿 時隔好久沒寫博客了,趁着這次搭網站再開始繼續! blog: databatman blog

原创 SQL學習:SQLCookBook源代碼-mysql版本(2)

這裏更新2個~ <span style="font-size:14px;">--EmpAndDept2 --多表查詢 --需要思考的問題 --①通過什麼條件把兩張表聯繫起來 --顯示銷售部門地址和員工姓名 --如果兩張表都有相同名字

原创 [持續更新]總結與感悟:代碼與狼生

11.22 直接用 feature engineer + 防過擬合的模型暴力破解真的是。。。。太強了。。。。囧 11.10 迷茫的時候,看不清楚路的時候,不應當更着急的向前探尋新的路,相反更應該沉下心來,去看看踩過的腳印厚不厚實,畢竟欠

原创 SQL學習:SQLCookBook源代碼-mysql版本(3)

<span style="font-size:14px;">--EmpAndDept4 --主要關於表格的更復雜查詢(多表、多層)、視圖的創建 --複雜的多表查詢 --分爲查詢、子查詢、連接查詢 --簡單解釋如下: select

原创 Spark學習: Spark-Scala-IntelliJ開發環境搭建和編譯Jar包流程

       使用scala編寫spark腳本的話,可以直接在spark-shell中運行,如果要提交整個腳本的話,就必須將scala腳本編譯成Jar包,然後通過spark-submit 提交Jar包給spark集羣,當需要重複利用腳本的

原创 python學習:機器學習下的pybrain和多線程編程

最近實習需要用到這幾個庫,主要是用pybrain裏的神經網絡來做預測模型,而多線程編程的知識是我自己想學的,對於IO密集型的數據處理和保存來說,多線程的使用是必須的,所以我就把這兩者加入了學習計劃。先佔個坑,慢慢更新 我去。。還沒寫這個