原创 Linux下Python腳本與Shell腳本的使用區別

摘自:https://www.zhihu.com/question/30548640/answer/49161020 可以參看Google code style(https://google-styleguide.googlecode.c

原创 流水錶與拉鍊表區分;增量表,快照表與全量表區分

參考博客: https://www.cnblogs.com/wqbin/p/10223988.html https://blog.csdn.net/sheep8521/article/details/89187601 https://bl

原创 圖基礎

深度優先,廣度優先,dijkstra最短路徑問題。 注:返回相應路徑代碼仍未魯邦。 package com.interview.graph; import java.util.ArrayList; import java.util.Li

原创 邏輯迴歸求解

注意點: 一般來講,更多的迭代次數會使損失下降的更多。 隨機梯度下降更快,但是我們相應的爲了獲得相應的結果需要迭代的次數也需要更多,所以還是用batch的比較合適!!! 注意要對數據進行打亂(shuffer)。 邏輯迴歸LR的特徵爲什

原创 Python常用小結

a = []#list,各元素可不同 a[-1]#最後一個元素 a.append('Adam') a.insert(1, 'Jack') a.pop()#刪除末尾元素,可指定位置 a = () #tuple和list非常類似(用法也

原创 GBDT與XGBOOT

總結:https://blog.csdn.net/legendavid/article/details/78904353 GBDT 1. Boosting的最大好處在於,每一步的殘差計算其實變相地增大了分錯instance的權重,而已經分

原创 林子雨hive實踐教程錯誤筆記

1.注意最後要加上這一句話,沒有這句話,就會報錯。 alter database hive set dbproperties('edited-by'='hadoop');#爲hive設置鍵值對屬性 hive-site.xml的正確配置方

原创 seq2seq相關資料加重點總結

RNN/LSTM RNN TO LSTM:  https://www.cnblogs.com/jiangxinyang/p/9362922.html 1.U,W,V這三個矩陣就是我們的模型的線性關係參數,它在整個RNN網絡中是共享的。也正

原创 各類衡量指標總結

MAE(Mean Absolute Error) 平均絕對誤差   基礎的評估方法,後面的方法一般以此爲參考對比優劣。 MSE(Mean Square Error) 平均平方差 對比MAE,MSE可以放大預測偏差較大的值,可以比較不同預測

原创 Pandas常用總結

1.ix & iloc &loc https://blog.csdn.net/hecongqing/article/details/61927615

原创 java 兩個大數相乘

  分析見原博客,代碼整理(註釋加說明)如下: https://blog.csdn.net/outsanding/article/details/79472376 package com.interview.algorithm; pu

原创 TopK算法總結

1.topK總結https://mp.weixin.qq.com/s/FFsvWXiaZK96PtUg-mmtEw 2.優先級隊列求解topK import java.util.PriorityQueue; public class

原创 判斷括號是否合法

package com.interview.algorithm; import java.util.HashMap; import java.util.Map; import java.util.Stack; public clas

原创 樹基礎

包含樹的深度優先遍歷(遞歸、非遞歸),廣度優先遍歷,先序遍歷(遞歸、非遞歸),中序遍歷(遞歸、非遞歸),後序遍歷(遞歸、非遞歸)。 二叉樹的四種遍歷方式分別是:先序、中序、後序和層次。 它們的時間複雜度都是O(n),因爲它們只訪問每個節點

原创 數組

1.兩個數組,求交集。用Hash表。 package com.interview.array; import java.util.*; /** * 求數組交集 */ public class ArrayIntersection