原创 Macbook系統環境安裝wget的2個方法 - 傳統包及Homebrew安裝

考慮到自身項目的拓展需要,朋友建議學習Python爬蟲這樣對於做大數據採集有較大的幫助,老蔣雖然每天也都接觸一些腳本和程序的修改,但是並沒有專業和系統的學習某一項編程。所以還是準備陸續的學習Python語言,無論有沒有基礎,只要花點時間應

原创 NLP 神經網絡訓練慎用 Adam 優化器

https://www.jianshu.com/p/48e71b72ca67 NLP 神經網絡訓練慎用 Adam 優化器 theoqian關注 12019.02.10 16:01:45字數 499閱讀 1,168     AllenNL

原创 Spark優化那些事(4)-關於spark.driver.maxResultSize的疑惑

  今天遇到了spark.driver.maxResultSize的異常,通過增大該值解決了,但是其運行機制不是很明白,先記錄在這裏,希望後面有機會可以明白背後的機制。 該異常會報如下的異常信息: Job aborted due to s

原创 float16 matmul is way slower than float32 matmul on CPU

float16 matmul is way slower than float32 matmul on CPU #24738  Open dchatterjee172 opened this issue on 7 Jan 2019 · 1

原创 損失函數softmax_cross_entropy、binary_cross_entropy、sigmoid_cross_entropy之間的區別與聯繫

cross_entropy-----交叉熵是深度學習中常用的一個概念,一般用來求目標與預測值之間的差距。 在介紹softmax_cross_entropy,binary_cross_entropy、sigmoid_cross_entrop

原创 GCN源代碼註釋的解釋,源碼,解讀

GCN源代碼註釋的解釋,源碼,解讀 1. utils.py import numpy as np import pickle as pkl import networkx as nx import scipy.sparse as sp

原创 GCN圖卷積 utils.py腳本

GCN圖卷積 utils.py腳本 把帶#註釋掉的部分取消,打印一些數據,就能理解GCN是怎麼處理數據的,也有助於將自己的數據轉變成與它類似的形式。 import numpy as np import pickle as pkl imp

原创 如何取出 tf.layers.dense 定義的全連接層的weight和bias參數值

[原創] 如何取出 tf.layers.dense 定義的全連接層的weight和bias參數值 TensorFlow版本:1.14.0 Python版本:3.6.8 在TensorFlow中,tf.layers.dense 定義了一個全

原创 深入理解graphx中的pregel圖計算引擎

深入理解graphx中的pregel圖計算引擎 一、graphx中的屬性 (1)頂點(vertex),頂點包含(id,頂點內容)兩部分,其中頂點內容可以是對象或者元組形式 對象形式:User("name", 12) 元組形式:("na

原创 Spark連續特徵轉化成離散特徵

Spark連續特徵轉化成離散特徵 當數據量很大的時候,分類任務通常使用【離散特徵+LR】集成【連續特徵+xgboost】,如果把連續特徵加入到LR、決策樹中,容易造成overfit。 如果想用上連續型特徵,使用集成學習集成多種算法是一種方

原创 torque集羣

https://cndaqiang.github.io/2018/01/11/torque-install-centos/ https://blog.csdn.net/jideljd_2010/article/details/465751

原创 湯姆森採樣

原文鏈接:https://toutiao.io/posts/584etm/preview https://toutiao.io/posts/584etm/preview

原创 UML類圖符號 各種關係說明以及舉例

原文鏈接:https://www.cnblogs.com/duanxz/archive/2012/06/13/2547801.html UML中描述對象和類之間相互關係的方式包括:依賴(Depe

原创 Embedding 在Airbnb房源排序中的應用 (KDD2018 best paper)

https://www.jianshu.com/p/971651773b42

原创 美團“猜你喜歡”深度學習排序模型實踐

引言 推薦作爲解決信息過載和挖掘用戶潛在需求的技術手段,在美團點評這樣業務豐富的生活服務電子商務平臺,發揮着重要的作用。在美團App裏,首頁的“猜你喜歡”、運營區、酒店旅遊推薦等重要的業務場景,都是推薦的用武之地。 圖1 美團首頁“猜你