原创 神經網絡高階技巧3--對層操作之add與concatenate以及keras的summary中[0][0]的解釋

本文標題較長,主要內容分爲兩部分。 一是說明對層操作的add與concatenate方法的原理與應用。 二是,在keras使用了這兩個方法後,在model.summary中會出現[0][0]的層,在此作出解釋。 一。關於add與c

原创 用lstm實現nlp情感分析(roman urdu小語種爲例)代碼+原理詳解

1 賽題描述 link: https://www.kesci.com/home/competition/5c77ab9c1ce0af002b55af86/content/1 本練習賽所用數據,是名爲「Roman Urdu Data

原创 如何使用glove,fasttext等詞庫進行word embedding?(代碼篇)

建議先看: 如何使用glove,fasttext等詞庫進行word embedding?(原理篇) 再看本篇。 先睹爲快:本文會用到的全部代碼: def get_coefs(word, *arr): return word

原创 關於調參

大牛們雲集分享思路: https://www.kaggle.com/c/santander-customer-transaction-prediction/discussion/89320#latest-524314

原创 sklearn中同一個模型fit多次不同數據會如何?and增量學習

忙裏偷閒~記錄一些筆記。 你多次fit,只會覆蓋。並不會記住以前fit的數據。 來自: https://stackoverflow.com/questions/49841324/what-does-calling-fit-mul

原创 關於target encoding與count encoding

1.target encoding 先整理一下鏈接,之後會看。 簡介入門: https://zhuanlan.zhihu.com/p/40231966 一個各種category 變量編碼的庫: https://github.com

原创 keras用auc做metrics以及早停

import tensorflow as tf from sklearn.metrics import roc_auc_score def auroc(y_true, y_pred): return tf.py_func

原创 利用CNN來做NLP(textcnn)

講到nlp,我們常用的都是lstm/gru。 舉個例子,因爲我們總會說,因爲句子經過embdding後,句子爲一個三維張量,假設爲:(None,20,300)。其中20爲timestep,也就是一個句子的單詞個數,300爲embd

原创 FM與FFM

請參見: https://blog.csdn.net/ddydavie/article/details/82667890

原创 關於HashVectorizer

寫在前面:HashVectorizer與tfidf類似,都是講文本向量化的表示方法,但它節省內存,也更快。當數據集較大時,可以作爲tfidf的替代。 from:https://www.cnblogs.com/pinard/p/6

原创 關於pickle的load,loads等

基礎知識: python自帶的file函數只能存儲和讀取字符串格式的數據. pickle可以存儲和讀取成其他格式比如list dict的數據, 來自:https://www.zhihu.com/question/38355589

原创 今日頭條2018 AI Camp筆試編程題——最小分割分數

代碼: #include <iostream> using namespace std; int max_ = 0; int sum = 0; int sum_temp = 0; int count_ = 0; //n is t

原创 用shap來選擇特徵

https://github.com/slundberg/shap

原创 Jigsaw Unintended Bias in Toxicity Classification競賽bilstm+glove embedding解法

0.寫在前面 0.1本文配套github: https://github.com/willinseu/kaggle-Jigsaw-Unintended-Bias-in-Toxicity-Classification-solution

原创 神經網絡高階技巧6--關於keras的class_weight與sample_weight

1.二者初步介紹 在keras的中文官方文檔中,寫到: 可以結合着一起看,出自:https://stackoverflow.com/questions/48315094/using-sample-weight-in-keras-fo