原创 基於tfidf 以及 lsi 的文本相似度分析

本文主要爲了計算文檔之間的相似度。標準語聊爲我們訓練模型所需的,用戶語料則用來測試與標準語聊的相似度 1、 數據預處理部分,見註釋 對標準語聊進行處理如下 ws = open('d:/sentence.csv','r',enco

原创 python 實現劍指offer系列3:從尾到頭打印鏈表

newcoder:https://www.nowcoder.com/practice/d0267f7f55b3412ba93bd35cfa8e8035?tpId=13&tqId=11156&tPage=1&rp=1&ru=%2Ft

原创 wmd 源碼 python實現版

from gensim.models import Word2Vec from gensim import corpora, models, similarities import numpy as np import scipy

原创 python劍指offer系列二叉樹中和爲某一值的路徑

題目:輸入一顆二叉樹和一個整數,打印出二叉樹中結點值的和爲輸入整數的所有路徑。路徑定義爲從樹的根結點開始往下一直到葉結點所經過的結點形成一條路徑。思路:其實就是深度優先遍歷,到達葉子結點時判斷target是否爲零,注意每次遞歸一輪時需要回

原创 基於增量的矩陣聚類

from gensim.models import word2vec import jieba import numpy as np import re from zhon.hanzi import punctuation imp

原创 tensorflow實戰2:實現mnist 單層cnn分類

1、數據處理 import tensorflow as tf import numpy as np import matplotlib.pyplot as plt from tensorflow.examples.tutorial

原创 如何用詞向量做文本分類(embedding+cnn)

1、數據簡介 本文使用的數據集是著名的”20 Newsgroup dataset”。該數據集共有20種新聞文本數據,我們將實現對該數據集的文本分類任務。數據集的說明和下載請參考(http://www.cs.cmu.edu/afs/

原创 python劍指offer系列滑動窗口的最大值

給定一個數組和滑動窗口的大小,找出所有滑動窗口裏數值的最大值。例如,如果輸入數組{2,3,4,2,6,2,5,1}及滑動窗口的大小3,那麼一共存在6個滑動窗口,他們的最大值分別爲{4,4,6,6,6,5};針對數組{2,3,4,2,6,2

原创 準確率 召回率 ROC曲線的大解析

近來面試算法、機器學習崗,發現面試官經常問的就是準確率召回率之間的關係,以及roc曲線如何畫,這裏自己總結了一波做了一波解析。 對於一個二分類的問題來看,可以用下表來表示整個結果,其中1代表正例,0代表負例 接下來我們一個一個

原创 python 劍指offer系列:反轉鏈表

題目:輸入一個鏈表,反轉鏈表後,輸出鏈表的所有元素。 代碼: # -*- coding:utf-8 -*- # class ListNode: # def __init__(self, x): # self

原创 python實現劍指offer系列:重建二叉樹

題目:輸入某二叉樹的前序遍歷和中序遍歷的結果,請重建出該二叉樹。假設輸入的前序遍歷和中序遍歷的結果中都不含重複的數字。例如輸入前序遍歷序列{1,2,4,7,3,5,6,8}和中序遍歷序列{4,7,2,1,5,3,8,6},則重建二

原创 如何利用神經網絡做迴歸問題(全連接以及一維卷積)

源碼、留給自己看的 博客地址:http://blog.csdn.net/shizhengxin123/article/details/76147022 1、全連接 迴歸 from keras.layers import Inp

原创 詞向量轉換成句向量的文本相似度計算

# coding: utf-8 # In[2]: ###讀取已訓練好的詞向量 from gensim.models import word2vec w2v=word2vec.Word2Vec.load('d:/chat_dat

原创 tensorflow實戰1:lstm實現mnist分類

版本:tensorflow1.0.0 1、數據格式 lstm輸入維度(batchsize,timestep,input_size) 則將mnist維度轉換(-1,28,28),這裏面意思就是每一行輸入28個數據進入神經網絡。

原创 python劍指offer系列斐波那契數列

大家都知道斐波那契數列,現在要求輸入一個整數n,請你輸出斐波那契數列的第n項。 n<=39 網址:https://www.nowcoder.com/practice/c6c7742f5ba7442aada113136ddea0c