原创 Python_Leetcode_7_整數反轉

1.背景 Leetcode專欄目的:希望給學習算法的朋友提供一些想法,也希望有大佬能夠通過評論提供寶貴的意見。 Leetcode專欄方式:將展示實現代碼的多種實現方式,並且對算法複雜度進行比較。由於筆者偏好,代碼全部使用pytho

原创 Python_Leetcode_1_ 兩數之和

1.背景 Leetcode專欄目的:希望給學習算法的朋友提供一些想法,也希望有大佬能夠通過評論提供寶貴的意見。 Leetcode專欄方式:將展示實現代碼的多種實現方式,並且對算法複雜度進行比較。由於筆者偏好,代碼全部使用pytho

原创 Python_Leetcode_3_無重複字符的最長子串

1.背景 Leetcode專欄目的:希望給學習算法的朋友提供一些想法,也希望有大佬能夠通過評論提供寶貴的意見。 Leetcode專欄方式:將展示實現代碼的多種實現方式,並且對算法複雜度進行比較。由於筆者偏好,代碼全部使用pytho

原创 Python_文本分析_困惑度計算和一致性檢驗

在做LDA的過程中比較比較難的問題就是主題數的確定,下面介紹困惑度、一致性這兩種方法的實現。 其中的一些LDA的參數需要結合自己的實際進行設定 直接計算出的log_perplexity是負值,是困惑度經過對數去相反數得到的。

原创 Python_算法實現_(11)位運算

1. 位運算 1.1 code 下圖是python的位運算 1.2 實現 我們以,5(101)和 2(10)爲例輸出位運算結果 2. 用例 題目:寫下一個正整數的二進制數形式時,有多少位數爲1呢? 例如:99 = 0b1100

原创 Python_文本分析_TF-IDF

1. TF-IDF介紹 2. 計算邏輯 我這裏使用了一個簡單的數據集幫助大家理解TF-IDF的計算(如下)。數據集爲自定義的corpus,一共有四段文本,每一段都比較少來幫助理解計算邏輯。 import numpy as np i

原创 Python_文本分析_分詞

文本分詞的介紹網上已經很全面了,這裏主要介紹一種文本分詞、去停用詞的具體實現,停用詞表是對百度、哈工大等常見停用詞表融合後去重 import csv import datetime import re import pandas

原创 SQL_必知必會

原创 Python_文本分析_詞頻_TFIDF統計

下面這段代碼是用來計算文本的詞頻、TF-IDF值 import numpy as np import pandas as pd from sklearn.feature_extraction.text import TfidfT

原创 SQL_行轉列

1. 背景 在某個面試中做到了行轉列的筆試題,因爲無數據測試,當時寫的也不確定,所以創建了一個用例測試了一下。數據如下圖(比較簡單),要做的是得到一個新表,列分別是ID、math_score、english_score、pytho

原创 SQL_窗口函數

1.窗口函數與分析函數 看到一篇寫的很好的總結了,就把鏈接附上把,我們主要是結合一些題目看一下具體的用法(https://blog.csdn.net/scgaliguodong123_/article/details/601353

原创 SQL_日期操作

SQL日期操作 1. 日期加減天數量 date_sub(‘2016-2-2’, interval -1 day):在時間上減少一天,同樣後面單位可以跟年月日。 2. 不同日期格式比較 (TO_DAYS(targer_patient

原创 python_爬蟲_豆瓣TOP250_頁面內容

本文僅供學習使用,如有侵權,聯繫刪除 豆瓣TOP250書籍頁面內容如下,此次將爬取圖片中的內容 from bs4 import BeautifulSoup import lxml import requests import r

原创 Python_算法實現_(12)二叉搜索樹(BST)

1. 二叉搜索樹 二叉搜索樹(BST):如果一個二叉樹滿足:對於任意一個節點,其值不小於左子樹的任何節點,且不大於右子樹的任何節點(反之亦可),則爲二叉搜索樹。 BST 是一個很強大的數據結構。它允許在 O(log n) 時間內快

原创 蒙特卡洛模擬求正弦函數

1 介紹 蒙特卡羅法也稱統計模擬法、統計試驗法。是把概率現象作爲研究對象的數值模擬方法。是按抽樣調查法求取統計值來推定未知特性量的計算方法。 本次我們將使用蒙特卡洛模擬思想,結合python對下列正弦函數的面積值進行求解。根據微積