原创 讀書分享:《數學之美》中的一些關鍵名詞

最近兩週在拜讀吳軍的《數學之美》,對NLP中的一些“道”瞭解了一下,感受到了數學的強大,其中有一些名詞很有代表性,特此記錄,以免遺忘。 注:本文中大部分內容都摘自《數學之美》,特此說明! 一、隱含馬爾可夫模型 實際應用:語音識別

原创 Pandas等庫在Anaconda環境下打包巨大的解決方法

我的python是使用anaconda集成包的,雖然很方便,但是之前寫的很多程序,因爲pandas、openpyxl等庫通過pyinstaller打包會出現很多奇葩問題,而且即使打包出來也會很大(有pandas的情況下大概200+

原创 Pandas:用Python做日報(重構)

之前的日報是通過Python+VBA+Power BI三者結合做出來的,有人提出來是否可以全部用Python來實現。 理論上是可以實現的,但是結合在一起會比較累,而且Power Query雖然用起來會有點卡,但是可視化拖曳操作真心

原创 中國電信目前的一些雲產品

前言:學習中國電信雲產品的基本概念。 一、計算 產品名稱 縮寫 英文全稱 說明 彈性雲主機 ECS Elastic Cloud Server 是一種可隨時獲取、彈性可擴展的計算服務。雲主機由 CPU、內存、鏡像、雲硬

原创 Python:3個常用數據檢驗代碼實現

常規庫導入 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import warnings

原创 Python:通過編虐娃數學題,學習多線程技術

前言: 最近因大家都知道的原因,只能在家自學,之前打印的數學考卷存貨不多了,所以想在電腦上編一個來代替之前的數學考卷版本《Python:大班數學自動生成器》。 想了2個版本:第一個是利用pyqt5來做個GUI版本,但是苦於對GUI

原创 Python:從文章內提取地址

前言: 如何從文章內提取地址?方法有很多種,我這邊提一個我的思路。 1、整理一份標準地址庫,至少包括以下幾列:省、市、鎮、街道、路。 有人會說整理很難,沒錯,很難找到成熟的地址庫(這種都是能賣Q的),通過政府官網可以獲得的數據也僅

原创 Python:提取word中關鍵內容並導出到其它word和excel表格中

一、前言 新部門接到一個新需求,要求根據以前的會議紀要,提取相關信息(如下圖所示) 包括了會議名稱、時間、地點、主持人、出席人員、列席人員、缺席人員、會議內容、彙報人、列席人等等,然後要生成兩樣東西: 1、會議通知 右下角是會

原创 Pandas:寫了一個簡易的銷量異常檢測器

前言:由於清單較多,除了判斷文件大小是否變大外(而且只能判斷是不是更新了),無法獲知數據是否有異常,必須每天手動打開,清單一多費時費力(比如我現在每天就有9個清單),所以就想編一個程序來自動判斷數據是否異常。 異常的判定原則是:

原创 Python:14個常用數據清洗代碼

常用庫導入 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import warnings

原创 VBA:快速把另一個工作簿裏的列值根據列名填充進來

前言:之前在使用工作簿與工作簿之間的數據連接時,使用的是vlookup手動做鏈接,然後斷開連接並另存爲的方式,雖然做好一次後很方便,但是每次變動需求要修改的話都好累。比如我這裏有36個,也就是相當於要做36次vlookup! 所以

原创 電信網絡知識中的一些中英文簡稱對應表

前言: 電信網絡知識中,有很多專業術語和簡稱,往往看的一臉懵逼,特此整理! 序號 簡稱 全稱 中文名 說明 1 TDM Time-division multiplexing 時分複用 將提供給整個信道傳輸信息的時間劃

原创 Python:快速裁剪PDF頁面

前言 收到一份很大的pdf文檔,想根據頁數快速裁剪,但是沒找到能夠免費試用的軟件(不是要vip就是要充值),所以就用Python的PyPDF2這個庫。 主要參考了https://blog.csdn.net/xingxtao/art

原创 VBA:根據某個單元格的值,判斷在另一個單元格內是否有並標紅

前言:最近在做一個地址標準化的競賽,裏面包括了地址提取、分詞、清洗、匹配等一系列動作,等這次競賽結束後會專門寫一篇文章分享源碼。 之所以要做標題的事情,是因爲用了這麼多年的Excel,還是習慣Excel的界面,而且因爲這次初賽數據

原创 經驗分享:數據分析的五個階段

前言        數據分析,也被稱爲營銷分析、經營分析等,就是通過一定的工具、算法,結合業務邏輯將數據背後的真正原因找出來,爲企業的發展方向提供數據支撐。在這個越來越對數據重視的時代,數據分析的價值也在迅速提升。在大部分部門,尤