原创 【ClickHouse】空值問題

目錄 1.建表時的空值問題 2.查詢時的空值問題 3.關聯問題        我們再ClickHouse環境下,SQL很多語法是和HIVE、Spark環境下不同的。以下從三個方面說明CK下空值的問題。 1.建表時的空值問題 如果我們建表時

原创 DataFrame系列3之Pandas.DataFrame操作表連接三種方式:merge, join, concat

目錄 1.concat  2.JOIN 3.merge         作爲DataFrame系列的第三部分,主要是對兩個DataFrame之間的關聯進行介紹。 以下面兩個DataFrame爲例進行語法的介紹: df_1 = pd.re

原创 【Python】Print的進階用法

        在Python中我們經常使用到Print操作,那麼,我們真的瞭解這個函數嘛?Print函數有很多種用法,如何優雅的使用print的呢? 本文,都針對該列表進行輸出,看下print的強大吧~ values=['a','b'

原创 【Python】DataFrame系列1之創建方法和其他數據類型list\array之間的轉換

        Python中最常用的數據形式莫過於DataFrame了,基本上每次使用多多少少都要百度一下,終於想起了寫一個DataFrame的系列文章,把DataFrame使用過的一些方法做一個系列文章,方便以後的查閱,也做一個分享。

原创 【Python】txt文件操作詳解

        在使用Python的過程中,需要對各種文件進行處理如excel、csv、txt等,這篇文章主要總結對txt文件的各種操作。  目錄 1.打開文件--open()方法 2.讀文件--read()方法 3.寫文件--write

原创 自然語言處理研究綜述

      自然語言是指漢語、英語、俄語等人們日常使用的語言,區別於人工語言,如程序設計的語言。       自然語言處理,是指用計算機對自然語言的形、音、 義等信息進行處理,即對字、詞、句、篇章的輸入、輸出、識別、分析、理解、生成等的操

原创 信息論之香農熵(又名信息熵)最簡單-形象講解

1948 年,香農提出了“信息熵”(shāng) 的概念,解決了對信息的量化度量問題。 首先,先介紹一下克勞德 • 香農(Claude Shannon, 1916-2001)         香農生於美國密歇根州,本科畢業於“美國大學之

原创 2020有感而作--寫給奮鬥的自己

      maybe這是一篇略顯矯情的博客~ 先來描述一下爲何會有這篇博文產生的原因吧☺最近由於工作需要,小白在學習NLP的路上,雖然之前有對NLP有過了解,這次在使用過程中,發現,自己的瞭解太過於片面,之前的學習也略顯浮躁,很多深層的

原创 【技能】Chrome擴展程序的使用

    對於所有工作的小夥伴而言,Chrome並不陌生,但是對於Chorme的功能,可能都停留在,工作中的search信息。小白最近發現了Chrome強大的擴展程序功能。     首先,Chrome擴展程序網址爲:chrome://ext

原创 Python詞性標註之詞性解釋

      小白在之前文章(https://blog.csdn.net/Jarry_cm/article/details/102903970)已經寫過jieba詞性標註的文章。在詞性標註後,看到一堆英文簡寫的詞性,怎樣一一對應又成了難題,

原创 Hive SQL 正則表達式進階二(regexp_extract函數進階使用)

       在之前文章中(文章如下),小白有講過正則的三個函數,替換、截取等操作。在工作中,又遇到了其他的問題,這裏做一個進階的講解文章,歡迎遇到類似問題的小夥伴一起學習交流。 初級用法參照下面的文章 Hive SQL 正則表達式進階一

原创 Python之global語句強調全局變量

     在一些特定場景中,我們會需要用全局變量,如下例子: 先創建一個函數f(x): def f(x): global a print(a) a = 10 print(a+x) 然後,執行下面語句

原创 Python之Iterator,Iterable的使用

       在Python中,我們很多時候是看一個數據的類型,一般用type函數,那麼如何看是否是迭代器或者迭代對象呢?這就要用到小白標題的函數了。        首先,加載這兩個函數: from collections.abc im

原创 Git學習之創建版本庫

    對於Git小白是試了一次又一次,每一次都要搜各種教程,由於不經常使用,還是經常忘記,於是決定將每次用到的一些操作命令記錄下來,也方便以後的查找,也做一個系列的分享。 首先,從百度圖片中盜個圖:        下面是GIT的流程圖,

原创 Git學習之遠程庫操作

       之前文章中小白講了本地倉庫和工作區之間的基本操作,這篇博客小白整了了一下遠程庫的一些操作。 首先,確認自己已經申請了GitHub且有了.ssh文件,由於小白之前已經都操作完了,這裏就不再重新來一遍,過程很簡單,可以任意百度,