原创 Bert模型的學習之路

      在Bert模型的學習中,遇到了以下一些不錯的資料,雖然走了很多彎路,這裏總結一下比較好的學習歷程吧,需要花一點時間閱讀。首先是對NLP中語言模型的一個發展歷程的一個介紹: 理論模型學習: 1、從Word Embedding到B

原创 在Python中通過spark訪問hbase(單機版)

1、單機環境安裝 (1)Jdk的安裝,這個是後續環境安裝的基礎 (2)Hadoop的安裝,這個是使用hbase的前提 (3)安裝hbase,這個得找教程自己採坑了 (4)安裝spark 2、Python中第三方包的安裝 (1)thrift

原创 spark學習資源總結

1、Spark 中文文檔目錄彙總:(主要是RDD的一些操作)     https://zhuanlan.zhihu.com/p/32758333 2、Spark Streaming:大規模流式數據處理的新貴     https://www

原创 Bert多GPU訓練參考(轉載)

bert多GPU訓練https://blog.csdn.net/woshiliulei0/article/details/103971652 Linux機器:bert-tensorflow調多GPU https://blog

原创 python字符串中包含的數字、字母的判斷

  今天在做分詞的時候,由於既有漢字,又有其他的字符,但是能用到的只有漢字部分,所以就想說有沒有什麼辦法能判斷一個字符串是否是純中文的,就在網上找了一下方法,找到了一篇比較詳細的判斷字符串類型的博文, 原文地址如下:https://blo

原创 pyspark datafram 在group(即window)中進行行間運算

1、Calculate difference between value in current row and value in first row per group - pyspark https://stackoverflow.co

原创 推薦算法學習(轉載)

詳細解讀Youtube推薦算法:https://blog.csdn.net/Zhangbei_/article/details/85647887 深入解讀Airbnb推薦算法:https://blog.csdn.net/Zh

原创 linux啓動vnc server

在Windows下安裝了VNC之後,第一次連接到相應的linux服務器時,需要啓動linux上相應的服務,下面是啓動步驟: 1、對於普通用戶而言,以下兩個步驟就可以了 [root@localhost /]#su ceboy    #ce

原创 python中如何給dict的values設置默認值

之前一直都是先給一個dict的key一個默認值,然後再進行操作,最近看代碼,無意間發現還有一個很高效的做法,於是就查了一下,以供自己學習吧。 這個比較高效的用法就是collections.defaultdict(list()) 解

原创 知識圖譜學習(轉載)

社交圖譜好友關係分析:https://blog.csdn.net/superman_xxx/article/details/88920586 如何構建行業知識圖譜 (以醫療行業爲例):https://blog.csdn.ne

原创 GCN學習(轉載)

GCN的學習如下: Convolutional Neural Networks on Graphs with Fast Localized Spectral Filtering論文解讀( and code): https://

原创 pip或者conda install 下載包太慢的問題(轉載)

因爲pip install是訪問的國外服務器,所以很慢,如果換成國內的一些鏡像,馬上從kb/s加速爲MB/s,實測有效。 1、清華的鏡像 pip install XXX -i https://pypi.tuna.tsinghua.edu.

原创 轉載——docker踩坑記

以下全文來自騰訊雲的大佬的docker踩坑記,因爲自己用Windows版的docker遇到了各種坑,幾乎是走一步就是一個坑,搜到了下面這篇文章,感覺很齊全 原文地址是:https://cloud.tencent.com/developer

原创 python pandas 讀取postgresql中的數據

import psycopg2 import pandas as pd # postgres config postgres_host = "" # 數據庫地址

原创 python pandas讀取postgresql數據

import psycopg2 import pandas as pd postgres_host = "" postgres_port = "5432" postgres_user = "" post