台部落木尧大兄弟

一、解釋一下詞袋和文本離散表示？文本表示分爲離散表示和分佈式表示。離散表示的代表就是詞袋模型，one-hot、TF-IDF、n-gram都可以看作是詞袋模型的詞向量表示方法。去重後扔進字典裏，沒有順序可言。句子的one-hot編碼：如

2020-06-19 19:16:43

需求：這裏可能是一行，可能是兩行，需要其y方向靠近底部對齊解決：設置其所在div的height，修改當前css屬性 display:flex;align-items:flex-end;

2020-06-19 19:16:43

1.安裝 pip install apscheduler 2.使用 from apscheduler.schedulers.blocking import BlockingScheduler from datetime import

2020-06-19 13:16:35

2020-06-19 10:50:37

幾個CNN/DM數據集的地址：【萬x之源】最初版本的CNN/DM：https://cs.nyu.edu/~kcho/DMQA/ 作者兄弟用來創造非匿名數據集的代碼：https://github.com/abisee/cnn-dailym

2020-06-19 10:50:36

2020-06-19 10:50:36

一、TF-IDF TF = 某詞在文檔中出現的次數 / 文檔的總詞數 IDF = log_e ( 語料庫中文檔總數 / 包含該詞的文檔數+1 ) 優點：簡單快速不足：沒考慮單詞的位置和語義信息；生僻詞的IDF值會過高；重要

2020-06-19 10:50:36

概述：前言爲需要優化的原因，正文爲梯度下降/隨機梯度下降/小批量隨機梯度下降/動量法/AdaGrad和RMSProp算法/AdaDelta算法/Adam算法。前言：需要優化的原因（局部最小值和鞍點）： x=x- η ▽f(x) ：學

2020-06-19 10:50:36

本來想使用安裝淘寶的鏡像結果給安崩了，modules/npm不見了於是就各種搜，都說重裝... 幾經折騰，終於探索出了一個不用重裝的方法：找到nodejs安裝包，Repair！大功告成！於是就換了一種換鏡像源的方法：

2020-06-19 10:50:36

import smtplib from email.mime.text import MIMEText # 創建郵件 # 郵箱，郵件 # smtp服務器：smtp.163.com # 端口： 25 # 郵箱賬號：email@163

2020-06-19 10:50:35

一、啥是激活函數？爲啥用激活函數？常用的有哪些？啥是激活函數？激活函數是上層節點的輸出和下層節點的輸入之間的一個非線性函數關係。爲啥用激活函數？要是不用激活函數，不管多少層的神經網絡說白了都是些線性變換的疊加，網絡的逼近能力有限，所以

2020-06-19 10:50:35

安裝scrapy pip install scrapy cmd執行scrapy和scrapy bench驗證安裝原理 engine是引擎，核心大腦 spiders寫爬蟲邏輯，提取數據(item)或者請求，請求交給調度器，數據交給

2020-06-19 10:50:35

論文：https://arxiv.org/pdf/1906.04466.pdf 源碼：https://github.com/hongwang600/Summarization 摘要：現存摘要抽取模型大都用交叉熵損失（刻畫兩個概率分佈的距

2020-06-16 11:37:57

一、命名實體識別（NER）是生成模型還判別模型？主流模型？是生成模型：P(x|y)，訓練過程根據tag預測token；而判別模型P(y|x)與之相反基於LM的主流模型：BERT/LSTM+CRF 概率圖模型：HMM 二、何爲HMM？

2020-06-16 11:37:57

1.準備工作安裝transformers，並下載以下文件： vocab文件：https://s3.amazonaws.com/models.huggingface.co/bert/roberta-large-vocab.json me

2020-06-16 11:37:57