原创 鵝廠2020暑期實習第二次二面

居然沒有手撕代碼題~~~~ 面試官非常nice。只聊了半個小時。估計是他後面有事情。 一、前幾個問題感覺完全是hr面。 爲啥想回國? 有無讀碩的打算? 二、關於項目和算法的看法 3. 講自己寫過的項目。 大一在深圳實習的項目,

原创 鵝廠2020暑期實習第一次一面

投遞的後臺研發崗位。 早上6:30的遠程面試。我提前了12分鐘進會議系統,然後面試官已經在了。直接開始。 上來先自我介紹。介紹到一半講到了一個比較偏向於數據分析的項目。然後面試官就問我有不有後臺研發的項目。2. 講了自己之前大一

原创 java面試 內存中堆和棧的區別

java中的內存,分爲兩種,一爲堆內存,二爲棧內存。 棧內存 在函數中定義的基本類型的變量和對象的引用變量都是在函數的棧內存中分配。 當在一段代碼塊中聲明瞭一個變量時,java就會在棧內存中爲這個變量分配內存空間,當超過變量的作用域之後,

原创 CS領域劃分

Theoretics computational complexity information theory  automata theory System operating system network computer archit

原创 RNN和LSMT

RNN 具有循環的網絡,允許信息持續存在。一個循環神經網絡可以被認爲是同一個網絡的多個副本,每一個都傳遞一個消息給後繼者。即先前的信息對之後的判斷仍會提供幫助。 所有循環神經網絡都具有神經網絡的重複模塊鏈的形式。 在標準的RNN中,該重複

原创 新手探索NLP(一)

目錄 基礎知識模塊 1. 概念 2. 正則化表達 Data Cleaning模塊 3. 去掉標點 4. 切分詞功能 5. 去掉停止詞 6. Stemming & Lemmatizing stemming lemmatizing 兩者的異同

原创 新手探索NLP(二)

ML CLassifier模塊 沿用上一篇的例子。此處的問題是垃圾郵件的分類,監督學習。 1. Random Forest + KFold import nltk import pandas as pd import re from s

原创 Github多人合作用法

目錄 一.克隆對方倉庫 二.與倉庫建立連接 三.創建自己的分支 四.修改本地代碼後提交 五.請求合併 六.錯誤回滾和刪除文件 就是篇Github的個人筆記。以防自己以後忘記。 場景:多人協作,需要互相push。 一.克隆對方倉庫 在對方的

原创 軟件工程師技術面試一面真題

20190807 BlackRock技術面試一面 SDE實習 遠程 不限時間  如無特殊說明,必須使用Java進行解答。 本人給出的答案是自己的回答,並不是最優解。歡迎博友討論,並指出可以優化之處。 1. 倒序排列給定字符串中的字母和數字

原创 python爬蟲個人小結

如題,直接上代碼,代碼中有部分註釋。 對以文字爲主的頁面進行抓取 正則式的文章之前已經寫過很多次了,別人的博客也介紹了很多,不再贅述。 #encoding:utf-8 import urllib.request as ur #代理服務

原创 新手探索NLP(九)——文本摘要

轉載自知乎https://zhuanlan.zhihu.com/p/67078700   文本摘要是一種從一個或多個信息源中抽取關鍵信息的方法,它幫助用戶節省了大量時間,用戶可以從摘要獲取到文本的所有關鍵信息點而無需閱讀整個文檔。 文本摘

原创 新手探索NLP(七)——情感分析

簡介 文本情感分析(sentiment analysis),又稱爲意見挖掘,是對帶有情感色彩的主觀性文本進行分析、處理、歸納和推理的過程。其中,主觀情感可以是他們的判斷或者評價,他們的情緒狀態,或者有意傳遞的情感信息。因此,情感分析的一個

原创 新手探索NLP(八)——序列標註

轉載自知乎https://zhuanlan.zhihu.com/p/50184092 NLP中的序列標註問題(隱馬爾可夫HMM與條件隨機場CRF) Introduction 序列標註問題(sequence labeling, also n

原创 新手探索NLP(三)

目錄 NLP語言模型 詞的表示方法類型 1、詞的獨熱表示one-hot representation 簡介 不足 2. 詞的分佈式表示distributed representation          簡介 建模類型 語言模型 Wor

原创 python文件打開方式詳解

轉載自https://blog.csdn.net/ztf312/article/details/47259805 第一步 排除文件打開方式錯誤: r只讀,r+讀寫,不創建 w新建只寫,w+新建讀寫,二者都會將文件內容清零 (以