原创 Google資深工程師推薦Python面試必須要看的15個問題

引言想找一份Python開發工作嗎?那你很可能得證明自己知道如何使用Python。下面這些問題涉及了與Python相關的許多技能,問題的關注點主要是語言本身,不是某個特定的包或模塊。每一個問題都可以擴充爲一個教程,如果可能的話。某些問題甚至

原创 Python中的urllib.request模塊

因爲在玩Python challenge的時候,有用過這個模塊,而且學習這個模塊之後也對系統學習網絡爬蟲有用。當時查了各種資料學習,沒有碰官網文檔(因爲還是對英語有抗拒性),但是還是官方的文檔最具權威和學習價值,因此想要此次翻譯官方文檔的同

原创 平均年薪70萬?剛剛,這類程序員又漲薪了

據全球最大職業社交網站LinkedIn發佈的《全球人工智能領域人才報告》,人工智能領域的人才需求在過去3年間增長了8倍。國內互聯網三巨頭BAT、科大訊飛等科技公司正在積極佈局人工智能領域,大量招募AI高端人才,那麼,2018年的AI開發者薪

原创 機器學習之FP-growth頻繁項集算法

FP-growth算法項目背景/目的對於廣告投放而言,好的關聯會一定程度上提高用戶的點擊以及後續的諮詢成單 對於產品而言,關聯分析也是提高產品轉化的重要手段,也是大多商家都在做的事情,尤其是電商平臺 曾經我用SPSS Modeler做過Ap

原创 機器學習之優雅落地線性迴歸法

在統計學中,線性迴歸(Linear regression)是利用稱爲線性迴歸方程的最小二乘函數對一個或多個自變量和因變量之間關係進行建模的一種迴歸分析維基百科。簡單線性迴歸當只有一個自變量的時候,成爲簡單線性迴歸。簡單線性迴歸模型的思路爲了

原创 機器學習實現雙十一購物清單的自動商品標籤歸類

背景雙十一購物狂歡節馬上又要到來了,最近各種關於雙十一的爆品購物列表在網上層出不窮。如果是網購老司機,一定清楚通常一件商品會有很多維度的標籤來展示,比如一個鞋子,它的商品描述可能會是這樣的“韓都少女英倫風繫帶馬丁靴女磨砂真皮厚底休閒短靴”。

原创 如何優雅的落地一個分佈式爬蟲:實戰篇

本篇文章將從實戰角度來介紹如何構建一個穩健的分佈式微博爬蟲。這裏我沒敢談高效,抓過微博數據的同學應該都知道微博的反爬蟲能力,也知道微博數據抓取的瓶頸在哪裏。我在知乎上看過一些同學的說法,把微博的數據抓取難度簡單化了,我只能說,那是你太nai

原创 初學Python,利用生成器函數,n個從1開始的階乘

寫一個生成器函數myfactorial(n),此函數用來生成n個從1開始的階乘 def myfactorial(n): s = 1 for x in range(1, n + 1): s *= x

原创 python爬取美團信息數據,人生第一個爬蟲程序

#!/usr/bin/env python #-- coding:utf-8 -- import requests import re import json import time import random from reques

原创 一個6年Python程序員的工作感悟,送給還在迷茫的你

每一個開發者,都有一段不願提起的經歷,很多年前,剛剛從大學畢業的時候,很多公司來校招。其中最爛俗的一個面試問題是:“你希望你之後三到五年的發展是什麼?”。我當時的標準回答是(原話):“成爲在某一方面能夠獨當一面的技術專家“。後來經歷了幾家不

原创 手把手教你將一箇舊的大型項目遷移到 Python 3

一年半前,我們就決定使用 Python 3 了。我們已經討論了很長時間,現在是時候使用了!現在這個過程已經結束了,我們已經把生產環境的最後部署都遷移到了 Python 3整個代碼庫大約有 240 k 行,不包括空行和註解。這是一個基於 We

原创 百度T7架構師透析Python對象你需要知道這些

1. Python對象Python使用對象模型來存儲數據。構造任何類型的值都是一個對象。所有的Python對象都擁有三個特性:身份,類型和值。身份:每一個對象都有一個唯一的身份標識自己,任何對象的身份可以使用內建函數 id() 來得到。這個

原创 Python中的urllib.request模塊

因爲在玩Python challenge的時候,有用過這個模塊,而且學習這個模塊之後也對系統學習網絡爬蟲有用。當時查了各種資料學習,沒有碰官網文檔(因爲還是對英語有抗拒性),但是還是官方的文檔最具權威和學習價值,因此想要此次翻譯官方文檔的同