原创 python常見面試題集錄(一)

題目:給定一組數字, 一組有9個數字(1到9),將這9個數字填寫到3*3 的九宮格內;使得橫,豎,斜對角一條線上的三個數字之和相等;如果無解則打印無解 思路:設定一個循環,依次將9個數分別填充到九宮格當中,再設置條件比較 程序如下: i

原创 python希爾排序、歸併排序

希爾排序,也稱遞減增量排序算法,是插入排序的一種更高效的改進版本。但希爾排序是非穩定排序算法。 希爾排序的基本思想是:先將整個待排序的記錄序列分割成爲若干子序列分別進行直接插入排序,待整個序列中的記錄"基本有序"時,再對全體記錄進行依次直

原创 python遞歸函數案例

1、月工資按天發放,第一天給你一分錢,然後,後一天是前一天的 2 倍,那麼30天后工資爲多少? 解題思路: 第一天 0.01 第二天 0.01 * 2 第三天 0.01 * 2^2 ... 第30天 0.01 * 2^29 代碼如下:

原创 python 二叉樹簡介

一、樹的定義 樹形結構是一類重要的非線性結構。樹形結構是結點之間有分支,並具有層次關係的結構。它非常類似於自然界中的樹。 樹的遞歸定義: 樹(Tree)是n(n≥0)個結點的有限集T,T爲空時稱爲空樹,否則它滿足如下兩個條件: (1)有且

原创 計算從2000年1月1日至今有多少個週一

import datetime day1 = datetime.date(2000,1,1).strftime('%w') #算出該日期是周幾 day2 = (datetime.date.today() - datetime.date(

原创 如何避免mysql庫中存入數據時出現重複的問題

首先我們在創建表時,需要設置一個字段爲唯一索引,也就是說該字段不可重複,首先我們都知道數據庫中的id不可重複,但是如 果我們將id設置爲唯一索引的話,id不會重複,但是無法保證id = 6對應的整條數據 和id =66 的整條數據不重複,

原创 採用生產者消費者模式爬取毛豆新車網

代碼如下 import requests import threading from queue import Queue import time from lxml import etree # 生產者線程 class Thread

原创 使用scrapy框架爬取數據並存到mongo數據庫

以爬取淘車網的二手車信息爲例,將車的信息爬取出來並存到MongoDB數據庫中 首先創建如圖所示的目錄: 進入當前目錄下命令行: 創建項目:scrapy startproject day0514 然後cd day0514  進入當前項目 創

原创 如何查找最長連續字符串

查找最長連續子字符串,子字符串須滿足:由連續同字符組成 # 統計結果:字符:連續出現最多的次數 result = {} # 統計連續出現的字符 def test(s): count = 0 for c in s:

原创 爬蟲------動態HTML處理

一、常見的反爬蟲技術 如果你在一個網站上看到了 jQuery,那麼採集這個網站數據的時候要格外小心。jQuery可 以動態地創建 HTML 內容,只有在 JavaScript 代碼執行之後纔會顯示。如果你用傳統的方法採集頁面內容,就只能獲

原创 爬取imdb資料庫

寫一個簡單的python爬蟲程序,爬取imdb資料庫,將爬取到的電影信息,存儲到一個excel表格中 因爲imdb資料庫電影網沒有反扒措施,直接爬取即可 代碼如下: import requests from lxml import et

原创 python解決排列組合的方式

本文轉載自https://blog.csdn.net/kongsuhongbaby/article/details/84330094 前言  排列組合問題在是算法中很基礎的一個問題,它們的區別就是,排列要考慮順序,組合不考慮順序。在面試的

原创 排序算法

十大排序可參照博客:https://blog.csdn.net/hellozhxy/article/details/79911867 十大算法對比: 冒泡排序: 冒泡排序是一種簡單的排序算法。它重複地走訪過要排序的數列,一次比較兩個元素

原创 樸素貝葉斯算法

利用樸素貝葉斯算法來對評價的好壞進行分類: 原始數據爲: 使用結巴分詞來進行分類預測: import jieba import pandas as pd import numpy as np # 文本分類 # 一.處理數據: # 第一