台部落(๑• . •๑)框

上一節我們講了數據清晰的內容，通過清晰我們保留了正常的數據，在處理特徵預處理內容之前，我們先要確定標註，反應目的的屬性就是標註，其他有關係的特徵

2020-07-08 02:07:20

特徵選擇可以在特徵變化之前，也可以在之後，本章是根據統計學模型、機器學習模型進行相關度排序,相關度差的進行刪除（最終實現降維度）特徵選擇需要重複做，需要模型去驗證，最終獲得能獲得更好模型的數據特徵選擇三個切入思路，第一個

2020-07-08 02:07:20

#處理異常值 import numpy as np import pandas as pd df = pd.DataFrame({"A":["a0","a1","a1","a2","a3","a4"],"B":["b0","b1"

2020-07-08 02:07:20

from PIL import Image import numpy as np a=np.asarray(Image.open("G:/timg.jpg").convert("L")).astype("float") depth

2020-06-19 08:40:38

import requests class R(object): def __init__(self): url="http://www.baidu.com" header = {

2020-06-19 07:22:43

import urllib.requests def proxy_user(): proxy_list=[#自己去網上搜免費的或者是付費的 {"http":"183.154.55.162:9999"}, {"http":

2020-06-19 07:22:43

import re one = 'abc 123' patter = re.compile(' ') result = patter.split(one) print(result) #從頭開始匹配 patter = re.co

2020-06-19 07:22:43

import requests import re import json class BookSpider(object): def __init__(self): kw="博士" s

2020-06-19 07:22:43

from bs4 import BeautifulSoup import requests url="https://www.douban.com/?p=1" headers = { "User-Agen

2020-06-19 07:22:43

import requests import json from pyecharts import Map from lxml import etree class S: def __init__(self):

2020-06-19 07:22:43

import requests from lxml import etree url = "https://news.baidu.com" headers = { "User-Agent":"Opera/9.80 (

2020-06-19 07:22:43

貪婪和非貪婪 import re #貪婪模式 #非貪婪 one = "meesdfgfnsdekkn" two ='2.5' pattern = re.compile('m(.*)n') pattern1 = re.compile

2020-06-19 07:22:43

urllib入門 mport urllib.request #向指定的url地址發送請求，並返回服務器響應的類文件對象 response = urllib.request.urlopen("http://www.baidu.com

2020-06-19 07:22:43

我們知道即使我們把header換成某個瀏覽器，但是一直用這個瀏覽器訪問，也會被認定位爬蟲，所以要及時更換瀏覽器 import urllib.request import random def load_baidu(): url=

2020-06-19 07:22:43

import time import scrapy from scrapy import Request class MobileSpider(scrapy.Spider): name = 'mobile'

2020-06-19 07:22:43