非监督学习——特征缩放

原創

2019-05-03 09:23

特征缩放：

1、一种重缩放此类特征的方法。

2、公式： ${x}' = \frac{x - x_{min}}{x_{max} - x_{min}}, {x}'\in [0,1]$

3、要思考的问题：如果 x_max 和 x_min 相同怎么办？例如，假设输入特征的列表是 [10, 10, 10]——分母将为零。我们的建议是通常为每个新特征指定 0.5（0.0 和 1.0 中间），但这实际上由你自己决定。要点是，这个公式可能会有问题。

4、使用 RBF 核函数的 SVM和K-均值聚类机器学习算法会受到特征缩放的影响

5、https://scikit-learn.org/stable/modules/preprocessing.html

>>> from sklearn import preprocessing
>>> import numpy as np
>>> X_train = np.array([[ 1., -1.,  2.],
...                     [ 2.,  0.,  0.],
...                     [ 0.,  1., -1.]])
...
>>> min_max_scaler = preprocessing.MinMaxScaler()
>>> X_train_minmax = min_max_scaler.fit_transform(X_train)
>>> X_train_minmax
array([[0.5       , 0.        , 1.        ],
       [1.        , 0.5       , 0.33333333],
       [0.        , 1.        , 0.        ]])

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

解密Prompt系列31. LLM Agent之从经验中不断学习的智能体

Agent智能體的工作流可以簡單分成兩種：一種是固定的靜態工作流，一種是智能體自主決策的動態工作流。靜態流程的Agent舉幾個例子，例如新聞熱點追蹤推送Agent，每日新論文摘要總結Agent，它們的優點是可控，穩定，可復現，缺點是一種流

風雨中的小七

2024-06-11 14:22:16

第十二节：MySQL8.x版本新特性和变化

一. 二. 三. ! 作者 : Yaopengfei(姚鵬飛) 博客地址 : http://www.cnblogs.com

2024-06-11 14:21:36

杭州的 IT 崩盘了么？

大家好，我是R哥。今天分享一個爽飛了的面試輔導 case：這個杭州兄弟空窗期 1 個月+，面試了 6 家公司 0 Offer，不知道問題出在哪，難道是杭州的 IT 崩盤了麼？報名面試輔導後，經過一個多月的輔導打磨，現在成功入職某上市

2024-06-11 14:21:26

Azure Virtual Network (22) 多订阅使用Azure DNS解析问题 Windows Azure Platform 系列文章目录

　　《Windows Azure Platform 系列文章目錄》　　部署環境：　　1.我們只有1個訂閱，1個Virtual Network 　　2.我們有1個Hub-VNet, 在Virtual Network上設置了DNS Se

Lei Zhang的博客

2024-06-11 14:20:36

VS2022 解决方案打不开 .NET Framework 4.0 、 4.5 等老项目

vs2022開發工具最低支持net4.8，以下的如net3.5、4.0、4.5項目，加載不上怎麼處理。一、下載.NET Framework框架 .NET Framework 4.5.2 .NET Framework 4.5.1 .NET

鄭州-在路上

2024-06-11 14:20:26

Python 潮流周刊#55：分享 9 个高质量的技术类信息源！

大家好，我是貓哥，今天給大家分享幾個高質量的技術類信息源。本文分享的信息源都是週刊類型的，所謂週刊類，就是以固定每週的頻率更新，每期分享很多精華內容的鏈接。它的特點是信息密度極高，可以節省你去查找信息的時間，高效的學習者都會喜歡這類內容。

豌豆花下貓

2024-06-11 14:19:16

统计vertica表的行数

select anchor_table_schema || '.' || anchor_table_name as table_name, row_countfrom PROJECTION_STORAGEorder by row_co

卡卡西村長

2024-06-11 14:19:16

开源高性能结构化日志模块NanoLog

最近在寫數據庫程序，需要一個高性能的結構化日誌記錄組件，簡單研究了一下Microsoft.Extensions.Logging和Serilog，還是決定重造一個輪子。一、使用方法直接參考以下示例代碼: NanoLogger.St

2024-06-11 14:18:16

Vue3 运行可以，build 打包发布报错，app.config.globalProperties 用法坑

目錄錯誤原因解決方案 app.config.globalProperties 用法坑Vue，多環境配置 https://www.cnblogs.com/vipsoft/p/16696640.html main.js import conf

2024-06-11 14:15:15

Vue 打包 Error: error:0308010C:digital envelope routines::unsupported

這個錯誤通常與Node.js的加密模塊和OpenSSL版本有關出現這個錯誤是因爲 node.js V17版本中最近發佈的OpenSSL3.0, 而OpenSSL3.0對允許算法和密鑰大小增加了嚴格的限制，可能會對生態系統造成一些影響. j

2024-06-11 14:15:05

Windows 允许空密码远程桌面

Windows 允許空密碼遠程桌面開啓遠程修改策略輸入命令 secpol.msc 本地策略 -> 安全選項 -> 帳戶：使用空密碼的本地帳戶只允許進行控制檯登錄

2024-06-11 14:15:05

dubbo~全局异常拦截器的使用与设计缺陷~续

上一次的介紹，主要圍繞如何統一去捕獲異常，以及爲每一種異常添加自己的Mapper實現，並且我們知道，當在ExceptionMapper中返回非200的Response，不支持application/json的響應類型，而是寫死的text/p

2024-06-11 14:12:35

如何安全地访问互联网

當你深夜在瀏覽器中輸入 www.baidu.com 時有沒有想過，除了月黑風高的夜和本機的瀏覽記錄，還有誰知道你訪問了它呢？要搞清楚這件事，首先我們要了解一下訪問網站時，這其中發生了什麼。如果你在 10 年之前訪問網站，大概率會在瀏覽器的

2024-06-11 14:08:15

前端使用 Konva 实现可视化设计器（14）- 折线 - 最优路径应用【代码篇】

話接上回《前端使用 Konva 實現可視化設計器（13）- 折線 - 最優路徑應用【思路篇】》，這一章繼續說說相關的代碼如何構思的，如何一步步構建數據模型可供 AStar 算法進行路徑規劃，最終畫出節點之間的連接折線。請大家動動小手，給

2024-06-11 14:08:05

[快速阅读七] Halcon里emphasize函数相关资料.

　　時不時有人問我我的SSE優化Demo裏emphasize（邊緣強調）的原理是啥，有沒有寫博客，其實不是我不願意寫博客，而是那個東西太過於簡單，我不想寫博客。但是耐不住問的人多了，我就乾脆複製點資料放在博客裏吧，省的每次我還要去找點資料複

2024-06-11 14:08:05

24小時熱門文章

最新文章

最新評論文章