python3__pandas__预处理常用操作

原創

2020-07-04 07:18

1.pandas预处理的常用操作

链接的文章已经讲解的相对比较清楚了，包括：

（1）缺失值处理：dropna(),fillna()

（2）离散化：cut(),qcut()

（3）分组聚合：groupby()

（4）数据透视表：pivot_table()

（5）排序：sort_values()

https://blog.csdn.net/OYY_90/article/details/89114342?from=singlemessage&isappinstallend=0

2.个人补充内容

reindex

(index, method, fill_value, limit, level, copy, columns):重新索引函数（行索引）

index: 用作索引的新序列。（索引存在则保留，不存在则按照顺序创建，并以fill_value的值填充）

method: 插值的方式（pad/ffill:向前填充（原排列的最后一行）； bfill/backfill: 向后填充（原排列的第一行））

columns: 列索引

limit: 限制插值的行数（要求index必须是升序排列）

dropna

(how, axis, thresh, subset): 删除缺失值

subset: 参数subset移出指定列为空的所有行数据

duplicated

(columns, keep)：标识重复行

drop_duplicateds

(columns, keep): 删除重复行

columns: 列名

keep: 标识/删除的方式（keep=First: 标记/删除除第一行外的其他行； keep=last: 标记/删除除最后一行外的其他行； keep=False: 标记/删除所有行）

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

python3pandas预处理常用操作

目录

1.pandas预处理的常用操作

2.个人补充内容

再谈23种设计模式（3）：行为型模式（学习笔记）

Power Automate Desktop 安装完，登录后老是提示one driver 错误

微前端学习笔记(4):从微前端到微模块之EMP与hel-micro方案探索

微前端学习笔记（1）：微前端总体架构概述，从微服务发微

985 硕士程序员，空窗 4 个月没有 Offer！

一文搞懂 Spring 循环依赖

赛博斗地主——使用大语言模型扮演Agent智能体玩牌类游戏。

VScode右键打开(添加到右键)

记一次 .NET某工控视觉自动化系统卡死分析

WindowsServer--SQL Server搭建主从同步实现读写分离 - 事务性分发

機器學習 | 特徵工程 —— 降維：PCA（主成分分析）

認知物理學思維導圖

python3深度學習卷積神經網絡(CNN)：VGGNet / Finetuning

Google瀏覽器截圖方法

python3深度學習過擬合/欠擬合的處理

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結