pandas 满足多条件的行的某列求和

原創

Power of the sea

2020-06-14 20:39

import numpy as np
import pandas as pd
import csv
import random
# train_msg = pd.read_csv('../../txCTR/train_msg.csv')
# train_msg = train_msg.sort_values(by='user_id', ascending=True) # 按照特定列排序，如果没有重新赋值，原数据不会改变
# train_msg_train = train_msg[train_msg.user_id <= 100000] # 按照单单个条件选择行
# train_msg_test = train_msg[train_msg.user_id > 100000]
# train_msg_train.to_csv('../../txCTR/train_msg_train.csv',index=False,sep=',')
# train_msg_test.to_csv('../../txCTR/train_msg_test.csv',index=False,sep=',')

#下面一段代码
# simulation = pd.read_csv('../../txCTR/test/try/simulation.csv')
# simulation = simulation[(simulation.user_id == 1) & (simulation.industry == 1) & (simulation.category == 2)] #里面（）不能丢
# print(simulation)
# times = simulation['click_times'].sum()
# print(times)

# 下面这几行代码极其高效地统计了各性别、年龄以及industry上面的分布，统计各类gender、age、industry组合出现的次数
# train_msg = pd.read_csv('../../txCTR/train_msg.csv')
# # train_msg = train_msg.sort_values(by='user_id', ascending=True)
# count = train_msg.groupby(['gender', 'age', 'industry']).size().reset_index(name="Time") # 此处如果不为统计列重命名，
# # 则保存的csv文件只有最后一列，且没有列标题
# print(count)
# count.to_csv("../../txCTR/statistics/try/industry/gender_age_industry_count.csv", index=False, sep=',')

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

安装Auto-GPT

安裝 Python 3.8 或更高版本 https://phoenixnap.com/kb/how-to-install-python-3-ubuntu # 查看是否已經安裝了python python --version #更新包 sud

2024-05-12 22:43:51

云效 Pipeline as Code 来了！这些场景，用好它效率翻倍！

從可視化編排到支持 YAML 編排雲效流水線 Flow 是開箱即用的企業級持續集成和持續交付工具，支持豐富的代碼源、構建、自動化測試工具、多種部署類型和部署方式，與阿里雲深度集成，還提供多種企業級特性，助力企業高效完成從開發到上線 CIC

2024-05-11 21:15:05

通义灵码企业版正式发布，满足企业私域知识检索、数据合规、统一管理等需求

5 月 9 日阿里雲 AI 峯會，阿里雲智能集團首席技術官周靖人宣佈，通義靈碼企業版正式發佈，滿足企業用戶的定製化需求，幫助企業提升研發效率。通義靈碼是國內用戶規模第一的智能編碼助手，基於 SOTA 水準的通義千問代碼模型 Code-Qw

2024-05-11 21:15:01

用Python写的udp聊天器

說明在一個電腦中編寫1個程序，有2個功能 1.獲取鍵盤數據，並將其發送給對方 2.接收數據並顯示並且功能數據進行選擇以上的2個功能調用要求實現上述程序參考代碼 import socket def s

2024-05-11 12:30:57

Linux系统中的文件和目录权限

一、文件屬性下文中，“文件”一詞默認代指廣義的數據類型，跟“目錄”等詞對比使用時，則專指普通文件（File）這一特定數據類型。 Linux系統中，我們可以使用命令“ls -al”來查看當前目錄

2024-05-11 01:45:47

手把手系列！使用 Zilliz Cloud 和 AWS Bedrock 搭建 RAG 应用

檢索增強生成（Retrieval Augemented Generation, RAG）是一種 AI 框架，它通過結合信息檢索和自然語言處理（NLP）能力從而增強文本生成。具體而言，RAG 系統中的語言模型通過一種檢索機制查詢和搜索知識庫

2024-05-10 21:29:43

详解Python 中可视化数据分析工作流程

本文分享自華爲雲社區《Python 可視化數據分析從數據獲取到洞見發現的全面指南》，作者：檸檬味擁抱。在數據科學和分析的領域中，可視化是一種強大的工具，能夠幫助我們理解數據、發現模式，並得出洞見。Python 提供了豐富的庫和工具，使得可

2024-05-10 11:30:09

Apache DolphinScheduler 4月简报：社区发展与技术革新速递

各位熱愛 DolphinScheduler 的小夥伴們，4 月份的 DolphinScheduler 社區月報更新啦！這裏將記錄 DolphinScheduler 社區每月的重要更新，歡迎關注！月度 Merge 之星感謝以下小夥伴 4

2024-05-08 21:19:32

华为云开发者桌面全新发布CodeArts IDE for Python，极致优雅云原生开发体验

本文分享自華爲雲社區《華爲雲發佈CodeArts IDE for Python，極致優雅雲原生開發體驗》，作者：華爲雲頭條。近日，華爲雲正式發佈CodeArts IDE for Python，這是一款內置華爲自主創新的Python語

2024-05-08 10:34:25

Python 爬虫：Spring Boot 反爬虫的成功案例

前言在當今數字化時代，網絡數據成爲了信息獲取和分析的重要來源之一。然而，隨着網絡數據的廣泛應用，爬蟲技術也逐漸成爲了互聯網行業的熱門話題。爬蟲技術的應用不僅可以幫助企業獲取有價值的信息，還可以用於數據分析、市場研究等領域。然而，隨着爬

2024-05-07 23:26:04

开发者分享：利用 EMQX Cloud 与 ESP32 微控制器实现智能液冷散热系统

作者：陶德坤，EMQX Cloud 開發者。作爲一名後端開發人員，我經常需要同時運行多個 Jetbrains IDE （集成開發環境），所以經常面臨筆記本電腦過熱問題。我曾嘗試過各種散熱方法，從傳統的風扇到更先進的半導體冷卻系統，但這些

2024-05-07 21:55:53

我们团队来了一位新同事，主动要求帮忙敲代码！欢迎 AI 001号

通義靈碼｜7X24的AI智能編程助手工號：AI001 他叫通義靈碼，一個硅基生命。出生在0101星球，沒有性別，但有人格類型。他是INTJ，建築師型人格，艾薩克·牛頓和甘道夫同款。他會寫一點代碼，但不如我們會得多。我看了下他的簡歷，

2024-05-07 21:12:06

频繁FullGC线上问题排查

一、問題近期頻繁收到關於FullGC的告警二、基礎知識介紹 2.1 Java內存結構目前系統使用的是ParNewGC、CMS垃圾回收，此時的1.8JDK內存模型如下：注意大對象可以直接放到老年代中，可以通過-XX:Pretenur

2024-05-06 23:55:18

我在下载模块的时候下不下来出现这种情况是什么意思？

大家好，我是Python進階者。一、前言前幾天在Python白銀交流羣【無敵劈叉小狗】問了一個Python庫下載失敗的問題。問題如下：我在下載模塊的時候下不下來出現這種情況是什麼意思？二、實現過程這裏【莫生氣】給了一個指導：執行那

2024-05-06 21:49:13

[oeasy]python0015_键盘改造_将esc和capslock对调_hjkl_移动_双手正位

鍵盤改造 🥋 回憶上次內容上次練習了複製粘貼按鍵作用 <kb

2024-05-06 11:45:36

24小時熱門文章

Python 潮流周刊#50：我最喜欢的 Python 3.13 新特性！

最新文章

最新評論文章