【團隊效率提升】Python-PyWebIO介紹

作者：京東零售關鍵

Q&A快速瞭解PyWebIO

Q：首先，什麼是PyWebIO？

A：PyWebIO提供了一系列命令式的交互函數，能夠讓咱們用只用Python就可以編寫 Web 應用, 不需要編寫前端頁面和後端接口, 讓簡易的UI開發效率大大提高（本人非研發，用詞可能不妥，大家輕點噴）

Q：其次，我們能用來幹嘛？？這對一個團隊的效率提升有什麼作用？？

A：Pywebio的作用在於讓咱們可以快速的開發一個帶有UI界面的，支持用戶輸入的，以既定的邏輯輸出結果的應用。那麼，我們是不是可以將團隊內一些機械性的數據處理，數據異動分析等的工作以既定邏輯的方式通過Pywebio輸出一個可複用的應用給大家使用呢？當然，日常的數據運營過程中，咱們肯定不是面對着一成不變的case。那麼，我們是不是可以用不同參數輸入的方式來達到一定的泛用性拓展呢？只要，case和case之間的底層邏輯是一致的，我們就可以用同一套邏輯，不同的入參來達到不同結果輸出的獲取。

Exampl 倘若，我們每天都有一項工作，每天對着一份又一份業務反饋的訂單，然後部門需要對着這些訂單本身進行一個初步的風險分層，我們是不是可以把風險分層的底層規則寫在後端，然後通過PywebIO來支持不同情況下的不同規則閾值輸入，快速獲取咱們所需要的風險分層結果。（當然，如果數據允許，直接寫SQL也可以，可是，SQL需要一定的門檻，而PywebIO則可以通過UI的方式分享給那些沒有技術背景的運營人員進行0代碼使用。）

以下正式開始用一個例子來逐步介紹PywebIO拓展包

簡介

虛擬背景：每天需要一份又一份地對業務反饋的樣本來進行風險分層，爲了提高處理效率。

計劃方案：通過現有風險標籤的波爾標籤，非波爾標籤體系來搭建一個支持靈活配置閾值來快速獲取分層結果的UI應用。

方案簡介：基本邏輯如下，（以下均爲舉例所示，並不代表該方案就可以進行風險分層哈，大家請注意）

開始實現：這裏的例子採取的是非數據庫模式，支持的是上傳本地csv，然後進行閾值配置。

Step one：本地文件上傳

首先，肯定是得先文件上傳的代碼。

##例子如下：
import pandas as pd
from pywebio.input import *
from pywebio import start_server
from pywebio.output import *
import nest_asyncio
import numpy as np
import os
import time

nest_asyncio.apply()

import pandas as pd
from pywebio.input import *
from pywebio import start_server
from pywebio.output import *
import nest_asyncio
import numpy as np
import os
import time

nest_asyncio.apply()

def read_csv():
    put_markdown('# 只支持pin') 
    put_markdown('功能如下：')
    put_markdown("""
- 選擇與程序再**同一文件夾**的文件
- 輸入你希望卡的風險值閾值 **不輸入則默認-10**
- 自動加載解析輸出極黑標籤佔比以及明細數據
- 請勾選你所需要的標籤**（不勾選=全選）**，然後點擊提交即可
    """)

    file = file_upload('只支持上傳該程序所在文件夾的csv文件哦', '.csv')

    ## 本地文件
    
    raw_data = pd.read_csv(os.getcwd() + "\" + file['filename'], encoding='gbk')
    put_html(raw_data.to_html())
    
if __name__ == '__main__':

    start_server(read_csv, port=8081, debug=True, cdn=False, auto_open_webbrowser=True)

允許代碼後，因爲” auto_open_webbrowser=True“，所以自動彈出一個WebUI，如下左圖，選擇上傳的文件，即可看到下右圖的文件數據

👉

Step two：風險值卡控

第一步也只是上傳文件，展示文件，還沒達到咱們的目的。所以，第二步則是需要對上傳的csv本身進行數據處理，邏輯判斷。這裏其實很好理解，在step one 中已經獲取了上傳的文件且轉成dataframe了對吧，那麼實際，咱們只需要沿用咱們熟悉的pandans對dataframe進行處理即可。

import pandas as pd
from pywebio.input import *
from pywebio import start_server
from pywebio.output import *
import nest_asyncio
import numpy as np
import os
import time

nest_asyncio.apply()

def 配置規則_風險值閾值(df, user_risk, pp_risk=None):
    
    df_updated = df[(df['風險值A'] >=user_risk)|((df['風險值B'] >=pp_risk))]   

    return df_updated

def read_csv():
    put_markdown('# 只支持pin') 
    put_markdown('功能如下：')
    put_markdown("""
- 選擇與程序再**同一文件夾**的文件
- 輸入你希望卡的風險值閾值 **不輸入則默認-10**
- 自動加載解析輸出極黑標籤佔比以及明細數據
- 請勾選你所需要的標籤**（不勾選=全選）**，然後點擊提交即可
    """)

    file = file_upload('只支持上傳該程序所在文件夾的csv文件哦', '.csv')

    ## 本地文件

    data = []
    raw_data = pd.read_csv(os.getcwd() + "\" + file['filename'], encoding='gbk')
    put_html(raw_data.to_html())

## -------------------------- 下面是 step two 新增的代碼 -------------------------- 

    risk_value = input_group(
    "risk_value",
    [
        input("風險值A(默認-10)？", name="user_risk", type=NUMBER),
        input("風險值B(默認-10)？", name="pp_risk", type=NUMBER)
    ],
    )
    
    raw_data_upated = 配置規則_風險值閾值(raw_data,risk_value['user_risk'], risk_value['pp_risk'])

    table1 = raw_data_upated.groupby('指標').賬號.count().reset_index()
    table1['佔比'] = table1.賬號 / len(raw_data_upated.賬號.unique()) * 100
    table1.sort_values('佔比', ascending=False, inplace=True)
    put_html(table1.to_html())

## -------------------------- 上面是 step two 新增的代碼 -------------------------- 
    
if __name__ == '__main__':

    start_server(read_csv, port=8081, debug=True, cdn=False, auto_open_webbrowser=True)

👉

Step Three: 標籤卡控

從第二步，我們已經完成了風險值閾值的卡控，然後第三步就是標籤的選取了。從對標籤的理解和應用經驗以及第二步得到的標籤在樣本中的佔比，咱們就可以快速的知道，這個樣本里面的標籤分佈分別是什麼。進一步可以通過標籤的選取達到最終符合我們風險分層結果中有風險的那一部分的輸出了

import pandas as pd
from pywebio.input import *
from pywebio import start_server
from pywebio.output import *
import nest_asyncio
import numpy as np
import os
import time

nest_asyncio.apply()

def 配置規則_風險值閾值(df, user_risk, pp_risk=None):
    
    df_updated = df[(df['風險值A'] >=user_risk)|((df['風險值B'] >=pp_risk))]   

    return df_updated

def read_csv():
    put_markdown('# 只支持pin') 
    put_markdown('功能如下：')
    put_markdown("""
- 選擇與程序再**同一文件夾**的文件
- 輸入你希望卡的風險值閾值 **不輸入則默認-10**
- 自動加載解析輸出極黑標籤佔比以及明細數據
- 請勾選你所需要的標籤**（不勾選=全選）**，然後點擊提交即可
    """)

    file = file_upload('只支持上傳該程序所在文件夾的csv文件哦', '.csv')

    ## 本地文件

    data = []
    raw_data = pd.read_csv(os.getcwd() + "\" + file['filename'], encoding='gbk')
    put_html(raw_data.to_html())

    risk_value = input_group(
    "risk_value",
    [
        input("風險值A(默認-10)？", name="user_risk", type=NUMBER),
        input("風險值B(默認-10)？", name="pp_risk", type=NUMBER)
    ],
    )
    
    raw_data_upated = 配置規則_風險值閾值(raw_data,risk_value['user_risk'], risk_value['pp_risk'])
    
    
    table1 = raw_data_upated.groupby('指標').賬號.count().reset_index()
    table1['佔比'] = table1.賬號 / len(raw_data_upated.賬號.unique()) * 100
    table1.sort_values('佔比', ascending=False, inplace=True)
    put_html(table1.to_html())
    
    ## -------------------------- 下面是 step three 新增的代碼 -------------------------- 
    
    set_list = raw_data_upated.指標.unique()
    
    list_save = checkbox(label='勾選保留的標籤，不勾選=全選', options=set_list, inline=True)
    if list_save == []:
        list_save = set_list
    else:
        list_save = list_save
    raw_data_upated = raw_data_upated[raw_data_upated.指標.isin(list_save)]
    put_html(raw_data_upated.to_html())

    def Save0():
        put_markdown("You click Save button, Done").show()
        raw_data_upated.to_excel(os.getcwd() + "\" + '輸出的風險明細.xlsx', index=False)
        
    put_markdown("find your file on 程序同級文件夾下的 文件 ： 輸出的風險明細.xlsx").show()
    put_buttons(['下載文件"對內不對外輸出明細.xlsx"'], onclick=[Save0]).show()
        
    ## -------------------------- 上面是 step three 新增的代碼 -------------------------- 
    
if __name__ == '__main__':

    start_server(read_csv, port=8081, debug=True, cdn=False, auto_open_webbrowser=True)

👉

總結

這裏只是舉了個簡單的例子，一個支持閾值+標籤卡控，快速獲取符合要求的目標羣體的例子。實際上，這個框架的拓展還有很多。例如：

1.直連數據庫，可以幫住那些不會sql的同事可以自定義快速獲取業務數據。

2.Pyinstaller封裝成本地程序，脫離代碼環境，可以在任意電腦，任意環境，任意人士進行使用。希望這個例子可以幫助到大家，感謝大家的耐心讀取

【團隊效率提升】Python-PyWebIO介紹

作者：京東零售關鍵

簡介

Step one：本地文件上傳

Step two：風險值卡控

Step Three: 標籤卡控

總結

AI模型 Llama 3體驗筆記

【面試準備】又一次失敗的面試經歷，題目離譜～資深軟件測試工程師

dotnet 8 版本與銀河麒麟V10和UOS系統的 glibc 兼容性

南京大學×百度“星河杯”AI 大模型創意校園賽正式起航

實用分享！用Axure RP構建交互的5個小技巧

大模型微調提升AI應用性能

LoRA微調語言大模型的實用技巧

系統整容紀：責任鏈設計模式的應用實戰（爆燈了，研發工期由45天降爲1天）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

【團隊效率提升】Python-PyWebIO介紹

作者：京東零售 關鍵

簡介

Step one：本地文件上傳

Step two：風險值卡控

Step Three: 標籤卡控

總結

作者：京東零售關鍵