最強官配：世界上人們最喜歡的數據庫+最喜歡的語言

原創

读芯术

2020-06-23 04:20

全文共2157字，預計學習時長13分鐘

圖源：unsplash

幾乎每個人都在使用SQL和Python，Python是用於數據分析、機器學習和網頁開發的全明星頂級語言，而SQL是數據庫的實際標準。如果將兩者結合會發生什麼呢？

實際上，兩者要結合在一起並不難。我們可以快速利用Python的動態特性，控制和構建SQL查詢。設置完成後，我們無需執行任何操作。

這兩種工具結合之後可謂是最強搭檔，自動化和效率都達到了新高度。

pyodbc

連接兩種技術的橋樑是pyodbc，該庫可以輕鬆訪問ODBC數據庫。

ODBC（開放數據庫連接的簡稱）是一種用於訪問數據庫的標準化應用程序編程接口（API），由90年代初的SQLAccess組開發。兼容的數據庫管理系統（DBMS）包括：

· IBM Db2

· MySQL

· Oracle

· MS Access

· MS SQL服務器

本文將使用MS SQL服務器。在多數情況下，該服務器可以直接轉移，與任何符合ODBC的數據庫都可一起使用。唯一需要更改的是連接設置。

連接

首先，要創建與SQL 服務器的連接，可以通過pyodbc.connect實現。在此函數中，還須傳遞連接字符串。此連接字符串必須指定DBMS驅動程序、服務器、要連接的特定數據庫以及連接設置。

因此，假設要連接到服務器UKXXX00123,45600和數據庫DB01，需要使用SQL Server Native Client 11.0。從內部連接使得連接被信任，無需輸入用戶名和密碼。

cnxn_str = ("Driver={SQLServer Native Client 11.0};"
"Server=UKXXX00123,45600;"
"Database=DB01;"
"Trusted_Connection=yes;")
現在，連接已初始化爲：
cnxn = pyodbc.connect（cnxn_str）

如果不通過受信任的連接訪問數據庫，則需要輸入通常用於通過SQLServer Management Studio（SSMS）訪問服務器的用戶名和密碼。例如，如果用戶名是JoeBloggs，而密碼是Password123，則應立即更改密碼。更改密碼之前，可以按照如下進行連接：

cnxn_str = ("Driver={SQLServer Native Client 11.0};"
"Server=UKXXX00123,45600;"
"Database=DB01;"
"UID=JoeBloggs;"
"PWD=Password123;")cnxn = pyodbc.connect(cnxn_str)

現在我們已連接到數據庫，可以開始通過Python執行SQL查詢。

圖源：pexels

執行查詢

SQL 服務器上運行的每個查詢都包含遊標初始化和查詢執行。如果要在服務器內部進行任何更改，還需要將這些更改提交到服務器。

先來初始化遊標：

cursor = cnxn.cursor()

現在，每當要執行查詢時，都要使用此遊標對象。

從名爲“customers”表中選擇前1000行：

cursor.execute("SELECTTOP(1000) * FROM customers")

執行該操作，但這發生在服務器內部，實際上什麼也沒有返回到Python。讓我們一起看看從SQL中提取的這些數據。

提取數據

要從SQL中提取數據到Python中，需要使用pandas。Pandas提供了一個非常方便的函數read_sql，該函數可以從SQL讀取數據。read_sql需要查詢和連接實例cnxn，如下所示：

data =pd.read_sql("SELECT TOP(1000) * FROM customers", cnxn)

這會返回到包含“customers”表中前1000行的數據框。

在SQL中變更數據

現在，如果要變更SQL中的數據，需要在原始的初始化連接後添加另一步，執行查詢過程。在SQL中執行查詢時，這些變更將保存在臨時存在的空格中，而不是直接對數據進行更改。

爲了讓變更永久生效，必須提交變更。連接firstName和lastName列，創建fullName列。

cursor = cnxn.cursor()# firstalter the table, adding a column
cursor.execute("ALTER TABLE customer " + 
          "ADD fullNameVARCHAR(20)")# now update that column to contain firstName
 + lastNamecursor.execute("UPDATEcustomer " +        
"SET fullName = firstName + " " + lastName")

此時，fullName並不存在於數據庫中。必須提交這些變更，讓變更永久生效：

cnxn.commit()

下一步

一旦執行了需要執行的任何操作任務，就可以把數據提取到Python中，也可以將數據提取到Python中，在Python中進行操作。

無論採用哪種方法，一旦Python中有了數據，就可以做很多以前無法做到的事情。

也許需要執行一些日常報告，通常使用這些報告查詢SQL 服務器中的最新數據，計算基本統計信息，然後通過電子郵件發送結果。如何自動化這一過程呢？

# imports for SQL data part
       import pyodbc
       from datetime import datetime,timedelta
       import pandas as pd
             # imports forsending email
       from email.mime.text importMIMEText
       fromemail.mime.multipart importMIMEMultipart
       import smtplib
             date = datetime.today() -timedelta(days=7)  # get the date 7 days ago
             date = date.strftime("%Y-%m-%d")  # convert to format yyyy-mm-dd
             cnxn = pyodbc.connect(cnxn_str)  # initialise connection (assume we havealready defined cnxn_str)
             # build up ourquery string
       query = ("SELECT *FROM customers "
               f"WHERE joinDate > '{date}'")
             # execute thequery and read to a dataframe in Python
       data = pd.read_sql(query, cnxn)
             del cnxn  # close the connection
             # make a fewcalculations
       mean_payment = data['payment'].mean()
       std_payment = data['payment'].std()
             # get maxpayment and product details
       max_vals = data[['product', 'payment']].sort_values(by=['payment'], ascending=False).iloc[0]
             # write an emailmessage
       txt = (f"Customerreporting for period {date} - {datetime.today().strftime('%Y-%m-%d')}.\n\n"
             f"Mean payment amounts received: {mean_payment}\n"
             f"Standard deviation of payment amounts: {std_payments}\n"
             f"Highest payment amount of {max_vals['payment']} "
             f"received from {max_vals['product']} product.")
             # we will built themessage using the email library and send using smtplib
       msg =MIMEMultipart()
       msg['Subject'] ="Automatedcustomer report"  # set emailsubject
       msg.attach(MIMEText(txt))  # add text contents
             # we will sendvia outlook, first we initialise connection to mail server
       smtp = smtplib.SMTP('smtp-mail.outlook.com', '587')
       smtp.ehlo()  # say hello to the server
       smtp.starttls()  # we will communicate using TLSencryption
                # login to outlookserver, using generic email and password
       smtp.login('[email protected]', 'Password123')
                # send email to ourboss
       smtp.sendmail('[email protected]', '[email protected]', msg.as_string())
                # finally,disconnect from the mail server
       smtp.quit()

至此，任務結束！運行此代碼快速提取前一週的數據，計算關鍵指標，並把摘要發送給老闆。

圖源：pexels

通過簡單的步驟，我們瞭解瞭如何通過使用SQL和Python的集成來快速建立更高效、自動化的工作流程。不僅僅可以用來做本例中的事，它還有很多用途等你開發。

Python開闢了新路線，完成了以前僅使用SQL無法完成的操作。這對最強官配，實現了1+1大於2的效果。

一起分享AI學習與發展的乾貨
歡迎關注全平臺AI垂類自媒體 “讀芯術”

（添加小編微信：dxsxbb，加入讀者圈，一起討論最新鮮的人工智能科技哦～）

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

最強官配：世界上人們最喜歡的數據庫+最喜歡的語言

[轉帖]使用NMT和pmap解決JVM資源泄漏問題原創

Python實現大麥網搶票的四大關鍵技術點解析

salesforce零基礎學習（一百三十八）零碎知識點小總結（十）

一款開源的.NET程序集反編譯、編輯和調試神器

關於接口協議，你必須要知道這些！

【2024-05-21】以茶會友

還在“收集”證書？學好數據科學，做項目纔是第一位的

如果必須重新開始，我會怎樣開啓自己的數據科學之旅？

寫出你的第一個web app，幾行代碼就夠了

研究了500+數據科學麪試問題之後，我發現了這些規律……

質子之死：粒子衰變如何推出萬有理論

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結