目录
1,准备
- 安装:Python,MySQL,pytcharm
- 基础介绍:
- 1,if__name__=='__name__'
-
def A(): print(“你好”) if__name__=='__name__' A() >>你好 其他文件调用A() >>你好
-
2,列表解析,
-
3,装饰器
-
4,递归函数
-
5,面向对象
-
2,数据获取
-
1,例子(正常)
import requests import pandas as pd import bs4 import BrautifulSoup #1.请求数据 def get(): url = headers= data= data =requets.get(url,headers,data) return data #2.解析数据 def jiexi(data): soup = BrautifulSoup(data,'lxml') #2.1数据爬取 A1 =soup.xpath('//li') A2 =soup.xpath('//li') return A1,A2 #3.存储数据 def save_data(A1,A2): with open('boowk.json','w') as fp: >>打开创建写入名称 json.dump(books,fp) >>引入写入字典 #end开始爬取 def run(): data=get() A1,A2 = jiexi(data) save_data(A1,A2) if__name__=='__name__' run()
2,例子2(出来异常)
-
try: 代码块,所有逻辑 pass excepy Exception: 上面代码出错,知道执行当前内容 while True: try: inp=input("输入整数") #代码块,所有逻辑 i=int(inp) excepy Exception as e: #错误返回 ==e pringt(e) #上面代码出错,知道执行当前内容
3,数据存取与洗涤
-
open . close
f = open('hello.txt','w')
w ---写入
a ---文件最后写入
r ---只读
r+ --读+写
wb ----二进制写入
打开文件 f . write('写入内容') 写入内容 f .close() 关闭文件 -
json 文件存取
- json.dumps 和json.loads
1.汉子存取
data ={'lang','汉字'}
json_str =json.dumps(data,ensure_ascii =False)
data >>
{'lang','汉字'}
- sort_key排序
json_str =json.dumps(data,surt_keys=FTrue)
- indent 美化输出
json_str =json.dumps(data,indent = 4)
-
openpyxl (读取xlsx)
from openpyxl import load_workbook f =load_workbook('abc.xlsx') --打开文件 print("表名:",wb.get_sheet_names()) ----查看所有表名
-
数据清洗(pandas库为主)
- 具体看 Python数据分析-02