Python3教程Web開發實戰梳理-day5（Web框架）

Day5：編寫Web框架

前面完成了數據庫的部署與操作封裝，現在開始進入到服務器方面的工作。我們前面提到了，在本項目中我們引入了異步框架aiohttp，並且他自身提供了一個服務器。aiohttp已經是一個框架了，爲什麼我們還要再自己實現呢？
原因在於，從框架的使用者的角度來說，aiohttp還是相對比較底層，想要在使用框架時所需要的代碼更簡潔，就需要我們在aithttp的基礎上增添一些其他的公用的功能，封裝出更高級的Web框架。Web框架的設計是完全從使用者出發，目的是讓框架使用者編寫儘可能少的代碼。

編寫URL處理函數的大致流程

第一步，編寫一個用@asyncio.coroutine裝飾的函數：

@asyncio.coroutine
def handle_url_xxx(request):
    pass

第二步，傳入的參數需要自己從request中獲取：

url_param = request.match_info['key']
query_params = parse_qs(request.query_string)

最後，需要自己構造Response對象：

text = render('template', data)
return web.Response(text.encode('utf-8'))

這些重複的工作可以由框架完成，我們的目標也是如此。

接下來在coroweb.py中編寫框架代碼

Http定義了與服務器交互的不同方法，最基本的方法有4種，分別是GET，POST，PUT，DELETE。
URL全稱是資源描述符，我們可以這樣認爲：一個URL地址，它用於描述一個網絡上的資源，而HTTP中的GET，POST，PUT，DELETE就對應着對這個資源的查，改，增，刪4個操作。
建議：
1、get方式的安全性較Post方式要差些，包含機密信息的話，建議用Post數據提交方式；
2、在做數據查詢時，建議用Get方式；而在做數據添加、修改或刪除時，建議用Post方式；

要把一個函數映射爲一個URL處理函數，我們先定義@get()：

def get(path):
    '''
    Define decorator @get('/path')
    '''
    def decorator(func):
        @functools.wraps(func)
        def wrapper(*args, **kw):
            return func(*args, **kw)
        wrapper.__method__ = 'GET'
        wrapper.__route__ = path
        return wrapper
    return decorator

這裏得到的get是一個裝飾器。這樣，一個函數通過@get()的裝飾就附帶了URL信息。
@post與@get定義類似。

def post(path):
    '''
    Define decorator @post('/path')
    '''
    def decorator(func):
        @functools.wraps(func)
        def wrapper(*args, **kw):
            return func(*args, **kw)
        wrapper.__method__ = 'POST'
        wrapper.__route__ = path
        return wrapper
    return decorator

定義RequestHandler

URL處理函數不一定是一個coroutine，因此我們用RequestHandler()來封裝一個URL處理函數。

RequestHandler是一個類，創建的時候定義了_call_()方法，因此可以將其實例視爲函數。

RequestHandler目的就是從URL函數中分析其需要接收的參數，從request中獲取必要的參數，調用URL函數，然後把結果轉換爲web.Response對象，這樣，就完全符合aiohttp框架的要求

#運用inspect模塊，創建幾個函數用以獲取URL處理函數與request參數之間的關係
def get_required_kw_args(fn): #收集沒有默認值的命名關鍵字參數
    args = []
    params = inspect.signature(fn).parameters #inspect模塊是用來分析模塊，函數
    for name, param in params.items():
        if str(param.kind) == 'KEYWORD_ONLY' and param.default == inspect.Parameter.empty:
            args.append(name)
    return tuple(args)

def get_named_kw_args(fn):  #獲取命名關鍵字參數
    args = []
    params = inspect.signature(fn).parameters
    for name,param in params.items():
        if str(param.kind) == 'KEYWORD_ONLY':
            args.append(name)
    return tuple(args)

def has_named_kw_arg(fn): #判斷有沒有命名關鍵字參數
    params = inspect.signature(fn).parameters
    for name,param in params.items():
        if str(param.kind) == 'KEYWORD_ONLY':
            return True

def has_var_kw_arg(fn): #判斷有沒有關鍵字參數
    params = inspect.signature(fn).parameters
    for name,param in params.items():
        if str(param.kind) == 'VAR_KEYWORD':
            return True

def has_request_arg(fn): #判斷是否含有名叫'request'參數，且該參數是否爲最後一個參數
    params = inspect.signature(fn).parameters
    sig = inspect.signature(fn)
    found = False
    for name,param in params.items():
        if name == 'request':
            found = True
            continue #跳出當前循環，進入下一個循環
        if found and (str(param.kind) != 'VAR_POSITIONAL' and str(param.kind) != 'KEYWORD_ONLY' and str(param.kind != 'VAR_KEYWORD')):
            raise ValueError('request parameter must be the last named parameter in function: %s%s'%(fn.__name__,str(sig)))
    return found


#定義RequestHandler,正式向request參數獲取URL處理函數所需的參數
class RequestHandler(object):

    def __init__(self,app,fn):#接受app參數
        self._app = app
        self._fn = fn
        self._required_kw_args = get_required_kw_args(fn)
        self._named_kw_args = get_named_kw_args(fn)
        self._has_named_kw_arg = has_named_kw_arg(fn)
        self._has_var_kw_arg = has_var_kw_arg(fn)
        self._has_request_arg = has_request_arg(fn)

    async def __call__(self,request): #__call__這裏要構造協程
        kw = None
        if self._has_named_kw_arg or self._has_var_kw_arg:
            if request.method == 'POST': #判斷客戶端發來的方法是否爲POST
                if not request.content_type: #查詢有沒提交數據的格式（EncType）
                    return web.HTTPBadRequest(text='Missing Content_Type.')#這裏被廖大坑了，要有text
                ct = request.content_type.lower() #小寫
                if ct.startswith('application/json'): #startswith
                    params = await request.json() #Read request body decoded as json.
                    if not isinstance(params,dict):
                        return web.HTTPBadRequest(text='JSON body must be object.')
                    kw = params
                elif ct.startswith('application/x-www-form-urlencoded') or ct.startswith('multipart/form-data'):
                    params = await request.post() # reads POST parameters from request body.If method is not POST, PUT, PATCH, TRACE or DELETE or content_type is not empty or application/x-www-form-urlencoded or multipart/form-data returns empty multidict.
                    kw = dict(**params)
                else:
                    return web.HTTPBadRequest(text='Unsupported Content_Tpye: %s'%(request.content_type))
            if request.method == 'GET': 
                qs = request.query_string #The query string in the URL
                if qs:
                    kw = dict()
                    for k,v in parse.parse_qs(qs,True).items(): #Parse a query string given as a string argument.Data are returned as a dictionary. The dictionary keys are the unique query variable names and the values are lists of values for each name.
                        kw[k] = v[0]
        if kw is None:
            kw = dict(**request.match_info)
        else:
            if not self._has_var_kw_arg and self._named_kw_args: #當函數參數沒有關鍵字參數時，移去request除命名關鍵字參數所有的參數信息
                copy = dict()
                for name in self._named_kw_args:
                    if name in kw:
                        copy[name] = kw[name]
                kw = copy
            for k,v in request.match_info.items(): #檢查命名關鍵參數
                if k in kw:
                    logging.warning('Duplicate arg name in named arg and kw args: %s' % k)
                kw[k] = v
        if self._has_request_arg:
            kw['request'] = request
        if self._required_kw_args: #假如命名關鍵字參數(沒有附加默認值)，request沒有提供相應的數值，報錯
            for name in self._required_kw_args:
                if name not in kw:
                    return web.HTTPBadRequest(text='Missing argument: %s'%(name))
        logging.info('call with args: %s' % str(kw))

        try:
            r = await self._fn(**kw)
            return r
        except APIError as e: #APIError另外創建
            return dict(error=e.error, data=e.data, message=e.message)

在上述RequestHandler代碼可以看出最後調用URL函數時，URL函數可能會返回一個名叫APIError的錯誤，它的作用是用來返回諸如賬號登錄信息的錯誤，這會在day10編寫用戶註冊API裏面講到。

add_route()與add_static()函數

由於我們現在要建立的的Web框架基於aiohttp框架，所以需要再編寫一個add_route函數，用來註冊一個URL處理函數，主要用來驗證函數是否有包含URL的響應方法與路徑信息，以及將函數變爲協程。
代碼如下：

def add_route(app, fn):
    method = getattr(fn, '__method__', None)
    path = getattr(fn, '__route__', None)
    if path is None or method is None:
        raise ValueError('@get or @post not defined in %s.' % str(fn))
    if not asyncio.iscoroutinefunction(fn) and not inspect.isgeneratorfunction(fn):
        fn = asyncio.coroutine(fn)
    logging.info('add route %s %s => %s(%s)' % (method, path, fn.__name__, ', '.join(inspect.signature(fn).parameters.keys())))
    app.router.add_route(method, path, RequestHandler(app, fn))

通常add_route()註冊會調用很多次，而爲了框架使用者更加方便，可以編寫了一個可以批量註冊的函數，預期效果是：只需向這個函數提供要批量註冊函數的文件路徑，新編寫的函數就會篩選，註冊文件內所有符合註冊條件的函數。

# 自動把handler模塊的所有符合條件的函數註冊了:
def add_routes(app, module_name):
    n = module_name.rfind('.')
    if n == (-1):
        mod = __import__(module_name, globals(), locals())
    else:
        name = module_name[n+1:]
        mod = getattr(__import__(module_name[:n], globals(), locals(), [name]), name)
    for attr in dir(mod):
        if attr.startswith('_'):
            continue
        fn = getattr(mod, attr)
        if callable(fn):
            method = getattr(fn, '__method__', None)
            path = getattr(fn, '__route__', None)
            if method and path:
                add_route(app, fn)

然後添加靜態文件夾的路徑：

def add_static(app):
    path = os.path.join(os.path.dirname(os.path.abspath(__file__)), 'static')
    app.router.add_static('/static/', path)
    logging.info('add static %s => %s' % ('/static/', path))

之後，要在主程序app.py的初始化函數init()中添加middleware、jinja2模板和自注冊的支持
添加代碼如下：

from coroweb import add_routes, add_static
from aiohttp import web
from jinja2 import Environment, FileSystemLoader

app = web.Application(loop=loop, middlewares=[
    logger_factory, response_factory
])
init_jinja2(app, filters=dict(datetime=datetime_filter))
add_routes(app, 'handlers')
add_static(app)

其中jinja2模板的初始化也需要我們在app.py中實現：

def init_jinja2(app, **kw):
    logging.info('init jinja2...')
    options = dict(
        autoescape = kw.get('autoescape', True),
        block_start_string = kw.get('block_start_string', '{%'),
        block_end_string = kw.get('block_end_string', '%}'),
        variable_start_string = kw.get('variable_start_string', '{{'),
        variable_end_string = kw.get('variable_end_string', '}}'),
        auto_reload = kw.get('auto_reload', True)
    )
    path = kw.get('path', None)
    if path is None:
        path = os.path.join(os.path.dirname(os.path.abspath(__file__)), 'templates')
    logging.info('set jinja2 template path: %s' % path)
    env = Environment(loader=FileSystemLoader(path), **options)
    filters = kw.get('filters', None)
    if filters is not None:
        for name, f in filters.items():
            env.filters[name] = f
    app['__templating__'] = env

其參數中用到的datetime_filter()函數實質是一個攔截器，具體作用在day8中會提及
先給出代碼：

def datetime_filter(t):
    delta = int(time.time() - t)
    if delta < 60:
        return u'1分鐘前'
    if delta < 3600:
        return u'%s分鐘前' % (delta // 60)
    if delta < 86400:
        return u'%s小時前' % (delta // 3600)
    if delta < 604800:
        return u'%s天前' % (delta // 86400)
    dt = datetime.fromtimestamp(t)
    return u'%s年%s月%s日' % (dt.year, dt.month, dt.day)

middleware

上面的RequestHandler對於URL做了一系列的處理，但是aiohttp框架最終需要的是返回web.Response對象，實現這一步，這裏引入aiohttp框架的web.Application()中的middleware參數。
簡介：middleware是一種攔截器，一個URL在被某個函數處理前，可以經過一系列的middleware的處理。一個middleware可以改變URL的輸入、輸出，甚至可以決定不繼續處理而直接返回。middleware的用處就在於把通用的功能從每個URL處理函數中拿出來，集中放到一個地方。
當創建web.appliction的時候，可以設置middleware參數，而middleware的設置是通過創建一些middleware factory(協程函數)。這些middleware factory接受一個app實例，一個handler兩個參數，並返回一個新的handler。

一個記錄URL日誌的logger可以簡單定義如下：

async def logger_factory(app, handler):
    async def logger(request):
        logging.info('Request: %s %s' % (request.method, request.path))
        # await asyncio.sleep(0.3)
        return (await handler(request))
    return logger

response這個middleware把返回值轉換爲web.Response對象再返回，以保證滿足aiohttp的要求：

async def response_factory(app, handler):
    async def response(request):
        logging.info('Response handler...')
        r = await handler(request)
        if isinstance(r, web.StreamResponse):
            return r
        if isinstance(r, bytes):
            resp = web.Response(body=r)
            resp.content_type = 'application/octet-stream'
            return resp
        if isinstance(r, str):
            if r.startswith('redirect:'):
                return web.HTTPFound(r[9:])
            resp = web.Response(body=r.encode('utf-8'))
            resp.content_type = 'text/html;charset=utf-8'
            return resp
        if isinstance(r, dict):
            template = r.get('__template__')
            if template is None:
                resp = web.Response(body=json.dumps(r, ensure_ascii=False, default=lambda o: o.__dict__).encode('utf-8'))
                resp.content_type = 'application/json;charset=utf-8'
                return resp
            else:
                resp = web.Response(body=app['__templating__'].get_template(template).render(**r).encode('utf-8'))
                resp.content_type = 'text/html;charset=utf-8'
                return resp
        if isinstance(r, int) and r >= 100 and r < 600:
            return web.Response(r)
        if isinstance(r, tuple) and len(r) == 2:
            t, m = r
            if isinstance(t, int) and t >= 100 and t < 600:
                return web.Response(t, str(m))
        # default:
        resp = web.Response(body=str(r).encode('utf-8'))
        resp.content_type = 'text/plain;charset=utf-8'
        return resp
    return response

在廖雪峯老師提供的源代碼中，還有一個叫做data_factory的函數：

async def data_factory(app, handler):
    async def parse_data(request):
        if request.method == 'POST':
            if request.content_type.startswith('application/json'):
                request.__data__ = await request.json()
                logging.info('request json: %s' % str(request.__data__))
            elif request.content_type.startswith('application/x-www-form-urlencoded'):
                request.__data__ = await request.post()
                logging.info('request form: %s' % str(request.__data__))
        return (await handler(request))
    return parse_data

不知道老師爲什麼在教程中沒有提及。
以目前水平也難以猜測其作用。

小結

框架這一塊比較難以理解，我覺得甚至難於ORM，以至於博客理了一遍之後還是似懂非懂。今天的梳理參考了一位同學的筆記，對我幫助很大，在此表示感謝。原博傳送門

Python3教程Web開發實戰梳理-day5（Web框架）

Day5：編寫Web框架

編寫URL處理函數的大致流程

接下來在coroweb.py中編寫框架代碼

要把一個函數映射爲一個URL處理函數，我們先定義@get()：

定義RequestHandler

add_route()與add_static()函數

middleware

小結

[轉帖]使用NMT和pmap解決JVM資源泄漏問題原創

Python實現大麥網搶票的四大關鍵技術點解析

Python 安裝庫指令大全

salesforce零基礎學習（一百三十八）零碎知識點小總結（十）

一款開源的.NET程序集反編譯、編輯和調試神器

關於接口協議，你必須要知道這些！

2020年上半年數據庫系統工程師考試

基於 Milvus + LlamaIndex 實現高級 RAG

【2024-05-21】以茶會友

從矩陣向量與圖論的角度理解matriod擬陣與貪心算法

Python3教程Web開發實戰梳理-day1+day2（開發環境與基本骨架）

卡特蘭數與錯排公式 — 例題講解，歡迎回復交流

阿里天池服裝標籤識別比賽新人賽練習經驗心得 Tianchi FashionAI Attributes Recognition of Apparel

[CV Paper] FaceBoxes: A CPU Real-time Face Detector with High Accuracy

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結