搜索廣告的子模塊劃分
1. 業務系統
廣告主使用的系統: 廣告主註冊賬號、登錄系統、充值、購買廣告
分層賬號結構:方便廣告主對廣告進行管理
推廣計劃、推廣單元、關鍵詞、創意
多樣的投放控制:分地域推廣、分時段推廣、否定關鍵詞,否定IP
廣告主查看投放效果:
廣告展現次數、廣告點擊次數、廣告平均點擊價格、廣告質量度
2. 存儲系統
關係型數據存儲:數據庫
賬號信息
e.g.: mysql, oracle
非關係型數據存儲:NoSQL
文件信息:廣告創意
多媒體信息“: 圖片、視頻
衆多開源K-V系統:Redis, MongoDB, HBase, Casandra等
3. 傳輸系統
傳輸系統使得不同系統之間解耦合,是鏈接各個系統的橋樑,相當於高速數據總線,
它是廣告數據的ETL工具,完成數據的整合、轉換、分發。
對傳輸系統的要求:
數據正確性、傳輸實時性、性能穩定性、擴展伸縮性。
常見傳輸系統:
Push-Model: ”推“ 模式: 上游系統直接把數據往下游系統發送
優點:易於實現,實時性好,系統無單點穩定性高
缺點”:性能穩定性差,擴展伸縮差,運維成本高
Pull-Model: “拉”模式:上游系統只發布數據,下游系統訂閱數據
優點:擴展伸縮性好,運維成本低,性能穩定性好
缺點:實現複雜度高,系統存在單點
e.g. 消息隊列
4.檢索系統
負責完成廣告檢索的全過程
與傳統搜索引擎相同:
query分析:切詞、糾錯、主題詞抽取
倒排索引:廣告物料
關鍵詞檢索技術:
與傳統搜索引擎差異:
短文本:廣告物料<<網頁
全內存索引
實時檢索系統
完成複雜的廣告拍賣機制
5.反作弊系統
打擊搜索推廣中的各種作弊行爲,保護廣告主利益。
展現過濾:過濾無效的廣告展現
爬蟲的抓取流量
網民無意的多次連續搜索
競爭對手的大量刷新展現
點擊過濾:過濾無效的廣告點擊,保留對廣告主真正有價值的廣告點擊
競爭對手以消耗廣告主賬戶費用爲目的的惡意點擊
瀏覽器問題造成網民無意的連續多次點擊
不符合統計學規律的異常點擊
6. 計費系統
點擊計費:
只能對有效點擊計費,記錄點擊信息比如賬號、推廣計劃、推廣單元、
關鍵詞、創意和點擊時間等。
計費方式:實時計費,支持點擊追述
計費系統與業務系統聯動,更改賬戶餘額等
告訴用戶瀏覽器跳轉到對應的廣告主網站
7. 統計系統
完成展現、點擊和計費等數據統計功能,完成報表供廣告主、客服、管理者查看。
統計系統的功能:
支持複雜的業務邏輯
準實時的數據更新
海量的數據存儲
數據的準確性
請求響應實時性
系統的高穩定性
和廣告主相關:
業務系統、統計系統
與網民直接相關係統:
檢索系統
計費系統
內部系統:
存儲系統、傳輸系統、反作弊系統