搜索系統一些思考——答案分層次

搜索系統是互聯網應用的鼻祖,搜索、推薦、ctr、cvr都屬於排序類算法範疇。解決的問題就是在有比較多答案都和用戶要問的問題相關時候該怎麼對這些信息排序,排序就一定會面臨比較的基準是什麼。要定義基準那就一定會問目標是什麼,不同的目標下基準的標準肯定是不一樣的。現在大部分的搜索和推薦的目的是商業目標——利益最大化,A.通過推薦給你更多付過費的商家信息,讓付費的商家信息更多此的曝光從概率上講曝光商家越多賣出去的商品就會更多;B.能越準確的提供給用戶知識性問題,用戶基數就會越多。

然而一個搜索系統對信息的排序應該是多基準,分層次的來衡量系統的。多目標是指除了商業目標、還應考慮到用戶體驗、用戶信息收穫、用戶知識面是否有拓廣、用戶通過搜索系統對問題認識是否更深刻。先來聊聊現在推薦系統是如何實現,有哪些問題;在講講實際中高人是如何回答問題,有哪些是可以借鑑的。最後提出一個邏輯上可行的搜索系統改進方案。

現代搜索系統背後原理:

1、對用戶搜索問題做解析、提取出問題裏面的關鍵詞、抽取出詞之間圖譜關係

2、問題的等價替換,轉成問題庫中已有的提問方式

3、對問題分析做用戶的意圖分析,通過用戶歷史提問畫像、統計的問題歸域對用戶模糊問題轉化成系統可以理解問題

4、通過等價問題、關鍵詞做答案召回

5、答案排序

現代推薦系統問題:

1、召回來答案大部分是知識性回答

2、對於高頻問題容易得到答案,低頻問題效果不好

3、基於數據驅動方式推薦的答案,答案趨同性強

4、回答不成體系只是在知識點上回答

當你問一個世外高人問題,他會如何回答:

比如你問一個“爲什麼人有如此多煩惱,我要怎麼跳脫出煩惱?”

高人回答:

1、你這麼問,首先定位出你還在凡人境界(問題域確定)

2、問煩惱,到底是哪個方面煩惱(人情事故、愛情不順、事業問題)

3、這人面相,身體狀態(用戶畫像推斷可能問題)

4、歷史上我回答過哪些這類問題,他們反饋比較好的回答是什麼

5、煩惱屬於哪個範疇、和哪些概念相關(

高人回答問題思路:

A.通過問這個問題確定用戶的境界、段位

B.通過問題歸域確定問題歸屬定位可以從哪些方面回答

C.通過對用戶的察言觀色,獲取更多用戶信息,縮小回答問題搜索範圍

D.解決問題因爲我不是他,所以我掌握信息肯定不如他多,可以給他啓發性回答發揮他自己主觀思考辨析問題能力

E.通過歷史經驗反饋,給些建議性回答

F.給些可落實的知識性操作性回答

結合以上的要素,高人給出的回答:

1、人非草木孰能無情,人有貪嗔癡三欲,過度在意自己得失煩惱如絲纏身南街,施主放下就好(定位凡人域,啓發往聖賢走)

2、事業總是有起有落這是自然規律,愛情總是分分合合有情人終成眷屬,親近遠疏也是人之常情、看那草木長密了來年就疏來疏了來年就密了,這些都是天數自然之理,看來就好人總是要順怎天運行才能省力(煩惱多方面)

3、施主印堂發黑氣虛面焦黃,最近是事業不太順否(用戶畫像、發問獲取更多用戶信息)

4、前些時日王五&&&&》〉》〉(經驗總結給出答覆)

5、煩惱是唯識中第六意識到第七意識,“淵深波浪境爲先...."(問題歸域,啓發思考)

6、施主如若煩惱,可以放下手頭工作找塊清涼之地休息數日、今日天氣煩悶飲食清淡些......如此這般 這般如此(知識性回答)

給我們現代搜索系統的啓發:

1、答案排序應該是多元的:知識性回答、關聯知識推薦、問題域上游定位、問題交叉領域推薦、哲學域啓發

2、可以通過答案巧妙的設計和用戶多輪交互,獲取更多用戶信息

3、通過對用戶發問,確定出用戶的水平境界,確定回答問題的專業程度(用戶可聽懂水平)

4、通過數據驅動,給出經驗性反饋較好的保守回答

具體在技術層面實現:
1、答案召回應該是多元的

2、需要對關鍵詞構建知識圖譜(哲學分類域的圖譜,比如地球可以屬於地理、天文、神學)、確定問題的上屆域

3、通過反問用戶,獲取更多信息

答案的多元化排序可以解決現在搜索系統,信息繭房效應

通過關聯知識圖譜方式可以讓推薦的結果既有深度也有廣度,可以擴展到關聯交叉領域

關鍵詞的哲學上下域圖譜,可以較好的梳理出用戶提問時候水平,知識是系統化的,可以提供一些上域問題讓用戶更好定位到自己問題在哪,更好去補強上域知識

通過和用戶交互、以及大案排序交互設計可以得到更多用戶的反饋信息,更明確知道用戶的意圖(加上這種有狀態的問題反饋約束比單純數據驅動強化學習更好的收斂,需要更少的用戶試探成本)

通過這種多元答案列表設計可以一定程度解決現代搜索的難題:信息繭房、用戶意圖識別、用戶心理學建模。可以給人有一種真正智慧的感覺,回答的問題很有彈性,有深度的哲學思考,也有馬上可用的知識性回答。給人一種智者的感覺,讓人各取所得、可深可淺。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章