【獨家】互聯網變現與計算廣告(乾貨+5000字精彩問答)

本講座選自2015年9月28日劉鵬先生在清華大數據“技術·前沿”講座上所做的題爲《互聯網變現與計算廣告》的演講。

劉鵬:大家好,我是老的清華人,諸位都是95後了,你們出生的時候我是95年入學。清華電子系呆了十年,04年年底博士畢業,畢業以後在MSRA(音),我去的時候開復剛調到美國去,我師從布萊克宋。我接觸廣告是從08年底,現在京東的副總裁張晨老師剛從美國回來建雅虎的研究院北京分院,雅虎研究院我是北京最早的員工,雅虎當時是一個很有意思的公司,現在大家拿雅虎不當回事,其實雅虎當時還是很強的,它的市值也曾經超過一千億美金。並且雅虎有一個特點,它的產品線什麼都有,有新聞、門戶、搜索、郵箱,當時在全球範圍麼還是比較領先的。它的變現的形態和廣告的形態比其他的網站都豐富,那個時候我們接觸到很多的有意思的產品,像搜索。日本的雅虎市場也是很大的,還做北美的廣告,包括很多的廣告形式都是從雅虎開始做的。

雅虎那個時候有兩位科學家,我印象很深,一位叫安哥瑞現在在谷歌,是美國工程院院士,他希望把廣告裏面有意思的事情繫統的計算整理成一個學科,他跟另一位科學家普萊斯頓,是一個經濟學家,他們兩個在斯坦福開了一門研究生的課程,這個課程很遺憾的是大家看不到課程的全貌,因爲我沒有在網上找到全課的錄像,或者是前幾部分的PPT。

後來大家從學術界和工業界對廣告開始重視起來了,以前學術界不重視,但是工業界一直很重視。安哥瑞整理這個課以後,學術界、工業界都開始重視這個問題。後來安哥瑞想把這個東西系統性的總結和整理一下,但是他的工作繁忙,一直沒有做。我的功力跟他差太遠,但是我也想做一些分享。三年前我在偉倫樓開過一個系列的公開課,當時聽的大部分是工業界的人,學生來的比較少。因爲在校的同學你瞭解搜索,瞭解socal GOLOBO(音)一旦進入互聯網界,你會發現這絕對是互聯網一個核心的業務,沒有比這個事再重要了,因爲大家掙錢全都是靠這個。清華的師弟宋波老師給我錄了一些課程,放在網易課堂。

後來總結了這些東西,爲什麼總結這麼長時間?因爲互聯網領域變化太快了,不要想有一個模特脫光了,你在寫生畫一天,其實他老在動的。就像廣告行業這幾年發生的變化太大了,不斷想跟着工業界的節奏在走,但是發現新產品、新技術層出不窮。到今年之所以有一個總結,是因爲移動的走向差不多有了一個模式。

大家來這個講座我相信並不是衝着我落的,是衝着大數據這個題目來的,剛纔主持人說我是大數據界的盆子,當然我根本不屬於大數據界,我看他們這麼火,我看着眼熱,我經常發表一些大數據不同的觀點。大家對大數據的認識和紮實的討論是有點魚龍混雜的,這是我真實的觀點。我在裏面寫的文章都是玩笑之作,完全是調侃的口氣,但是沒有關係,只是表達我的一些觀點。

今天借這個機會從我們做計算廣告的角度談一談,對大數據大家像一個盲人摸象一樣。我談一談我對數據的理解。所以我的題目叫做互聯網變現和計算廣告,談他們兩者之間的廣告。

我們還是從一些不太嚴肅的風格開始,這是我在空號裏面寫的一個文章,二十一世紀還是什麼一個雜誌讓我寫一篇文章,談談互聯網思維,我想了半天,因爲我一直在互聯網行業裏面幹,互聯網思維是什麼?我指的是中國的市場,中國市場我總結了三個點:

第一,不要錢,和我今天這本書直接相關。互聯網上最核心的一點商業模式的東西是免費傾銷加後向變現的商業模式。嘀嘀、快的的模式不客氣的講就是傾銷,但是不是每一個企業傾銷完了都能夠活下來,或者能夠長大,企業在用傾銷的方式獲得了市場佔有率以後,由於你推的是免費產品,怎麼掙錢呢?就要大量用到後向變現的方式,後向變現就是把我免費產品獲得無形資產變成錢的過程。我總結了三種資產:第一,流量,別人在用你的APP的時候你可以順便在上面放一點東西,夾一點私活。流量通過廣告變現大家都明白。第二,數據,大家都是奔着大數據來的,肯定對這一點很有興趣,數據怎麼變成錢呢?數據能不能掙錢,會有很多人問這個問題,我覺得這個問題特別可笑,數據不僅掙錢,而且是規模化的盈利,這件事情已經不是這兩年才發生的事,這是十年前就已經發生的事情。爲什麼現在大家還在討論數據能不能掙錢,這說明很多大數據領域的人並沒有真正研究過去在互聯網裏對數據的使用方法和變現手段。我們覺得有一個規律:一切規模化、個性化傳遞信息的商品,它的售價都會趨向於邊際成本,一個網站或者一個APP邊際成本是多少,每多服務一個用戶,他應該付出的額外成本是多少。邊際成本應該是零或者是很小一個數,很自然的這些產品的定價都應該是免費的。其他的商品,比如說電視,樂視的電視是多少錢銷售的?毛利爲零,甚至是負毛利銷售,他有非常明確的後向變現的手段,不要擔心他掙不到錢,他只要能夠做到一定規模,掙錢是板上釘釘的事情,他掙的方式是先進的方式,別的方式會被他的所打敗。手機很明顯也會趨向於零毛利的銷售。有一些牌子的手機現在毛利已經很低了,甚至是負的,這都不奇怪。還有一些大家可以去探討,比如說電影,我堅定的認爲電影的票價絕對應該是零,這件事情什麼時候會發生?以我最保守的判斷,絕對不會超過十年。它的原理是,比如說最近有一個片子叫《港囧》,之前一部叫《泰囧》,它的票房非常好,等於賣給了三千萬人,三千萬人對於大衆喜聞樂見的方式來說,太少了,如果我們用免費的方式把它變成三億人看,後端產生的商業價值難道僅僅是十個億嗎?可是問題就來了,如果我們僅僅把前端的商業免費了,後端的變現我們不掌握,你的片子就白虧了,所以後端變現的體系是非常重要的。我本人也看過一些電影,包括植入的廣告,包括各種形式,他們從植入廣告這一點來說,他們的商業模式還屬於比較低級的階段,現在這種方式支撐不了把片子免費,還獲得十億以上的收入。這裏面有很多利益相關方在裏面。不要錢,如果你想知道我的書寫什麼,我希望大家瞭解什麼,重點是瞭解這個東西,免費的流量和數據如何變成錢的,它涉及到很多複雜的產品技術。

第二,不要臉。現在大多數互聯網產品的營銷方式和產品點是無底線迎合用戶的狀態。特別是在面對比較年輕用戶的時候,各個互聯網公司在產品的文案上、產品的營銷點上都是非常出格的,是跪舔用戶的狀態。
第三,不要命。在互聯網上有一種工作方式叫九九六。9點工作到9點,每週工作6天。這在很多創業公司和大一些的公司都是廣泛存在的。爲什麼互聯網的人能夠這樣瘋狂的工作?關鍵的一點是全員持股,硅谷最核心的一個發明就是告訴大家,這企業是你們都有份的,硅谷的全員持股是比所有的技術創新都重要。其他的技術創新是在這個基礎上產生的,如果我每個月拿三千工資,你看那個公司能搞出什麼。他是在這個激勵下產生的。包括馬老闆說的,馬老闆把自己的股份給員工分了多少,他自己就剩下百分之七點幾的股份,這個事情是大家拼命在阿里加班的前提,我覺得不是價值觀。

我們重點看第一點,後向變現,或者叫商業化。

第一,商業模式探索。所有免費用戶產品在做到一定量以後都會面臨這樣一個詞:商業化。商業化是一個很大的領域,跟商業化相關的問題也很多。我這邊舉了一些例子,碰到這些問題你就要從商業化裏面找答案,而不僅僅是要用用戶的角度去找問題。

第二,流量變現。

第三,數據變現,我通過免費的用戶產品,積累了一些用戶行爲或者其他用戶相關的數據,這些數據怎麼變成錢?近些年來大家發現數據變現的能力在某種意義上還要強過流量變現的能力。數據怎麼變現?大家先不要去看大數據領域講的東西,你先好好學習學習廣告,因爲數據的變現、數據的交易、數據隱私保護的邊界在廣告領域得到了充分的研究和工業界實戰。你要不瞭解廣告,你一定是從頭走一遍彎路,這個彎路是非常多的。

第四,具體操作層面的東西,商業產品的建設和運營。比如說一個公司有廣告,有遊戲聯運,返利購買,他們之間是不是有內在的聯繫?其實他們都是泛廣告產品,他背後的商業邏輯基本是一致的。應該共用某些產品和技術平臺去實現一個公司整體的商業化戰略,這些大家在實際工作中才有感覺,前幾個問題都是蠻有意思。我特別希望同學們如果在你的學習之餘,除了瞭解一些用戶產品,還能瞭解一些商業產品的思維、技術,對於你將來參加互聯網公司的工作很有幫助。

我的書的內容是基於我的公開課,後來在北大、北航都上過一次研究生課,總結出來的。對互聯網創業者、對互聯網行業的從業者,對計算機相關專業的研究生,我都希望他從這裏得到一些東西,希望各位給我提一些建議。

從大數據說起,大數據這個詞是一個諮詢公司提出來的,這個詞並不是來自於學術界。第二,也並不是來自於純粹的工業界。這個詞的立意非常好,讓大家在大的場景下了解數據的價值和作用。由於它這樣的起源,在中國現在的狀態上,它與工業界實際發生的數據運用的現狀以及學術界可落地的研究存在一定的距離,很多時候是概念到概念。所以我常常講BIG是漢語的英譯,是逼格的音譯。我認爲必須要找到一個落地的點來看看大數據到底做什麼。

我自己對大數據的認識,我是從工業界來的,工業界對大數據最直觀的認識是傳統的工具用不了了,微博上有一些朋友來問我,我現在學大數據是不是應該學SASS這個軟件,這讓我覺得很難回答,我覺得跟那個沒有關係,但是賣這個軟件的人肯定跟我過不去。因爲我們要了解大數據研究的是什麼東西,傳統的IOE的企業研究的是交易數據的加工和處理,交易數據的加工和處理是非常困難的,因爲他要求正確率極高,一條都不能錯,實時性要求極高,所以IOE整個這套系統就是IBM、Oracle和EMC。你別以爲現在拉一個互聯網企業出來就能做系統,他們絕對是吹牛。可是互聯網企業處理的大數據和IOE處理的交易數據有點不一樣,我們關注的大數據是指行爲數據,行爲數據跟交易數據的區別,交易數據指業務實施過程中不得不計的數據,比如說存取款、利息,這些數據你不能不記,你不記你的業務沒有辦法開展,但是行爲數據是可計可不計的數據,比如說網站的瀏覽日誌。互聯網企業一開始也不是想到要記這些數據,因爲他的服務器自然而然的給它記下來了,後來他就想能不能給廣告變現帶來一點作用,於是他就開始挖掘這些數據。交易數據如果是1,行爲數據一般都在100以上。第二,它對一致性的要求是比較低的,網站的日誌丟千分之一對大多數業務都沒有關係。意味着原來IOE所有架構對於處理這種行爲數據是不合適的,因爲它太貴,我們要用一種更便捷、更低成本的方案來處理。所以工業界我們看到的變化是我們所用到的工具完全的變掉了,去IOE化,阿里這麼說他有他的技術,如果現在互聯網企業一擁而上,把銀行系統都換掉,那是災難性的。可是原來IOE的你也不要輕易的說你們在做大數據,你們做的事情跟大數據嚴格來說也沒有關係,你們還是在做傳統交易數據的挖掘和整理。

這個圖,A曲線,我認爲的大數據是什麼樣的,我如果數據可以採樣,就不是大數據的問題,C類的數據可以採樣,比如說我要統計360在各個省的用戶佔比,顯然是我先對用戶數據採樣,採樣十萬分之一。可是你現在碰到大多數的大數據都拿這樣的案例在糊弄大家,他們把數據大,就當成大數據。這種問題的特點是稀疏的採樣數據,結果不變,或者結果的基本不變。就不是大數據的問題。大數據應該是A種曲線。什麼樣的問題是典型的大數據問題?什麼樣的問題不能採樣?所謂的個性化問題,廣告是一個個性化問題,我們要對每一類用戶描述他的行爲特徵和個性偏好。如果我採十億人,這十億人描述完了,我採樣一百萬人,所有的事情照做,你能影響的廣告效果和空間的那部分人羣就變成了一百萬人,這個系統使得你的系統收益大幅度下降。比如說個性化推薦,依然不能採樣。現在新的業務,個人徵信業務,他也知道每一個人都做描述,所有的個性化問題基本上是大數據問題。我們也可以從另外一個角度理解大數據的應用。我個人是這樣人爲的,如果你的數據出來的結果是給人看的,不能成爲大數據的問題,一定是要給機器看的,你要形成一個閉環的決策過程。

廣告是大數據的最典型的應用。數據應用分成兩類,一類是Insight,洞察,比如說360對每個省的人口占比,這個結果打出來的是一張表,財務報表、人口統計、百度遷徙地圖,這就叫洞察,洞察是整體上把握一些宏觀規律,宏觀的決策、運營人員和領導用的。這樣的領域不能說沒有大數據的問題,也有一些採樣以後做不了的問題也存在,但是大多數問題跟大數據毫無關係。

另外一類應用叫Automation,自動化,我輸出的是個體的行爲特徵信息,如果我對十億人分析完了,顯然領導是不能看的,只有機器能看。在這種情況下數據的結果主要用於微觀的數據實施,面向機器和銷售人員。我個人覺得自動化的應用,大數據的成分要多很多,洞察的這類應用有很多跟大數據沒有關係。我特別不希望大家被很多宣傳帶歪了,不能弄一張報表就叫大數據,那個叫商業分析。大數據簡要說就是面向大規模的加工行爲數據,並且把這個加工結果自動的反饋給機器做決策的應用。這是我的看法。肯定有很多人不認同,但是沒有關係。

數據怎麼變成錢的。左邊這個廣告位投放的吉列剃鬚刀的廣告,這個廣告位賣一萬塊錢,是流量的價值,我每天來了十萬人,這十萬人看到這個廣告,你就得給我一萬塊錢。吉列是主要面對男性的廣告主,我只給男性用戶投吉列廣告,省出來的用戶都是女性用戶,我找一個化妝品的廣告投給女性用戶,我找每一個廣告主各收六千塊錢。對媒體來說,投入產出比也提高了,我收到了一萬兩千塊錢。我特別要強調,多出來的兩千塊錢是什麼,這兩千塊錢就是數據變現的價值。你知道了每一個人是男是女,在原來一萬塊錢基礎上可以憑空多掙兩千塊錢。僅僅知道一個性別就可以多掙兩千,你要知道更多這個人的信息和購物偏好,你顯然可以掙更多的錢,這些錢都是數據變現帶來的錢。

廣告對於數據變現和流量變現,你們在學校可能不太瞭解廣告,但是它太重要了,我們從三個點說明它的重要性。首先整個互聯網的意義來說,整個互聯網行業的大半部分的收入是來自於廣告,大概要到七成到八成左右。當然有人說互聯網是不是沒有別的掙錢方法了才用廣告掙錢?這種說法是錯誤的。互聯網公司做的產品好用,還是微軟做的產品好用?免費產品一定做的比收費產品好用。因爲在互聯網公司裏,用戶產品的部門和商業產品的部門是分開的,管這個產品的老大根本不考慮掙錢的事,沒有這個KPI,沒有把他所有的精力和能力解放出來,他可以全身心的服務用戶。我的觀點是:沒有任何的收費產品現在還能做得過免費產品。你要想了解互聯網,你如果不瞭解後向變現,不瞭解廣告,你真的不可能徹底的瞭解廣告,谷歌、臉書90%以上來自於互聯網廣告,淘寶八成是來自於廣告,騰訊一半來自於廣告,騰訊遊戲業務裏面有很大一塊是遊戲聯運業務,本質上仍然是CPS收費的廣告業務,算上那一塊應該有七成以上。百度衝O2O的業務,那是一個賠錢的業務,賠錢的業務把這個收入衝上去,很難說他將來怎麼樣,總之現在從利潤環境來說,八成以上來自於廣告是一點問題都沒有,這是一個先進的商業模式,不是無可奈何的事。

大數據有很多應用,這兩天很火那麼規模化的應用我認爲目前只有這樣幾個:個性化推薦是一個、計算廣告是一個、個人徵信正在試。普蘭替爾(音)蠻獨特的,但是它面向公衆數據的大數據應用。但是其中形成規模化營收的行業只有廣告。

廣告很複雜,除了計算技術,還有經濟學、社會學、心理學,都有非常具體的應用,非常具體的公式都要用上。

規模化營收,在北美2013年在線廣告總收入是四百億美金,中國2013年達到了一千億人民幣,去年達到一千五百億人民幣。中國從07年到2013年在線廣告漲了10倍,從17億美金漲到180億美金。對比的電視廣告增長了一倍,全球沒有增長這麼快的電視市場了。美國從07到13年基本上沒有漲,08、09年的時候跌了很多,就是因爲當時的經濟危機,經濟危機對整個廣告市場的影響是巨大的。網絡廣告07年美國已經很成熟了,兩百億美金,但是它仍然增長了一倍多。報紙的數字慘不忍睹,中國的報紙可能跌下去的速度比美國還要快,我家附近的方圓一公里以內的幾個報亭都沒有了。特別是北京、上海,報紙跌的速度非常快。當然也不完全是,很多紙媒的老闆跟我討論,我們辦電子版是不是就能解決問題呢?我個人認爲是解決不了。這個圖我希望告訴大家,在線廣告是一個發展及其迅速的市場,它的季度複合增長率都達到兩位數。並且這個增長速度現在沒有變慢,而是在變快,因爲移動互聯帶來了大量的新的機會。

傳統廣告主要做Brand爲 Awareness,品牌廣告,是爲了帶動長期的利潤率和離線的轉化率,他希望你記住這個品牌,將來選擇它的可能性變大,承擔的利潤空間也會變大。可是互聯網廣告除了能做上面這種廣告,互聯網廣告創造了一種嶄新的市場—效果廣告的市場。效果廣告的市場有意思就在於,爲什麼互聯網可以做效果?酷旁在線下發的效果是很低的,可是在線上發,數字廣告可以很方便的對每個人投送不同的內容,短期有購買慾望的人一定是很少一部分人,數字化媒體特別適合做這個。你並沒有看到在互聯網廣告快速增長的過程中,電視廣告快速下降,其實沒有這個其實,因爲以谷歌、臉書爲代表的互聯網廣告面對的是中小型的效果型的廣告主,這部分的廣告主傳統電視廣告對谷歌他們是不在意的。谷歌根本不屑於搶電視廣告的生意,那些中小企業加起來比五百強的廣告費多太多了。對銷量比較在乎的情況下,長期的比如說到京東這種體量,他一定是效果和品牌要並重,只有品牌廣告能拉動他的利潤率,效果廣告拉動不了企業的利潤率。

說到計算,爲什麼上面這些事要用計算來解決呢?因爲商業產品或者廣告特別好的一點是,我可以用一個公式來表達我有話的東西,這一點比用戶產品要簡單很多。微信火了以後有很多分析師就來討論,爲什麼微信比手機QQ好?但是這些討論都是馬後炮,或者並不能根據這些討論重新造一些產品出來,因爲用戶是非理性的,我選擇微信或者QQ,有一些調研說95後更喜歡手機QQ,這就證明在用戶產品優化過程中很難找到一個明確的優化目標讓他變得跟好。但是廣告不一樣,我們的優化目標很清楚。這個大括號裏面有兩項,一個是R,一個是Q,都是一個概念,沒有任何數學成分在裏面,R是收入,你投一次廣告出去掙了多少錢,Q是成本,你得到這次展示的機會付了多少錢,這兩個一減就是你的利潤,你投廣告的目的就是爲了優化利潤。前面那個求和,我優化的是一組廣告展示上的總利潤。廣告跟個性化推薦最大的差別在,廣告比個性化推薦複雜得多。最大的差別,廣告主有預算,我今天最多投多少錢,還有一個是你今天至少要給我投多少,這使他的計算變得很複雜。R有一個詞叫做eCPM——期望千次展示收益。M是一千次可能是幾塊到幾十塊錢,一次就是幾釐,說起來很彆扭。eCPM是廣告系統最想要優化的指標,提高R,降低Q。降低Q對於大多數的廣告主來說不是一個核心任務。只有在DSP裏面,Q纔是可以優化的,有一個出價策略的問題,大多數的產品主要是優化R。廣告的過程也很簡單,但是也很重要,我們從廣告的展示頁,首先用戶如果對他發生興趣,發生一次點擊,他在鏈接頁上進行更復雜的操作,他如果想要這個東西,他會到轉化頁下單。點擊的過程是發生在媒體上的,新浪上投的廣告,點擊是發生在新浪上,轉化的過程是發生在廣告主站內,點擊和轉化兩個量發生在不同的媒體,這產生了一個有意思的分工,這一次點擊到了廣告主站內以後,他平均能夠給廣告主帶來多少錢。這兩個量的分解,決定了我們廣告的很多有意思的付費模式。

我重點跟大家講講廣告產品的發展過程,讓大家瞭解一下數據在廣告業務裏發展的核心動力作用。在廣告行業裏,我們的生產力是越來越多越精細的數據要用到廣告產品的交易過程中。由於我們要用數據,我們在不斷的變,才產生了現在非常複雜的產品形態。左上角幾個灰色的我們叫做合約廣告,合約廣告是從線下廣告直接演化而來的,線下的廣告以雜誌舉例,雜誌每期給你開一個位置,讓你填上廣告合同,這一期開你的,你給我多少錢。線上最早的時候也是這種方式,最早做這種廣告的還是雅虎,當時最大的門戶有一個叫做美國在線,美國在線跟雅虎是不一樣的,美國在線當時是收費的,雅虎是免費的,不掙錢,雅虎就開出一個欄,當時是叫刊例價,你投在我這個位置上,投一天或者投幾個小時多少錢,籤一個合同,簽完了我們就執行,這是最原始的方式。前面講的數據變現的模式用不了,因爲你把刊例的位置給一家放在那兒,他一定不是一個高效的模式,其實這種方式叫CPT,按照時間來付費的廣告模式。它主流存在的時間並不是很長,很快進化到展示量合約的模式,展示量和約就是要用到我前面講的數據量變現的模式。我把流量分成男女兩部分分別收買。希望大家掌握一些商業產品設計和運營的思路。

我一旦把修兩分成男女在賣的時候就有一個問題了,你說你這裏面一半是男的,一半是女的,這可不一定,比如說你是一個汽車網站,你九成都是男性,只有一成女性,你要告訴我,你應該給我投放多少次女性的廣告。那個位置都給我,我可以僱公司來檢查。但是你現在說女性給我,我沒有辦法檢查,我只能要求你給我一個量的保證。我只能把展示量加在裏面,這種叫展示量和約。在這兒產生了廣告領域第一個里程碑式的技術和產生,我把人分成產品了,可以說也是一個根本性的變化,根本人羣來售賣,售賣的標誌已經變成人羣了,不再是位置了。位置也只是一個載體。他讓廣告的售賣方式也發生變化,廣告售賣方式要適用數據的使用,不得不發生變化。

這個變化進一步發展你會遇到問題,如果我希望用特別精細的數據來變現。我常舉的例子是母嬰人羣,我們定義女性裏面孩子在負一歲到正二歲之間的女性產品。他的變現價值高,因爲這部分女性購物上呈現出全天侯且非理性的狀態,我深有體會,因爲我有兩個孩子。我多賣20%,這部分人羣單價可能比正常人要高三四倍,我希望把他單拿出來賣。可是單拿出來有一個小問題,這部分人的量很少,有兩重原因,第一重是確實量就不多,第二,我知道的不多。這部分人是母親,我不一定知道,我知道是母親的就那一點人,那一點人我單籤一個合同,我會發現合同執行不了。因爲那個量很小,就意味着不穩定。對原來的售賣構成挑戰,雅虎現在的技術都解決不了這個問題,所以他的廣告主一千到兩千就上限不了了。還有一種方式是搜索,搜索的標的物是關鍵字,有的恨不得三個月來一次展示,你賣是不賣。

這兩方面的要求需要有一種新的售賣模式,這種售賣模式就是我們真正廣告產品上一個里程碑式變化:競價廣告。把定價權交給需求方,原來的定價權是供給方的。競價的方式是這個東西你出多少錢,誰出的錢高,這個展示就給誰。數據交易將來關鍵的走勢也在於定價權向需求方轉移,我不跟你約定你拿不拿得到,你自己出價,拿到算你的。這樣把整個市場盤活了,大量的中小企業主涌入到這個裏面。

繼續發展,又發展成現在的實時競價廣告,或者是程序化交易。這個詞現在很火,它是最新的廣告售賣模式,它的本質還是希望數據進入到市場裏面,是第一方數據,第一方是指廣告主。前面我們說的那麼多數據,母嬰也好,都是供給方給的定義,但是會有一些定義,比如說京東,我的流失用戶這是我自己的定義,別人沒有任何能力給我定義,因爲你沒有這個數據,前兩個月來過京東,現在不來了,谷歌的數據再強你也不會知道。我希望用我的數據來影響我的營銷。這種數據的價值是極高的,甚至遠遠超過第二方數據的價值。要想這種數據用起來,交易過程中,我沒有辦法預先開出來這樣一個數據的展示讓你來買。現在大家認爲比較先進的合理的模式就是程序化的模式,我實時問你,我這裏有一次展示的機會,在這個展示即將發生的那一刻,我把請求送到京東的服務器,問你一下,你要不要這次廣告展示機會,你如果要,你自己定一個價格傳給我,仍然是需求方定價。除了定價以外,把這個選擇的機會也都交給了需求方。這盤活了很多東西,比如說今天的數據交易,如果沒有需求方選擇模式,數據交易量沒有這麼大,數據交易是程序交易規模化運轉起來以後,才成爲一個選擇。

上面這個框是廣告交易,下面這個框是數據加工和交易,但是下面這個是廣告市場重要的支撐,我呼籲大家,如果你對數據感興趣,對大數據的價值和交易感興趣,廣告裏面的產品你是不能忽視的。因爲這裏面你確實已經做過很多東西了。它遠遠先進於其他行業所做的廣告交易。

在這兒解釋一下三方數據的概念,廣告平臺是第一方,廣告主是第二方,其他的不跟廣告關係的是第三方。

廣告系統是一個典型的個性化系統,它由一個在線的投放引擎,一個分佈式計算平臺,分佈式計算平臺現在我們一般用的是Hadoop,對於大量的海量的數據,我要對十億的Cookie,歷史上三個月的數據做一次很淺的分析和挖掘,像這樣大規模的數據,現在Hadoop仍然是唯一的選擇,用spark也做不了,spark適合中等建模。他們兩個長期共存,各有各的優勢。機器性能越來越好,spark的能力越來越強,數據增長的速度比機器性能增長的速度還要快。流計算我們會用到,它的功能跟分佈式計算平臺是一樣的,一個處理長時,一個處理短時的。

我們這個系統數據都是環形流動,我們儘量避免單點、高在線的同時讀寫。跟線上打交道的所有環節應該沒有關係型數據庫。你可以看出一個真正的大數據系統跟傳統的商業智能和數據挖掘不一樣的,我們儘量避免碰數據庫,如果你線上系統發生了與數據庫的數據交換,你一定不是一個自由體,一定是不太對的。他一定是更輕量級的,吞吐量更高的、容錯量稍微高一點的系統來實現。

數據交易是很有意思的一個問題,國內最近有兩個數據交易所,一個是貴陽交易所、一個是長江交易所,我也關注了他們做的事情,我覺得很好,讓大家認識到數據的價值,並且想辦法用商業化的方式來運作數據,因爲如果你不以商業化的方式來運作,這個數據很難用起來。可是我又看到他們在交易機制上的設計,或者他們對交易數據的理解,跟我認爲的大家的狀態有一點距離。數據交易應該是什麼樣的?它關鍵的問題和障礙都在哪?不是說現在廣告市場對數據的認識就完善了,其實有很多問題還沒有解決,這些問題是什麼?我把總結成三個定律,也是我的看法。我跟一些業界的人交流過。

第一定律,數據只能交易,不能共享。因爲數據變成錢太容易了,你能夠設想,現在有人在忽悠,百度拿數據拿出來大家共享一下,你還不如說讓李彥宏把他帳戶裏面的錢打給你一部分。但是數據共享在有些層面是發生了,發生的情況有兩種:一種是子公司和母公司之間,比如說搜狗跟騰訊是有數據共享,但是因爲人家都是子公司和母公司,接近控股的狀態。另外,政府的數據可以共享,政府的數據沒有直接盈利、變現的需求,他的數據希望拿出來給大家用。可是我仍然覺得如果政府的數據簡單拿出來共享也不見得是好的模式,還是要用商業化的手段做成轉移支付的辦法。總之我的第一個觀點:數據是不能共享的,只有交易,交換也很難,一定是做價的交換,做價的交換本質上就是交易。

第二定律,數據交易該怎麼做?我看過貴陽和長江做的交易,他們的交易有一個最大的問題,在廣告數據交易裏面碰到過這個問題,並且部分的解決了。數據交易必須要實現部分的交易纔會有真正的市場,我知道全國每一個人的男女,打成一個包拿出去賣,可能有人買,但是買的人會非常少。我就在華東五省投廣告,我買其他省的男女買了對我都是成本。在廣告裏的數據交易比這還進了一步,不僅僅是部分交易,而且是按效果交易。你在Xchange上買了一個廣告位,我贏得了這次廣告位我才交錢,我不贏得這次廣告位我不交錢。這也是把定價權向需求方轉移的過程。我認爲在將來任何一個行業,如果能做到定價權向需求方轉移,這個行業就有機會做大。按照部分數據交易、並且按照效果交易,這是我們在廣告市場裏摸索數據交易得到的共識。上海電信我打過一些交道,他賣了一年數據,我覺得他也賣不下去,他的意思是我這個數據很值錢,我打一個包給你,我只能用上一部分,其他的對我都沒有用。也許今年我這個系統還在開發,今年數據我根本沒有用,也交了一部分錢,這個事情表面上看起來上海電信佔了便宜,但是他是吃了大虧,因爲他沒有真正把數據用起來,更談不上將來用競價的方式獲得更高的收益。

第三定律,怎麼給數據定價?這個問題廣告商也沒有解決好,有解決的方案,但是解決的不好。有一個數據交易平臺叫BLU KIY,4億美金賣給了oracle,它的數據量很大,但是它不怎麼掙錢。後來仔細討論,今年我深入的研究了這個事,我覺得數據的交易跟流量交易不一樣,它反而有點像,比如說你知道一個人是男是女,這個信息你是可以賣給很多人的,你賣給一兩個人、十個人,你會發現他不一樣,你賣給十個人以後這個數據就貶值了。這塊地,有的瓷磚下面有金子,有的瓷磚下面沒有金子。有個人有一個藏寶圖,這個藏寶圖對他來說就是數據。但是我們每個人都知道這個藏寶圖,會發生一個事情,大家都知道這塊地上有金子,大家先來搶這塊地,大家先把這個地價擡高。十個DSP都知道,我都出一個高價去買流量,數據就向流量價值發生了轉移,這是一個理論。我個人的設想,將來數據交易應該是一種限量的,流量本身是限量的,一個流量就是一個人投,不可能三個廣告疊在一起投。但是數據可以賣給很多人,賣的越多越不值錢。能不能把這個量限下來,這個人是母親,一定時間段只讓產生三次或者五次交易,這樣的話有可能解決問題,並且這有一個巨大的好處,這樣有可能讓數據交易也變成一種競價方式。這個母親的信息我只給三個人用,我給哪三個人用,你們自己來競價,最後排的比較高的三個人我給你們用。一旦數據交易能夠變成競價的方式,並且是在這麼細的力度上競價,前提是我們能夠部分交易,整體交易競價也沒有意義。整體交易本身需求就很少,部分交易的基礎上如果能做競價,這個市場才能真正把它的市場打開。

數據定價和交易本身是特別有意思的問題,而且有可能激發一個巨大的市場,而且這些問題工業界都沒有解決,將來大家如果從事大數據,這是很有意思的一個點。

大數據的隱私問題,我發現沒有人明白這個事,交易所還好,他賣的協會數據並不見得很多,隱私問題運營商提一個詞:脫敏。脫敏就是我們這兒對應的第一條:PII,有些信息是你絕對不能用的,因爲有一些信息你賣給他以後,他可以直接接觸到客戶,比如說電話,我直接打給你了,家庭住址、身份證號、姓名,這種信息在我們的原則裏面很早就有A29的原則,不能使用。很多做數據的人理解的脫敏就是把PII去掉,我今天要告訴大家的是,PII去掉解決不了問題。有時候你看到一張表,你看到你們單位的工資表,假設會計把前面的電話、姓名都抹掉了,就剩下下面的幾欄,但是有他的歲數、部門、家庭住址,在公司這個範圍內,你對你熟的人,你看這幾欄,一看就知道是誰,這種信息單拿一欄都沒有辦法定位一個人,但是一組放在一塊,對熟人來說,他可以很清楚的定位一個用戶,這種行爲叫半定位。

隱私的顧慮在於熟人之間的隱私,不在於陌生人之間,我們最在乎的並不是有人把數據庫黑了,把那個東西八毛錢一條往外賣,這件事不是我們今天最大的顧慮,最大的顧慮是對你有一些背景調查的人,在一些環境裏能夠把你的信息定位出來,從而瞭解你更多的隱私信息,這些事情是我們真正的顧慮。脫敏是不能解決這些問題的,而且這個問題是根本無法避免的。對互聯網的用戶來說,他的行爲比前面會計那張表還要麻煩,他的行爲是極爲稀疏的,曾經有一個例子,前兩年微博上傳的一個例子,清華的一個同學是王珞丹的粉絲,他看王珞丹的微博,仔細一條一條分析,他就分析出王珞丹住哪,幾棟樓,幾號。有一個最生動的例子,Netflix推薦大賽,這個大賽很有名,因爲它的獎金很高,它出了一個事,有人對這個比賽感興趣,在數據庫裏看,特別湊巧看到一條記錄,他發現這條記錄是他的一個同事的,因爲那個太清楚了,這個人看過什麼電影,同時給了多少分,你都有這種經歷,你跟你們熟悉的人會經常討論什麼電影好看,評價如何。我們這個屋子和清華大學很難找到兩個人看電影的記錄是一樣的。對於你熟悉的人,你一條一條記錄掃出來,你一定可以把你的朋友對應出來,要不計代價的找到某一個人的隱私的數據,對這種場景,成本不是顧慮。當然這個案例他也是正好碰到了,他把那個數據拿給他的朋友看了。這個同事還有一些影片是沒有跟他溝通過的,那些片子全部是同性戀影片。至少這個同事不希望自己看同性戀影片這個事被其他人知道,這是他的隱私範圍內的,所以他很惱火,他就把Netflix告上了法庭,結論是沒有辦法解決,大家要把它上升到比較模糊的態度去解決,這件事情並不是一定不能解決,也有數學家研究比較前沿的問題,怎麼從數學的角度解決這個問題。在互聯網的稀疏的數據下面,在熟人的前提條件下,隱私在行爲數據裏很容易被破解。他真正的風險在哪?比如說電信把他原始的數據,上海電信就是賣裸數據賣過一年。它的風險在於,假設有一個人不計代價的一條一條看,假如我跟上海某個副市長有仇,我把他的數據一定是能夠找出來,找出來這個副市長有沒有貪腐行爲,不見得發現不了。

總之,告訴大家要有這個認識,隱私真正的顧慮是熟人之間的,不是陌生人之間的。關心你的人,這種關心有可能是負面的,有可能是正面的。這種人對你的影響最大,由於他可以不計成本,並且由於互聯網的行爲數據本身是極爲稀疏的,基本上沒有任何兩個人一樣,所以他的風險是很大的。而這種風險在今天來看是被低估了,因爲沒有出現哪個副市長因爲這事被抓起來,將來他一旦出事,一定是有大事的。總之我的一個判斷,隱私現在來看是大數據頭上的一個達摩克里斯之劍。
大概告訴大家一個觀點,你要想了解數據的變現和數據的交易,瞭解計算廣告是一個必不可少的環節,甚至說是最重要的環節。因爲所有的數據使用的歷史和產品發展的歷史在廣告行業走過一條完整的彎路。你沒有必要再走一遍,後面這半段涉及到數據本身,從我的經驗來看,數據的變現和交易都是有市場基礎的,並且有它的價值所在,但是數據交易本身有很多問題,有的是在廣告市場裏已經得到了驗證和解決的,有的是我們在廣告市場發現問題但沒有解決的,還有一些是隱私問題。
今天借這個機會,我希望以計算廣告作爲一個引子,從這一點希望大家瞭解行爲數據的使用、加工的過程,將來這一定也是我們大數據市場非常重要的一塊。看大家還有什麼問題。

精彩問答
提問:從您剛纔說的整個過程來看,您是不是認爲現在的廣告模式已經到了比較成熟和適合商業化的階段?您個人對將來新的廣告模式可能的突破點在什麼地方?
劉鵬:我那個產品圖我有一半沒有講,現在的廣告產品比較成熟,這句話可以認爲是正確的。因爲它從98年到現在,計算廣告已經發展了快二十年的時間。現在大家認爲對數據已經使用過了,隱私問題我們有很多顧慮。我們忽視了一個問題,我們用數據的理論是我們希望瞭解這個人歷史上看過什麼,對什麼感興趣,但是對用戶現在的場景和情景的把握,在過去的廣告產品裏是不夠的,這就涉及到我們講的原生的概念和新的廣告模式,這在移動上越來越重要。這個我今天沒有時間講,確實,原生是今後一個廣告市場從產品發展的重要模式。把數據和場景結合起來使用。就現在利用數據的廣告模式,從廣告交易到數據交易本身,我覺得是比較穩定、比較成熟的。

提問:我有一些朋友也做過廣告實時競價的事情,聽他們的意思,做這個事情如何能夠確認數據的真實性是一個很大的問題,是使用方在定價,但是他們很多人都無法監督廣告發放者你到底給我發了多少,到底發給誰了。這個事情有沒有進一步解決的可能性?因爲您剛纔說,數據能不能只賣給一部分人,如果這樣做的話,就像電影一樣人爲的提高了這個價格,您最開始的邏輯,因爲數據再賣一份的邊際成本是零,如果我是有流量的人,我免費去賣,這樣才能把我的流量價值擡起來,更符合您一開始說的邏輯的方式。
劉鵬:對於有流量的人來說可能就是這麼想的,數據只要提高流動性,提高流量價值就可以。但是很多數據提供方並不是流量擁有方,這個市場有意思就在於,有廣告需求方、廣告供給方、數據提供方,這些人的利益出發點都是不一樣的,都是博弈的,對於數據提供方來說,不是我們前面說的概念,因爲我們前面說的概念有一個基礎,我這個商品本身是能夠規模化個性化傳播信息的。數據本身已經不再是能繼續傳播信息的能力。所以我覺得數據提供方,數據跟流量的性質是不一樣的,流量我可以搭別的東西,數據並不能再搭別的東西賣。前面實時競價的問題,這跟需求方定價不僅不矛盾,而且恰恰是一致的,首先,展示量的問題是可以監測的,數展示量,數男女這種有確定標準的,人頭屬性流量,這都非常容易監測,而且也有第三方監測公司。其他的標籤,我說這個人是一個體育愛好者,這種標籤有一個特點,你不知道什麼算體育愛好者,我去年打過一次羽毛球算不算,對於這種模糊的標籤恰恰是要用需求方定價的方式來解決,你不用管我這個東西對還是錯,你覺得他對你值多少錢,你覺得我這個東西質量差、摻水,你出低一點的價格,那個人質量好一點,我出高一點的價格。因爲標準上是沒有答案的,不存在哪些人都是體育愛好者,不如說每個人根據自己的需求來,根據你認爲他的價值來定價。數據也是一樣,供給方定價比流量還不靠譜。有的數據對有些人很值錢,對有些人不太值錢,如果都是供給方定價,這個市場很難發展起來。

提問:你剛纔提到原生廣告和情境廣告,現在從一個實際的用戶來看,天貓的、京東的或者在手機上推送的廣告,包括網盟的廣告個性化具體的表現都不是令人滿意的。從你來說,做個性化的分析瓶頸在目前這個階段來看錶現在哪幾個方面?上下文場景數據、情緒數據、情感數據,怎麼採集、怎麼分析?對模型的訓練和效果的提升哪個方面去發力提升效果比較明顯一點?
劉鵬:個性化廣告和原生廣告是兩個緯度的意思。原生,首先希望這個廣告跟內容長的差不多,搜索裏的廣告最典型,搜索裏的廣告和內容長的差不多,很多人分不出來廣告和內容。你在微博和FACEBOOK裏看的廣告也有這種特點。還有一種是情境廣告,用戶當前在幹什麼,如果這一點做到原生,我們叫做意圖原生,搜索表現好在表現和搜索都是原生。過去所有的廣告媒體是不參與的,媒體只是把代碼放一個京東的代碼,他就不管了,月底結賬。淘寶的自然源處理能力去分析頁面裏的上下文,從而得知用戶意圖,這件事情靠譜不靠譜呢?基本上他能分析的東西很淺,深入的東西必須要媒體的參與。媒體怎麼樣重新參與到廣告交易的過程中,提供有價值的上下文信息,如果這件事情能做好,真正符合你的預期的、在你任務裏的廣告就會發生。這是產品和運營體系上的問題,不見得完全是一個技術問題。搜索爲什麼能做到呢?因爲搜索的用戶意圖就是他要搜索的東西。其他的網站裏面用戶意圖也很明確,你通過自然語言處理是分析不出來的。我的看法是讓媒體重新參與到廣告的投放、決策過程中。但是目前有很多產品和運營商的障礙,不是一兩天能發生。淘寶處理能力再強,也不可能投出符合你情境的廣告,必須跟媒體想辦法從數據和運營層面上有一些接口。

提問:我對數據交易比較感興趣,您今天提的競價是很新穎的一個觀點。您能提供一些更細節的考慮分享一下嗎?
劉鵬:考慮蠻簡單的,我的出發點數據交易從BLUKIY的角度來看,是沒有體現它的價值的。數據很大,但是它不掙錢。但是流量的價值往上走,競價更激烈,所以我進一步考慮,數據的交易跟流量交易不同的特點,因爲它可以不限量供應,流量天生就是限量供應。這裏面存在機會。這些說法基本上是我個人的說法,不見得很成熟。可是我認爲,競價這個點是所有人都在往這個方向努力。現在這個時代任何一個行業要想有爆發式成長機會,一定要變成需求方定價和競價的模式,供給方定價模式不可能爆發式成長。這是很開放的問題,你也可以提你的想法,沒有什麼標準答案。
競價有很多問題,但是現在數據市場沒有真正被激發出來,因爲純做數據變現掙不着什麼錢。大家真正的熱情沒有被激發出來。總是要想一個辦法把有數據的人的熱情激發出來,讓他真正掙錢,他才能夠市場發展的快。至於你說的有很多問題,或者將來這個模式比較複雜,我倒不覺得這是障礙。商業產品的市場就是複雜,而且越來越複雜,用戶產品發展的規律是越來越簡單,給懶人用,商業產品的規律就是越來越複雜,因爲他的目標很清楚,就是優化利潤。只要利潤提升1%,我的系統多複雜一倍都沒有關係。

提問:我是來自華陽民衆的,我也是這個行業裏面從業者之一。我們現在也在跟BAT談數據的設想,我感興趣的是360這一塊對數據變現和數據開放的思路是什麼樣的?
劉鵬:我們公司跟BAT是有點像,或者更保守,基本上是沒有數據變現的需求。這個事情首先也變不了錢,你現在這種方式其實掙不了錢。首先BAT也不可能拿這個變現,他變現了也掙不了多少錢。公司的態度,不會說這是有一條產品線來做這個事情。
提問:阿里都是電商的數據,都是效果的數據,他自己本身的流量池也非常大,阿里媽媽的整合,整合流量的變現,包括對品牌廣告主的開放。
劉鵬:他開放有一個前提,他必須是這些廣告主的落地在淘內。

提問:至少數據變現的價值增值,數據競價的問題,如果流量被競價,數據的價值也就被競價了,至少他自己本身淘內和體系內的流量的價值也會變大。在這裏面加成的效果,他變現的體量也不會小,至少他現在一家一家的品牌廣告主在談,越來越多的廣告主在天貓開體驗點,或者有自己陣地的品牌商越來越多了,這個流量消化在自己體系內,對他是價值不菲的。
劉鵬:原來阿里幾任負責DSP的人也都比較熟,因爲各個部門的利益是有博弈的,未必數據部門的利益一定跟公司戰略是一致的,我在裏面看到很多的博弈。首先阿里現在用數據的方式還談不到數據變現,更多還是用數據去提升他內部的投放。因爲你在阿里投,阿里知道每一個cookie男女,你並沒有圖,跟你在百度選關鍵字是一個道理,你必須在他封閉的體系內消化掉,你不能把你男女的cookie帶出來。這跟數據交易和變現是兩回事,還是傳統的封閉體系的話題。

提問:現在一有一個嘗試,拿出電信的數據做變現的嘗試。這個就不僅僅是在阿里體系內。這個事實擬稿怎麼看?
劉鵬:我首先要提醒他們隱私,因爲他們都不懂。他們老跟我們說脫敏,脫敏是石器時代的觀念,不是互聯網時代大家對隱私的認識。出了大事是他們電信領導都兜不住的事。電信數據所有互聯網公司都沒有他強,第二,跨屏的數據,電信運營商對行爲數據的掌控力在弱化。百度改CBS了,電信就拿不到百度的數據了,淘寶也要改CBS了,都改了之後,電信就拿不到了。但是這是遲早的事情。BAT在高價值業務上HP改CBS的事情是遲早的事情,所以我不是特別看好他們在行爲數據方面長期的價值,但是地理位置和跨屏是他們天然的優勢。

提問:剛纔您說到一個例子,有一個黃金埋在這兒十個人知道,它的價值變弱了,同樣的數據對每個行業的人價值不一樣。這個數據對這家公司產生先到先得的效益,對於不同的行業會產生不同的效益。所以我認爲數據開放可能會不同行業的拉鋸會產生各個行業的應用。
劉鵬:您說的是哪類的數據?如果是行業數據在廣告行業也沒有太多的東西可以參考,可以單獨的摸索和探討。
正因爲數據對不同的使用方的作用和效果是不一樣的,最終我堅信一定要走向需求方定價,供給方定價永遠都解決不了這個問題。

提問:現在在各大應用市場上有專業的廣告傳播平臺,他既可以給廣告主發佈,也可以一鍵轉發,用多種傳播的渠道平臺一鍵託管的方式,這樣的話對廣告主也有預算,傳播費用在平臺上是透明的。對於用戶來說,廣告主可以把用戶閱讀自己定價,方便用戶來傳播,用戶看到這個廣告,覺得他值得傳播,他就產品。
劉鵬:這種叫激勵類的廣告,積分牆之類的。這種廣告傳播的效果要打折扣,雖然它的傳播量很大。比如說積分牆,你玩遊戲,讓你下一個,得多少分,但是你下了以後馬上就得刪了,這是一個很大的廣告市場,但是它的價格比較低,積分牆是正常廣告價格的五分之一以下,同樣的一個安裝,因爲它的後期效果很大。一些大的手機廠商,蘋果對這個打擊很厲害,主要它影響榜單的排名。這類廣告總體上是在走下坡路。因爲它有點違反本質的規律,你是用激勵的方法在傳播。

提問:APP上廣告主投放廣告,激勵用戶幫助他們傳播。
劉鵬:我正常買一個CPM的價格是10塊錢,投這種廣告他們只能給兩塊錢。

提問:我對廣告的監測和追蹤很感興趣,大的廣告公司和網盟公司都有自己的監測中心,第三方獨立的監測和追蹤系統在這個行業裏面發展的趨勢怎麼樣?
劉鵬:監測和跟蹤,看監測什麼東西,廣告是展示、點擊、轉化。點擊不需要監測,轉化是需要檢索的,主要是移動應用下載,移動應用下載要溯源,他比較複雜,轉化的監測也是由第三方公司提供。國際上都是按照一次點擊多少錢。FLAS、MAT等等幾個公司在做這個。展示是在人家的網站,你不知道,你要委託一個第三方來做檢測。展示付費你才需要檢測,如果你按點擊收費就不需要間。CPM付費大部分是品牌廣告,品牌廣告纔有監測的需求,大多數效果廣告沒有曝光監測的需求。這個市場你可以計算一下,假設品牌廣告的預算一百億,會有1%的錢交給監測廠商,這個市場就是一億,總體的市場不大。轉化監測也不是很大,監測本身不是一個特別大的市場。

提問:比如說You Tube一上來放廣告,然後給你一個按紐就可以關了,但是國內的廣告他就一直放,一直放五分鐘,這兩種方式哪種是對的?
劉鵬:我當然認爲You Tube的方式是對的,如果他放五秒你就關了,你對他產生的效果不大,他放五分鐘對你的效果仍然不大,你可能去幹別的了。國內的市場是劣幣驅逐良幣的市場。他由於對廣告主,我承諾了多少量給你,我不得不去完成,爲了充這個量,插進來一些低質量的量。廣告主會進一步調低他的單價,我再參更多低質量的,變成了惡性循環。我賣一個iPhone你給我一百塊錢,我跟你說它什麼都能幹,你就買了,我得了一百塊錢。但是賣完了以後的售後服務不是我負責了。我個人傾向於You tube的方式,國外一般都是這種方式。

提問:注意到您說的數據交易,您提到了兩個交易所,一個是貴陽,一個是長江,現在數據交易不掙錢,而且量也比較少,現在這種交易所有盈利的能力嗎?對於交易所未來的發展方向應該是什麼樣的?
劉鵬:交易所的盈利能力,關於行爲數據的交易,如果按照這種交易方式,就是不work,按照貴陽的方法。如果是統計數據或者其他數據,那跟賣報告是一樣的。統計各個縣的什麼情況。至於怎麼發展,特別是行爲數據的交易,不管是標籤還是更細的數據,一定要結合在具體的數據應用上做交易纔有可能快速的發展。這個廣告市場做的很好,因爲數據交易都附着在廣告上,他沒有獨立的數據交易,Xchange,你買的數據是廣告直接帶過來的,而且所有的過程都是順的,一定要附着在具體的應用上去設計交易模式。純粹的數據交易很難解決部分交易的問題,很難解決按效果交易的問題。更談不上競價的方法。

提問:第一,個性化推薦和計算廣告的區別點在哪裏?第二,關係型數據庫,來做這種廣告投放平臺,根據它的計算模式應該採用什麼樣的分佈式計算系統?第三,這個計算平臺,針對計算廣告學這個特定的業務和狀態,怎麼樣來設計一個能夠支持他這種有限的條件的模式下,他的整個過程追蹤和快速計算、實時處理的平臺架構,應該在哪些點上考慮的比較多一些?
劉鵬:第一,推薦和廣告的區別,廣告的核心引擎跟推薦是差不多的,廣告最大的區別是多了一個預算和量的保證。推薦是很多很多的利益博弈,推薦是一個遊戲,廣告真的是市場,市場就涉及到機制,這是推薦裏面沒有的。如果僅僅是排序、檢索算法,兩者是非常相似的,但是宏觀的設計和保證下的優化是有非常大的差別。
第二,我說的主要是線上不適合用關係型數據庫,線下還是可以用的。你有一個sever,sever在做決策的時候不適合做計算,你算的空間很小。如果再有關係型數據庫,基本上你的成本很高,而且效率一定不是最高的。關係型數據庫就是準,一致性高,一致性高對廣告來說無所謂,我有一千次展示,有一次算錯了沒有關係。
第三,這兒也說不清楚,你要有興趣可以看看我書裏講的東西,基本上對框架有介紹,這個在業界來說相對成熟一點。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章