專訪馬維英

回溯人類歷史發展的長河,人與人之間的交流、信息的創造和傳播是人類文明誕生的基礎。幾千年過去了,從文字到圖片,從語音、音樂,再到視頻,信息的表達和傳播的形式在不斷擴展,也日益豐富。那麼,在當下,人們如何用更智能的方式表達和傳播內容?未來是否會誕生前所未見的新的表現形式?作爲字節跳動這樣的平臺,如何用人工智能(AI)賦予創造者新的能力?






技術革新推動信息創作與交流的演進


互聯網和移動互聯網的發展,帶來了大數據的革命,也直接推動了人工智能技術的發展。在人工智能技術的賦能下,人類的創作和交流也呈現出個性化、社交化和“無所不在化”的特徵。在萬物互聯時代,人類可以隨時隨地獲取信息,進行內容的創作與交流,隨着創作門檻的不斷降低和創作主體的持續擴大,在人工智能的輔助下,每個人都將成爲創作者。


人工智能可以根據大量數據樣本進行訓練和學習。文字、圖片、視頻、直播,都是可供AI不斷挖掘的材料。不難預測,在未來超級智能時代到來之際,人可以指導機器進行學習,在交互過程中爲機器提供更多的學習樣本;機器也會通過學習變得愈發智能,從而幫助人類進行更高效的交流。


字節跳動的產品“今日頭條”,正是基於人工智能推薦,幫助,使人們高效獲取信息的實例。今日頭條建立了一種全新的人與信息的連接方式,即用分佈式學習去理解人和內容的特徵,利用排序算法,將合適的內容推送給感興趣的人,完成個性化精準推薦,從而打造千人千面的信息分發平臺,讓用戶能夠隨時隨地獲取所需信息(如圖1 所示)



當今人與信息的連接主要有以下四種方式(見圖2):



1. 推薦。推薦分發是人被動接收信息的過程。系統像助理一樣,觀察人的行爲,包括人對信息類型、來源、使用時間段、閱讀方式等的偏好。


2. 搜索。一種主動獲取信息的行爲,與推薦的方式相輔相成,都是重要的信息獲取方式。


3. 語音交互。新一代的語音交互功能可以通過語言的理解和識別,幫助人找尋所需的信息,並且完成相應的任務。


4. 社交/社羣。社交圈傳播,社羣和社交也是人與信息連接的重要方式。


短視頻爆發背後的技術賦能


近兩年,短視頻成爲全球最受歡迎的信息生產與消費形式。尤其年輕人,特別喜歡用短視頻來表達個性,分享他(她)們的經驗、故事,與親友交流。其實短視頻創作的背後,是移動互聯網的發展以及人工智能技術的賦能。


視頻需要編解碼,上傳與下載都需要很大的帶寬。移動互聯網的發展爲短視頻提供了必要條件,使得大規模上傳與下載視頻內容成爲可能。短視頻能夠爆發的另一個必要條件是移動端智能編輯工具的出現。手機端的智能編輯工具包括計算機視覺及智能語音系統,但又不限於此。它們賦予每個人更強的創作能力。人工智能讓編輯工具更加小巧、輕便,成本更低,實用性更強,使得短視頻可以快速而大量地生產。


以我們熟悉的短視頻產品“抖音”爲例,背後就有大量AI技術提供支撐。首先,短視頻內容的審覈。由於抖音是共享的開放平臺,國內日活躍量超過2億,每天有大量的視頻內容上傳。爲此,我們一直利用AI技術,理解視頻內容、進行版權識別、過濾有害和低俗內容,並且不斷地迭代和完善機器學習模型,從而輔助人工審覈。


其次,在動作的理解、物體檢測跟蹤、視頻環境識別、情感與情緒識別等方面,均可以通過大量學習後,使AI達到與人的判斷相當的程度。在此基礎上,可以識別視頻特徵,獲得更加準確的視頻搜索結果;可以結合用戶特徵,更加精準地推薦視頻內容;可以預測視頻受歡迎的程度等。


最後,利用AI技術,抖音還可以進行人臉識別和關鍵點檢測,爲用戶提供好玩的創意濾鏡、美妝特效(如圖3所示),輔助創作。類似的技術也用於人體的關鍵點檢測,通過手機端模型分析,捕捉和識別人體的動作姿態,基於這一技術實現的抖音“尬舞機”等功能頗受用戶喜愛。這項技術的另一個應用是短視頻美體功能,通過關鍵點檢測技術定位人體的五官和肢體關節,在此基礎上變化人體的形狀,實現如瘦臉、大眼、長腿、瘦腰等效果(如圖4所示)。




智能機器人創作與AI輔助審覈


除了應用於短視頻產品,人工智能技術還通過字節跳動的多款產品賦能信息創作與交流的各個環節。


利用機器學習進行智能寫作,可以提升信息的創作效率。以xiaomingbot(小明)寫作機器人爲例,在體育賽事寫作方面,小明的效率和產量遠高於人類作者。對於每場比賽,小明可以實時進行視頻分析和理解,同時對公開渠道的文字描述和圖片進行解析和整合,最終在數秒內生成包含圖文的稿件內容,並及時發佈。這項研究獲得了吳文俊人工智能科學技術獎1


我們以2018年俄羅斯世界盃上日本和比利時的比賽爲例介紹小明的寫作原理。小明根據出場球員生成對應的身份文字,在關鍵節點追蹤人物的行爲動作,包括球員在場上的位置,識別球員是否傳球、射門、進球及裁判裁決情況(見圖5)。在創作稿件的過程中,小明可以對視頻內容進行深度理解,結合網絡公開信息生成摘要,並且選出最好的圖片作爲新聞封面和插圖。稿件完成後,通過機器翻譯將稿件內容譯成葡萄牙語、英語、法語等。智能算法會根據讀者的興趣進行精準推送,把稿件分發給感興趣的讀者,從而讓信息更快速有效地滿足世界各國用戶的需要。

鄭州專業不孕不育醫院:http://jbk.39.net/yiyuanzaixian/zztjyy/

  鄭州不孕不育醫院×××:http://jbk.39.net/yiyuanzaixian/zztjyy/





AI服務人類


與歷次的工業革命一樣,進入人工智能時代是人類文明的進步。而技術進步的最終落腳點應該是服務於人類生產和生活,因此,我們不僅要鑽研技術本身,更要注重利用技術來解決現實社會中的問題。


我們將人工智能技術與產品功能相結合,積極服務於公益。“頭條尋人”項目致力於幫助尋找走失人羣,以走失地點爲圓心,行走速度和走失時間的乘積爲半徑,畫一個圓,可以表示出可能的走失範圍(如圖6所示)。我們利用地理位置等信息,在預估的走失範圍內推送尋人信息,實現了每條信息的精準地理範圍覆蓋和人羣觸達,從而提高了尋人的成功率。截至2018年9月13日,近兩年半的時間內,“頭條尋人”彈窗發佈了49581例尋人啓事,成功尋回7254名走失者,尋回率達到14.63%。9月底,我們也嘗試了把尋人與視頻載體相結合:運用自動生成視頻的技術,輸入一條文字版的尋人信息,不到10秒的時間,即可自動生成抖音尋人視頻。頭條尋人和抖音尋人都是利用AI技術促進信息交流,進而服務公益的產品實踐。




我們也在利用AI技術助力教育和精準扶貧。“益童樂園”在貴州起航,“鄉村AI教室”全面建成,我們希望讓貧困地區的孩子也接受到良好的教育。


字節跳動的願景


基於上述嘗試與努力,字節跳動的願景也在逐步實現——建設全球創作與交流平臺。公司從成立至今,六年多的時間內,我們的產品和服務已經覆蓋了150多個國家和地區、75個語種。產品和行業快速發展的背後是人工智能技術,是科技和創新在推動全球化的進程。


未來,字節跳動也將基於旗下產品豐富的應用場景和全球數億活躍用戶,持續積累數據和模型,潛心鑽研技術和算法,不斷改善和迭代核心技術,爲中國人工智能的發展貢獻一份力量。 





發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章