原创 數據治理與大模型一體化實踐

引言: 大模型落地到當前這個階段,核心關注點還是領域大模型,而領域大模型落地的前提在於兩點:需求端,對當前應用的降本增效以及新應用的探索;供給端,訓練技術已經有較高的成熟度。 專家介紹: 柏海峯 滴普科技 Deepexi產品線總裁 負責企業

原创 降本不增“笑”的正確打開方式

引言: 在當前行業形勢下,降本增效已經是公認的命題,粗放擴張的時代已經過去,接下來是在從業務到技術都需要精細化管理的時代。但在這個命題下,往往未被提及的一點是用戶價值。如果爲了降本增效,而犧牲了用戶價值,激烈競爭下,企業是否還能留住用戶?

原创 基於知識圖譜的多模內容創作技術

導讀: 由於大數據時代的發展,知識呈指數級增長,而知識圖譜技術又在近年來逐步火熱,因此誕生了利用知識圖譜技術進行智能創作的新想法。本文將分享基於知識圖譜的多模內容創作技術及應用。主要包括以下四大部分: 百度知識圖譜概覽 百度智能創作全景

原创 京東零售大數據雲原生平臺化實踐

導讀: 今天爲大家介紹京東零售大數據的雲原生平臺化實踐,主要包括以下幾大方面內容: 雲原生的定義和理解 雲原生相關技術的演化 京東大數據在雲原生平臺化上的實踐 雲原生應用平臺的發展 分享嘉賓:劉仲偉 京東 架構師 編輯

原创 未來數據庫需要關心的硬核創新

分享嘉賓:劉冰冰 亞馬遜雲科技 編輯整理:張了了 聚水潭 出品平臺:DataFunTalk 導讀:數據庫經過了幾十年的發展,目前已經是一項非常成熟的技術,然而隨着當今互聯網的極速增長,我們進入到雲時代,企業亟需構建現代化的應用,因此數據庫

原创 美團大腦百億級知識圖譜的構建及應用進展

分享嘉賓:張鴻志博士 美團 算法專家 編輯整理:廖媛媛 美的集團 出品平臺:DataFunTalk 導讀:美團作爲中國最大的在線本地生活服務平臺,連接着數億用戶和數千萬商戶,其背後蘊含着豐富的與日常生活相關的知識。美團知識圖譜團隊從201

原创 翟佳:高可用、強一致、低延遲——BookKeeper的存儲實現

分享嘉賓:翟佳 StreamNative 聯合創始人 編輯整理:張曉偉 美團點評 出品平臺:DataFunTalk 導讀:多數讀者們瞭解BookKeeper是通過Pulsar,實際上BookKeeper在數據庫和存儲場景都有着非常廣泛的應

原创 管正雄:基於預訓練模型、智能運維的QA生成算法落地

分享嘉賓:管正雄 阿里雲 高級算法工程師 出品平臺:DataFunTalk 導讀:面對海量的用戶問題,有限的支持人員該如何高效服務好用戶?智能QA生成模型給業務帶來的提效以及如何高效地構建算法服務,爲業務提供支持。本文將介紹:阿里雲計算平

原创 雲娜:從計算、存儲角度,談網易數據治理工具產品實踐

導讀:在公司內部,業務線經常面臨數據有哪些、質量如何、是否可用、能產生多大價值的困惑,並且,隨着數據量的增加,計算和存儲資源面臨瓶頸。本次將圍繞數據治理重點關注的計算、存儲等方面,分享數據治理的產品實踐。通過分享,一方面可以瞭解當前業務線主

原创 牛亞男:基於多Domain多任務學習框架和Transformer,搭建快精排模型

導讀: 本文主要介紹了快手的精排模型實踐,包括快手的推薦系統,以及結合快手業務展開的各種模型實戰和探索,全文圍繞以下幾大方面展開: 快手推薦系統 CTR模型——PPNet 多domain多任務學習框架 短期行爲序列建模 長期行爲序列建

原创 騰訊葉聰:朋友圈爆款背後的計算機視覺技術與應用

分享嘉賓:葉聰 騰訊 技術專家 編輯整理:張智躍 內容來源:DataFun AI Talk「智能技術前沿實踐分享」 出品社區:DataFun 導讀: 本次分享系統介紹計算機視覺的基礎知識,如何利用這些識別算法實現一個應用,同時進行部署、推

原创 京東張政:內容理解在廣告場景下的實踐和探索

分享嘉賓:張政 京東 算法工程師 編輯整理:AMS 周金星 出品平臺:DataFunTalk 導讀: 內容生態建設是近幾年互聯網快速發展的關鍵動因,也是AI化的重點方向之一。本文主要分享在京東廣告業務下內容理解體系的建設情況,從標籤化、內

原创 李呈祥:bilibili在湖倉一體查詢加速上的實踐與探索

導讀: 本文主要介紹嗶哩嗶哩在數據湖與數據倉庫一體架構下,探索查詢加速以及索引增強的一些實踐。主要內容包括: 什麼是湖倉一體架構 嗶哩嗶哩目前的湖倉一體架構 湖倉一體架構下,數據的排序組織優化 湖倉一體架構下,索引增強與優化的實踐探索

原创 蔣鴻翔:網易數據基礎平臺建設

導讀: 首先簡單介紹一下網易杭州研究院情況簡介,如下圖所示: 我們公司主要從事平臺技術開發和建設方面,工作的重點方向主要在解決用戶在數據治理中的各種問題,讓用戶能更高效地管理自己的數據,進而產生更大的價值,比如如何整合現有功能流程,節

原创 陳宏智:字節跳動自研萬億級圖數據庫ByteGraph及其應用與挑戰

導讀: 作爲一種基礎的數據結構,圖數據的應用場景無處不在,如社交、風控、搜廣推、生物信息學中的蛋白質分析等。如何高效地對海量的圖數據進行存儲、查詢、計算及分析,是當前業界熱門的方向。本文將介紹字節跳動自研的圖數據庫ByteGraph及其