为什么人人网不做“分享”内容的搜索？

原創

2020-07-01 09:23

用得多了人人网的人会发现自己每天分享的东西特别多，可是有一天突然想起自己曾经分享过的某个东西，却很难找，因为那个极有可能是自己几个月前分享的，这就麻烦了，我一个月的分享量极大，怎么一个一个的找啊，真麻烦！

那为什么人人网不做这个功能呢？

其实回答很简单：做不了！

这种查询对于人人网来说太难了，也许只知道一点点sql知识的人会以为，这有什么难的，以主题的形式，like查询一下不就行了嘛？

哎，何止那么简单啊。

要知道一个查询所牵动的是操作啊：

首先要选择某个UserId, 下面对应的ShareId联合表；

而后将这个Id放到分布式数据库中去查找；

而后将找到的一些列的进行like匹配。

这貌似就是几张表的操作，为什么在UGC网站就无法实现呢？问题就出在数据量：

--------------------------------

对于大型的SNS网站，每天用户产生海量的用户动态，比如目前Facebook每天处理10TB的数据，Twitter每天处理7TB，同时这些数据量每天都在增长。

-------------------------

这些数据的总和被检索的代价是相当大的！

所以，这也是没有办法的事情，哎~

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

好消息！DolphinScheduler官网集成LLM模型问答AI kapa.ai

不少小夥伴可能發現了，Apache DolphinScheduler官網最近默默上線了kapa.ai作爲LLM的問答AI。集成kapa.ai之後，社區用戶可以點擊Apache DolphinScheduler官網首頁右下角的「Ask A

2024-05-28 21:22:12

记一次攻防演练中的若依（thymeleaf 模板注入）getshell

記一次攻防演練中幸運的從若依弱口令到後臺getshell的過程和分析。 0x01 漏洞發現首先，我會先把目標的二級域名拿去使用搜索引擎來搜索收集到包含這個目標二級域名的三級域名或者四級域名的網站。這樣子可以快速的定位到你所要測試的漏洞

2024-05-27 23:16:06

一道算法题聊透矩阵动态规划

背景 23年某司代碼大賽編程題出了一道很經典矩陣動態規劃題，雖然本人使用(蠻力)循環法解出，但代碼效率不高，在“請教”了搜索引擎之後，發現此題設計非常巧，要想高效地解決此問題，多種優化算法，故此總結之。題目內容給出倉儲區的地圖war

2024-05-23 11:10:24

MySQL全文索引源码剖析之Insert语句执行过程

本文分享自華爲雲社區《MySQL全文索引源碼剖析之Insert語句執行過程》，作者：GaussDB 數據庫。 1. 背景介紹全文索引是信息檢索領域的一種常用的技術手段，用於全文搜索問題，即根據單詞，搜索包含該單詞的文檔，比如在瀏覽器

2024-05-20 10:59:15

突破目标网站的反爬虫机制：Selenium策略分析

在當今信息爆炸的互聯網時代，獲取數據變得越來越重要，而網絡爬蟲成爲了一種常見的數據獲取工具。然而，隨着各大網站加強反爬蟲技術，爬蟲程序面臨着越來越多的挑戰。本文將以爬取百度搜索結果爲例，介紹如何使用Selenium結合一系列策略來突破目標

2024-05-16 00:10:51

单场奖金池20万！百度智能云“千帆杯”教育生态行业赛邀你报名

自2024年百度智能雲“千帆杯”AI原生應用創意挑戰賽啓動以來，廣受開發者關注，更有百萬獎金激勵、千萬算力支持。 4月25日，百度智能雲攜手頭部高校、知名教育企業等多家單位，聯合發起千帆杯AI原生應用創意挑戰賽——教育生態行業賽，

百度開發者中心

2024-05-08 23:38:06

京东如何实现IT降本增效？—监控与FinOps和OpsGPT的落地和思考

“因爲我們做了提效，說白了就是提升大家的人力，計算出來，如果提升有30%，能給部門就能節省800多萬的工時的價值，能推廣起來。” （許澤明：Zabbix3.4-6.0操作文檔譯者，多次Zabbix中國峯會講師。本文整理自許澤明在2

2024-05-08 22:17:58

数据库索引算法的威力：B-Tree 与 Hash 索引

數據庫索引是優化任何數據庫系統性能的關鍵組成部分。如果沒有有效的索引，您的數據庫查詢可能會變得緩慢且低效，從而導致用戶體驗不佳並降低生產力。在這篇文章中，我們將探討創建和使用數據庫索引的一些最佳實踐。作者：The Java Trail

2024-05-07 23:20:49

RAG 修炼手册｜揭秘 RAG 时代的新向量数据库

隨着對大型模型應用探索的深入，檢索增強生成技術（Retrieval-Augmented Generation）受到了廣泛關注，並被應用於各種場景，如知識庫問答、法律顧問、學習助手、網站機器人等。不過，有很多朋友對於向量數據庫和 RAG 的

2024-05-07 21:20:19

倒排索引关键点普及

倒排索引倒排索引是什麼？爲什麼es、hbase、doris、starrocks都有倒排索引？倒排索引（英文：Inverted Index），是一種索引方法，常被用於全文檢索系統中的一種單詞文檔映射結構。現代搜索引擎絕大多數的索引都是基

2024-03-21 00:14:06

用户案例｜向量引擎在携程酒店搜索中的应用场景和探索

加入 Zilliz AI 初創計劃 Zilliz AI 初創計劃是面向 AI 初創企業推出的一項扶持計劃，預計提供總計 1000 萬元的 Zilliz Cloud 抵扣金，致力於幫助 AI

2024-03-15 15:54:11

2024 年，向量数据库的性能卷到什么程度了？

本文作者爲 Zilliz 首席工程師 Alexandr Guzhva、Zilliz 首席工程師劉力對於數據庫（尤其是向量數據庫）而言，“性能”是一個十分關鍵的指標，其用於衡量數據庫是否能夠在有限資源內，高效處理大量用戶請求。對於向量數據

2024-02-22 21:27:05

“AI换脸”色情视频困扰英国，6成女性担心成受害者

AI換臉，也稱爲“深度僞造”（Deepfake），是一種利用人工智能技術將人臉替換到另一個人的臉部上的技術。“深度僞造”技術涉及多種技術和算法，可以生成非常逼真的圖像或視頻。將“深度僞造”的虛假內容與真實信息的元素拼湊在一起，就可以用於可以

2024-04-09 23:33:10

Puppeteer实战案例：自动化抓取社交媒体上的媒体资源

在當今數字化時代，社交媒體已成爲人們獲取信息、分享生活和進行商業推廣的重要平臺。隨着社交媒體內容的爆炸性增長，自動化抓取社交媒體上的媒體資源變得尤爲重要。本文將介紹如何使用Puppeteer這一強大的自動化工具來實現這一目標。 1. P

2024-06-08 00:06:14

自学编程两个月，现在我月入 4 万元

這個外國小哥叫 Nico，他一開始是個編程小白，後來把自己關在房間裏花了兩個月時間學會了編程，如今正在開發一款名爲 Talknotes 的應用，可以將語音備忘錄轉化爲結構化的內容，月收入 5000 美元。 Nico 從高中畢業就開始創業，

2024-04-24 21:14:29

24小時熱門文章

python gdal 安装使用（Windows， python 3.6.8）

最新文章

最新評論文章