原创 學習自然語言處理,一張圖就夠了

一張圖看懂自然語言處理技術框架 一、前言 正在針對《人工智能產品經理最佳實踐請添加鏈接描述》視頻課程第三部分,關鍵技術篇,進行相關的內容重構,今天整理的部分是自然語言處理技術框架,特地繪製了一張自然語言處理的技術框架圖,在此分享給大家。 二

原创 胖子哥的大數據之路(三)- 大數據倉庫的需求分析該怎麼做

一、引言  基於大數據技術構建數據倉庫平臺,源於大數據技術本身的不成熟和普及度問題,以及輔助工具的缺失,註定了其實施過程與傳統數據倉庫的差異性,和更大的實施難度。本文針對大數據技術應用與數據倉庫類項目需求分析階段,需要完成的主要工作基於用戶

原创 一張圖,看懂知識I圖譜的體系結構

一、概述3月份 3月份的時候,在51cto開設了基於個人學習經驗總結的知識圖譜學習實踐課程《知識圖譜實戰開發案例剖析視頻課程(附源碼)》;一直很忙,沒有時間系統性整理一套全局性的對知識圖譜進行介紹的學習導引,今天終於有了時間,補上這部分的缺

原创 數據挖掘標準規範之CRISP-DM基礎

一、前言  每每提到數據挖掘,總有些人上來就是ETL、是算法、是數學模型,作爲搞工程實施的我而言,很是頭疼。其實作爲數據挖掘的而言,算法只是其實現 手段、是工具和實現手段而已,我們不是在創造算法(國外職業搞研究的除外),我們是在使用算法而已

原创 我的大數據之路(一)-數據倉庫也需要大數據

一、楔子  大數據傳統企業實施,其路漫漫,絕不會如曇花一現,探索大數據在傳統行業的實施之路,尋找一條適合傳統行業的企業大數據實施方法體系,是我執着堅守的信念,大數據是一種信仰,吾將上下而求索。記下項目中的點滴,算是日誌,自勉。二、項目背景 

原创 自己動手開發智能聊天機器人完全指南(附完整源碼)

一、前言本文是《自己動手開發智能聊天機器人完全指南(附完整源碼)》的第二篇,也是21天實戰人工智能系列《知識圖譜完全項目案例剖析》裏面的知識圖譜應用的案例。前文中實現了一個最基本的人工智能聊天機器人,其能力完全等同於剛出生的嬰兒,還談不上智

原创 Hadoop專業解決方案-第13章 Hadoop的發展趨勢-翻譯稿

一、前言:  非常感謝Hadoop專業解決方案羣:313702010,兄弟們的大力支持,在此說一聲辛苦了,經過兩週的努力,已經有啦初步的成果,目前第13章 Hadoop的發展趨勢小組已經翻譯完成,在此對:hbase-深圳-18361、旅人A

原创 基於Hadoop開發網絡雲盤系統架構設計方案第一稿

引言  雲計算技術的發展,各種網絡雲盤技術如雨後春筍,層出不窮,百度、新浪、網易都推出了自己的雲盤系統,本文基於開源框架Hadoop設計實現了一套自己的網絡雲盤系統,方案爲初步設計方案,不斷完善中。一、總體架構二、方案說明2.1 系統切分 

原创 我的友情鏈接

51CTO博客開發

原创 胖子哥的大數據之路(8)- 數據倉庫命名規範

引言:從對大數據的狂熱到理性的迴歸,項目實施起到了醍醐灌頂的作用,大數據技術只能作爲一種IT基礎架構(存儲+運算),而實際的工程化實施,還是要回歸到IT傳統技術,最近在整合大數據時代的數據倉庫框架,希望能有更多的人蔘與進來。數據倉庫實施數據

原创 胖子哥的大數據之路(二)- 大數據結構化數據存儲應用模式

一、楔子胖子哥是我網名,叫了很多年的網名,網名的來歷與自己的滄桑和身材有關,不知是IT改變了我,顯得蒼老,還是我本就蒼老,順應了IT行業的需要。25歲那面,曾被跟我一樣高的漂亮美眉叫叔叔,從此再也不敢打小姑娘的注意,走上了重口味熱愛阿姨級別

原创 你應該如何學習一個未知的技術領域?- 菜鳥小白篇

一、前言2018年初開始從事線上課程的開發,陸續開發了幾門課程,《人工智能產品經理最佳實踐請添加鏈接描述》《知識圖譜實戰開發完全剖析請添加鏈接描述》和《智能對話機器人實戰開發完全剖析》,其中每一個專題都是自己對於這個新興領域的探索和實踐經驗

原创 《Hadoop專業解決方案》中文版目錄篇

前言:最近有朋友給推薦一本書,英文原版《Wrox.Professional.Hadoop.Solutions》,感覺很好打算翻譯成中文,共享給朋友,時間關係,不知能否成行,先幹着吧。以下部分是本書的目錄,算是一個開始,至於何時能夠成稿,且幹

原创 大數據應用之:MongoDB從入門到精通你不得不知的21個爲什麼?

一、引言:  互聯網的發展和電子商務平臺的崛起,催生了大數據時代的來臨,作爲大數據典型開發框架的MongoDB成爲了No-sql數據庫的典型代表。MongoDB從入門到精通你不得不知的21個爲什麼專爲大數據時代,大數據應用系統系統分析、架構