開發敏捷高效 | 雲原生應用開發與運維新範式

img


5 月 18 日,騰訊雲舉辦了 Techo Day 騰訊技術開放日,以「開箱吧!騰訊雲」爲欄目,對外發布和升級了騰訊自研的一系列雲原生產品和工具。其中,騰訊雲開發者產品中心總經理劉毅圍繞“開發敏捷高效”這一話題,分享了關於“雲原生應用開發與運維新範式”的主題演講。本次演講將爲大家分享,騰訊雲是如何通過雲上開發運維協作能力,支持多職能團隊流暢協作,助力企業加速數字化敏捷轉型,提升雲原生架構的運維效率,受益雲原生。

img

劉毅——騰訊雲 CODING CEO、騰訊雲開發者產品總經理。主要負責騰訊雲開發者生態以及開發者工具和平臺產品經營,帶領團隊把騰訊內部項目協同和研發效能提升過程中,大規模應用到的工具和平臺以及相關的優秀實踐輸出和賦能給各行各業合作伙伴,幫助完成數字化轉型和升級。2011 年加入騰訊,打造過社交產品 QQ 空間,也打造過辦公協作產品騰訊文檔。

雲原生開發與運維領域的新趨勢

如今,在 VUCA(Volatility易變性、Uncertainty 不確定性、Complexity 複雜性、Ambiguity模糊性)環境下,每個企業都在探討如何提升自己的核心競爭力,這也是近年來一直備受關注的話題。在尋找這個問題答案的過程中,騰訊雲發現,**深化研發協作、研運一體的核心能力,打造高效、快速的開發和運維新範式,能夠爲企業在數字化及雲原生轉型過程中持續賦能。

**
通過多年來對雲原生開發與運維領域的觀察與思考,騰訊雲得出 3 個關鍵,分別是:

  • 開發雲原生層面,呈現“資源服務化”趨勢;
  • 業務觀測層面,需具備“數據和觀測一體化”能力;
  • 應用觀測與協同排障結合,“協作能力進一步提升”。

開發雲原生呈「資源服務化」趨勢

隨着雲原生技術逐步發展爲規模化實踐,業界對於雲原生的未來有了較爲清晰的認知。除了具備初代的雲原生 DevOps、容器、微服務這些必要元素外,進一步滲透到尋求資源配置和應用管理提效的最優解。

騰訊雲對雲原生具備完整的佈局,覆蓋基礎設施、安全、計算、架構、數據等多個方面,其中開發雲原生是騰訊雲原生布局的重要一環。

img

首先,未來應用將“ 生於雲、長於雲”,開發雲原生也會呈現“資源服務化” 特徵。這意味着未來的資源管理和調度將變得更加高效,開發者可以從本地編碼、離線交付、以及低效的資源管控中解放出來,在雲端完成編碼調試和應用部署,更大限度發揮雲原生技術紅利。

業務統一可觀測層面需具備“數據和觀測一體化”能力

其次,隨着雲原生的普及,業務複雜度也逐漸提升,傳統的監控模式,數據分散不聯通,不同業務層的監控也多是通過不同產品和工具完成。故監控到業務異常發生時,數據之間的下鑽、聯動分析效率低。

通過以業務爲核心,將多種數據源集合在統一平臺,覆蓋指標、鏈路、日誌、事件全數據類型,構建統一的數據採集、處理、觀測平臺,再配合一體化的故障預測、故障告警、故障定位工具,構建這樣一個全鏈路、端到端的數據和觀測的一體化平臺,可以幫助大幅提升運維效率,從被動監控轉爲主動觀測。

img

監管控一體化”繼續演進

系統可靠性和穩定性是企業競爭力的基石。一旦發生故障,需要迅速拉起多個職能角色參與其中,第一時間多方協同定位問題、恢復應用、解決問題。

在該過程中,排障人員會感受到觀測工具和工程信息之間的割裂、上下文對齊異步、遠程協作難同頻的問題,排障效率仍有較大提升空間。

通過打通代碼數據、工程數據和觀測數據,提供故障信息對齊能力,增強多人線上協同排障場景,進一步提升運維協作能力演進 DevOps 閉環,才能落到實處地幫助業務側及時高效應對排障,保證系統可用性。

img

客戶面臨的嚴峻挑戰

騰訊雲成立以來多年,持續深耕雲計算領域並以卓越的技術能力服務數百萬開發者,積累了大量企業數字化管理經驗,在實踐中總結出客戶在雲原生應用開發和運維時普遍遇到的一些痛點,進一步映射了上述“趨勢”觀點:

  • 開發調試到部署效率低,包括開發環境難以統一且重複配置、本地資源隔離弱且不穩定、持續構建與部署因環境管控複雜、效率有待提升。

  • 數據分散問題定位低效,雲原生架構複雜,業務的指標、鏈路、日誌等數據分散,同時前後端存在孤島問題,無法統一觀測業務架構,當異常發生時,需要多系統、多數據調度以支持排障,影響運維效率。

  • 異步多人排障信息難對齊,故障時多可用區、多時段告警信息、監控日誌、操作、反饋等有效診斷信息分散在各個時段,且分散在各個排障人手上。排障專家互相之間無法快速共享和對齊排障上下文。事後覆盤時也難以回溯故障處理的過程信息。

  • 遠程協同效率低,遠程多職能協同排障存在資源權限、業務知識、工具和技術熟練度的差異。每個角色只掌握鏈路中的部分信息或工具。因此排障時產生不同角色間信息無法方便共享共識,導致排障效率降低。

騰訊雲觀點

觀點一:“資源服務化”

針對上述痛點,騰訊雲首先考慮的是開發調試與持續交付過程中實現“資源服務化”,爲研發資源挑戰提供解法。

於是我們有了雲原生開發的雲端開發+環境託管的概念雛形,提供基於服務的雲上開發環境 (Cloud Development Enviroment),使得通過雲端進行開發、編譯與調試,解決傳統開發資源管理難題,進一步推動開發雲原生落地。

img

在資源服務化機制中,開發同學們可以各自開發自己的模塊,互不干擾。必要時,他們之間又可以實施相互調用、甚至斷點聯調。

該流程在微服務場景能促使開發者左移聯調,每個微服務可以快速啓動對應的雲端開發環境,雲端構建、雲端部署,通過流量調度方案,快速預覽開發效果。開發集羣還提供自動休眠等措施,進行成本控制。

觀點二:“數據和觀測一體化”

針對傳統監控體系中的若干問題,我們推薦建設和使用“數據和觀測一體化”可觀測平臺,並提供雲上實踐。

一體化的可觀測平臺將多來源、多類型的監控數據統一接入,依託強大的DSL、實時/關聯分析等能力進行數據處理,最終依託通用能力組件對不同用戶角色提供整合展示、多維分析、預警通知及AIOPS能力。

從而解決因監控和告警數據分散、缺少全局視角所導致的監控規模擴展難、規範化管理難、關聯分析和排障定位慢等問題。

img

觀點三:“監管控一體化”

可觀測能力結合 DevOps,我們認爲“應用管理”可以與“應用可觀測”深度結合,建立以應用爲中心、以業務爲視角的統一觀測平臺。

在 DevOps 的下游環節,提供涵蓋針對應用的日常問題發現/定位/解決的核心能力,接入應用可觀測能力如監控告警、鏈路追蹤以及日誌追蹤,從應用視角打破各APM類工具間的信息屏障,將原本零散的信息建立關聯、抹平不同環境之間的工具差異,建立以應用爲中心、服務研發視角的一體化觀測能力。

img

同時,基於一體化可觀測能力,統一各類觀測數據標準,實現可觀測工具的可插拔性以及可擴展性,用戶也可以進行自定義擴展。在此之上,創新性結合騰訊會議的實時共識屬性,升級運維排障協同手段,將 DevOps 深度演進閉環。

重磅新品發 一站式雲上開發運維協作平臺

作爲國內領先的雲平臺,騰訊雲一直堅持以客戶爲導向,不斷創新和打磨貼近用戶思考的產品和服務體驗。現如今正式對外界推出一站式雲上開發運維協作平臺,支持多職能團隊在同一平臺上流暢便捷地協作,“高效、快速,打造新一代雲原生應用開發與運維的新範式”

一站式雲上開發運維協作平臺產品優勢可以概括爲以下三點:

  • 開發資源託管:可在線集羣調試、一鍵拉取倉庫並加載雲端開發環境、動態資源調配、便捷靈活聯調。

  • 應用觀測:多協議監控、全產品覆蓋、態勢告警、無侵入式業務數據採集上報、全數據維度展示。

  • 遠程協同排障:一鍵拉起干係人同屏會議,抹平信息割裂與組織異步,線上聚焦協同排障、定位、以及修復上線。

img

該範式旨在覆蓋雲上從應用開發到應用運維的全生命週期。簡單來說,用戶可通過雲端開發環境 Cloud Studio 進行多人編碼協同,在線調試與服務部署;也可將代碼推送到一站式研發效能管理平臺 CODING DevOps 以完成持續交付的一系列工作。

當應用發佈後,以應用爲核心,接入可觀測能力爲業務提供應用環境全鏈路的故障預測、發生告警、定位支撐,在故障時拉起協同排障、解決問題,閉環 DevOps 中的最後一公里。

新品工具一:騰訊雲可觀測平臺

爲解決傳統監控數據孤島、管理複雜、數據間無法聯動排障等問題,我們打造了騰訊雲可觀測平臺,爲用戶提供一體化監控解決方案

img

數據源層面,支持指標、鏈路、日誌、事件的全類型監控數據,同時支持數據間的聯動分析。同時騰訊雲可觀測平臺支持靈活和豐富的告警場景配置,同時提供詳細的告警大盤,全面洞察業務告警。除了具備基礎的管理分析能力,我們還規劃了智能異常檢測、根因分析、自動化運維等高級能力。通過對雲產品、前端性能、應用性能的監控,聯動撥測、壓測、可視化等多種觀測能力,可以覆蓋統一監控巡檢、一站式排障、前後端聯動排障、用戶體驗護航等多種監控場景。

騰訊雲可觀測平臺支持多種主流語言和協議的全鏈路 Tracing 打通,將前後端數據打通效率提升 90% 以上,幫助開發運維快速實現前後端數據鏈路分析。我們在部分場景中實現了無侵入式數據採集,用戶無需對業務做任何改動,即可上報數據。後續對 eBPF 的支持也會快速上線,爲用戶提供更強大的無侵入採集方式。

另外,騰訊雲可觀測平臺全方位升級告警,可以爲客戶提供一體化的排障能力:從數據源到告警配置和告警通知處理,對多種數據源的指標和事件進行多維度的告警配置,告警條件也支持基於機器學習的動態閾值、複合告警等。對於重要的告警事件,可一鍵升級成故障管理,進行全生命週期的管理,包括對故障流程的上下文追溯、流程管理和故障覆盤。

img

新品能力二:遠程協同排障

創新性提升排障協同能力,騰訊雲進一步推出遠程協同排障解決方案,將 DevOps 和 Meeting 場景完美結合。

遠程協同排障解決方案是騰訊雲依託騰訊會議業界領先的遠程實時協同能力,聯合 CODING 開發者服務、雲監控可觀測平臺,圍繞「應用運維」打造業界領先的遠程協同排障解決方案,補齊多人協同排障場景核心能力,強化可觀測驅動開發理念,打通可觀測與代碼工程壁壘,提升遠程排障效率。

img

收到告警拉起排障診斷時,從 ChatOps 通知或工單系統直接打開 CODING Orbit 的應用觀測工具。觀測工具無縫接入了騰訊雲的 APM 觀測產品,對觀測信息進行了以應用爲中心的聚合。從而用戶以應用爲中心視角,在同一工作臺無縫切換查看故障調用鏈,日誌,監控指標,基於所提供的全面觀測信息,快速定位故障點,提高排查效率。

多人排障場景中,工作臺支持一鍵拉起視頻會議,多人同屏在錯誤堆棧中同步定位到引起故障的關鍵節點,迅速分派任務,制定方案,甚至修復缺陷。在確定爲代碼缺陷的場合,可迅速定位到相關代碼倉庫文件,拉起 IDE,進行代碼修復和在線調試、再次發佈。而多人同屏會議協同加速了整個過程的任務分派、職能監督、計劃統籌到最終修復問題的協作速率。

客戶解決方案成熟落地,多行業實踐全面開花

目前,騰訊雲開發者服務超過 300 萬開發者和數萬家企業,在多個行業實踐均已全面開花。

img

例如,在金融行業,富途證券對服務穩定性要求高,且架構複雜,涉及混合雲及多地域,真實客戶的訪問體驗和頁面異常的監測也是金融客戶的可觀測性建設中的重要關注點。通過騰訊雲可觀測平臺,幫助客戶快速測試海外網絡情況,瞭解用戶真實體驗,從平臺、ISP等多個維度幫助客戶定位問題,且支持監控數據的跨地域容災,爲客戶構建一個統一的業務監控和可視化平臺

在零售行業,爲全力賦能伊利集團主業發展、響應數字化轉型戰略,CODING 通過提供項目協同、CI/CD、製品倉庫、研發度量、應用觀測等主要功能模塊,實現端到端 DevOps 平臺建設,填補源代碼與可用程序之間的開發運維鴻溝。目前,伊利集團事業部 20+ 小程序項目已完成敏捷研發流程的落地應用,小程序需求迭代效率提升 30% 以上,系統實現穩定運營。

尾聲

數字化技術正在給各行各業帶來巨大的變革,在雲原生領域爲用戶提供更全面、更穩定、更安全的雲原生服務,是騰訊雲一直以來的追求。騰訊雲將持續加大產品研發投入規模和技術創新力度,爲百萬開發者提供更完整的產品矩陣,助力開發者化繁爲簡,提高研發與運維效能。

img

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章