Cloudflare 如何通過遷移到 OpenTelemetry Collector 升級(jí)日志記錄管道
互聯(lián)網(wǎng)基礎(chǔ)設(shè)施和安全公司在數(shù)據(jù)處理領(lǐng)域的變化一直備受矚目。此次,公司從ng遷移至其他方案以提升日志記錄流程,這一舉措頗具看點(diǎn)。這不僅標(biāo)志著公司內(nèi)部發(fā)生的重大變革,還與行業(yè)發(fā)展趨勢(shì)和眾多技術(shù)細(xì)節(jié)緊密相連。
遷移的背景與動(dòng)機(jī)
日志記錄管道每秒需處理數(shù)百萬個(gè)日志事件,堪稱公司最大的數(shù)據(jù)通道之一。以往,公司依賴開源的-ng日志記錄方案,但伴隨業(yè)務(wù)擴(kuò)展,這一方案需要調(diào)整。這標(biāo)志著公司數(shù)據(jù)處理方式的一次重大變革。英寸工程師指出,推動(dòng)這一遷移的動(dòng)機(jī)有多種,根本原因在于公司對(duì)數(shù)據(jù)處理效率和適應(yīng)性的不懈追求。同時(shí),面對(duì)日益復(fù)雜的數(shù)據(jù)處理任務(wù)和特定需求,-ng可能已不再適用。
行業(yè)整體技術(shù)持續(xù)進(jìn)步,新方案的出現(xiàn)預(yù)示著更高效的工作模式。這使得公司不得不思考是否應(yīng)該做出改變。為了不落后,公司必須緊跟技術(shù)發(fā)展的步伐。
自定義組件的開發(fā)
為確保系統(tǒng)遷移順利進(jìn)行并保持與現(xiàn)有系統(tǒng)的兼容,工程師們?cè)O(shè)計(jì)并開發(fā)了多款定制組件。其中,一款針對(duì)公司獨(dú)特日志格式的定制導(dǎo)出器應(yīng)運(yùn)而生,它能夠滿足公司對(duì)特殊數(shù)據(jù)格式的特定需求。此外,還有經(jīng)過改進(jìn)的文件導(dǎo)出器,它能夠處理多種不同的輸出格式。
這并非僅僅是技術(shù)上的小調(diào)整。在開發(fā)過程中,往往需要投入大量的人力與物力。為確保各個(gè)組件能夠正常運(yùn)行,必須進(jìn)行多次的測(cè)試。工程師在此過程中,需整合眾多資源,涵蓋來自不同部分的技術(shù)資料和眾多人員的經(jīng)驗(yàn)交流。此外,他們還需與不同部門進(jìn)行溝通與協(xié)調(diào),例如與技術(shù)支持部門討論新組件在實(shí)際應(yīng)用中的穩(wěn)定性保障問題。
不同數(shù)據(jù)中心的策略
核心數(shù)據(jù)中心里,配置眾多且負(fù)載繁雜,我們采用了謹(jǐn)慎的態(tài)度來處理。這里存放著至關(guān)重要的數(shù)據(jù),一旦出現(xiàn)問題,后果不堪設(shè)想。因此,在操作上我們絕不能輕舉妄動(dòng),必須對(duì)每一步驟可能產(chǎn)生的影響進(jìn)行仔細(xì)評(píng)估。
邊緣數(shù)據(jù)中心的情況有所區(qū)別,配置較為簡(jiǎn)單。這給了團(tuán)隊(duì)一個(gè)逐步推出新系統(tǒng)的機(jī)會(huì)。他們?cè)趪?yán)密監(jiān)控下,逐步推進(jìn)變革。這整個(gè)過程就像是一場(chǎng)戰(zhàn)略布局各異的戰(zhàn)役,每個(gè)數(shù)據(jù)中心都根據(jù)自身情況制定了合理的作戰(zhàn)計(jì)劃。這種依據(jù)實(shí)際情況靈活應(yīng)對(duì)的方法,在整個(gè)遷移過程中扮演著至關(guān)重要的角色。
遷移中的挑戰(zhàn)
遷移過程中困難重重,故障轉(zhuǎn)移問題尤為突出。起初,新導(dǎo)出器無法檢測(cè)到與主日志服務(wù)器的連接,導(dǎo)致日志大量堆積。
在切換過程中,服務(wù)受到影響的現(xiàn)象時(shí)有發(fā)生。當(dāng)停止舊系統(tǒng)并啟動(dòng)新系統(tǒng)時(shí),日志收集出現(xiàn)了短暫的中斷,這影響了那些以阻塞模式寫入日志的服務(wù)。這情形就像多米諾骨牌效應(yīng),一旦某個(gè)環(huán)節(jié)出錯(cuò),就會(huì)連鎖影響到一系列服務(wù)。對(duì)于工程師而言,這無疑是在黑暗中摸索,尋找解決這些問題的方案是一項(xiàng)巨大的挑戰(zhàn)。
問題的解決方案
為了解決日志累積及服務(wù)中斷等難題,工程師們實(shí)施了一系列應(yīng)對(duì)措施。他們首先在自定義導(dǎo)出器中設(shè)定了更為嚴(yán)格的超時(shí)限制,這樣做可以有效防止因等待時(shí)間過長(zhǎng)而導(dǎo)致的問題無限擴(kuò)大。
調(diào)整故障轉(zhuǎn)移策略,確保問題發(fā)生時(shí)切換操作能更妥善完成。同時(shí),優(yōu)化部署流程,旨在盡量縮短切換過程中的停機(jī)時(shí)間。這些措施的背后,是工程師們經(jīng)過大量測(cè)試、細(xì)致分析和不斷調(diào)試的結(jié)果。他們需依靠專業(yè)知識(shí)與豐富經(jīng)驗(yàn),并結(jié)合創(chuàng)造力,尋找最合適的解決方案。
未來的規(guī)劃
公司對(duì)未來持有積極態(tài)度,并制定了多項(xiàng)計(jì)劃。其中包括采用更高級(jí)的日志采樣技術(shù),例如尾部采樣。此外,公司還打算向開源社區(qū)貢獻(xiàn)自制的組件。這表明公司不僅意在增強(qiáng)自身技術(shù)能力,亦有意促進(jìn)整個(gè)行業(yè)的進(jìn)步。這種共享精神對(duì)技術(shù)領(lǐng)域的共同發(fā)展大有裨益,也為與其它公司及從業(yè)者間的廣泛合作交流打下了堅(jiān)實(shí)的基礎(chǔ)。
眾多企業(yè)紛紛采納這一新興技術(shù)方案,這能否引領(lǐng)互聯(lián)網(wǎng)基礎(chǔ)設(shè)施在安全領(lǐng)域迎來一場(chǎng)深刻變革?期待大家踴躍點(diǎn)贊并轉(zhuǎn)發(fā)文章,同時(shí),也熱切歡迎大家在評(píng)論區(qū)留下寶貴意見,展開熱烈討論。
作者:小藍(lán)
鏈接:http://m.huanchou.cn/content/4791.html
本站部分內(nèi)容和圖片來源網(wǎng)絡(luò),不代表本站觀點(diǎn),如有侵權(quán),可聯(lián)系我方刪除。