實際案例分享-當遇到客戶反應遇到網頁逾時問題時之問題排查

2023-08-03
    Article outline

近期在專案上遇到客戶反應遇到網頁逾時問題,工程師便開始著手進行查看。

 

首先,工程師先針對EC2的報表評估檢查。其CPU的使用率來看目前看來都還在容許範圍內,雖然有偏高的情況。

 

 

而在其RAM的使用情況,已有使用過半的情況。

 

 

故評估後尚不急著提高規格,仍在機器容許範圍內。但建議客戶將RAM加大到8G會比較安全。

 

接下來是RDS的評估報告。經查看有發生大數據記錄的異常情況

 

 

CPU的使用情況也非常的異常

 

 
在其記憶體的圖表來看,產生了不規則的折線圖情況。這代表了記憶體用量異常而導致平均數據不正常

 

 

此現象就工程師的經驗判斷為資料庫有大量的請求及異常加入,有被侵入的跡像。且其波動情況也與EC2的使用頻率搭配不起來,將進行其它檢查作業處理。

 

最終,在其安全群組中找到了原兇。

 

客戶在其RDS安全機制上,通過了將近72條IP外部連線

 

 

這其實已經造成了評估使用上的計算錯誤。

 

RDS在評估上並不會將外部連線給計算進去,更何況還72條。工程師在綜合其使用情況及其對應的外部之下,建議客戶使用4核16G的RDS。


以這個案例而言,主要是客戶使用RDS時,開放過多連線數,超出目前的RDS機器規格乘載量而導致網頁逾時。因此,藉由這個案例也可以提醒開發者,建議往後客戶的機器有使用RDS時,如果有開放外部連線的需求,必須依照客戶連線數需求評估相對應的機器規格,以免造成開發時評估太低而導致日後承載過重的問題發生。


Other Articles