【開發者必讀】Gemini API 帳單爆表的真相:為什麼「沒設定限額」會讓你傾家蕩產?
帳單黑洞:Deep Research 為什麼這麼貴?
大家習慣了 Gemini 1.5 Flash 那種「幾乎不用錢」的體驗,但 Deep Research 是完全不同的生物:
-
預設次數極多: 在 Google Cloud 的預設設定中,每日請求上限(RPD)可能高達 1,440 次。
-
單次成本驚人: 跑一次完整的研究,AI 會進行大量的內部推理(Thinking Tokens)並自動執行數十次 Google 搜尋。
-
無感燃燒: 如果你沒設定上限,只要你的自動化流程出錯(例如死循環),系統會毫無限制地跑完那 1,440 次,這可能導致一天之內產生數千美金的帳單。
為什麼你在後台會看到「值為 0」?
在配額頁面中,你可能會看到某些模型的值是 0。這通常發生在 Free Tier (免費層級):
-
0 的意義: 代表該模型在免費模式下是被「封印」的。
-
付費的代價: 當你為了使用 Deep Research 而切換到 Paid Tier (付費層級) 時,Google 會解開限制,給你一個很高的預設額度。如果你這時候沒有立刻手動把那個數字改小,你的荷包就完全暴露在風險之中。
金額限制要在哪邊設定?
由於 Gemini API 的計費是由 Google Cloud Platform (GCP) 統一管理,Gemini AI Studio 本身沒有「設定金額上限」的按鈕。你必須到 Google Cloud Console 中設定。
以下是設定步驟:
1. 進入 Google Cloud 預算設定
-
點擊截圖最下方的藍字 「Open in Cloud Console」,或是直接前往 Google Cloud Billing。
-
在左側選單中找到並點擊 「預算與告警」(Budgets & alerts)。
2. 建立預算告警 (防止超支)
-
點擊 「建立預算」(Create budget)。
-
設定範圍: 確認專案選的是
auto-article(你截圖中的專案名稱),產品選擇「全部」。 -
設定金額: 選擇「指定金額」(Specified amount),輸入你每個月能接受的上限(例如:$50 或 $100)。
-
設定告警百分比: 你可以設定當達到預算的 50%、80%、100% 時發送郵件通知你。
3. 設定「硬性止損」 (自動停止服務)
注意: 預設的「預算告警」只會發 Email 通知,並不會自動關閉 API。如果你希望錢燒完就直接停止 API,需要更進階的設定:
-
配額限制 (Quotas): 你可以到 GCP Quotas 頁面,找到 Gemini API 相關的
Requests per minute或Tokens per minute,手動調低配額。 -
自動禁用帳單: 這需要搭配 Google Cloud Functions。當預算達到 100% 時,觸發程式自動「移除該專案的帳單連結」。這會立即中斷所有 API 請求,但能確保不會產生更多扣款。
止損策略:三步驟保住你的銀行存款
如果你要開發自動化 3C 新聞系統,請工程師務必執行以下「保命操作」:
第一步:手動「限縮」每日次數
不要依賴 Google 的預設值。請進入 Google Cloud Console 的 [配額] 頁面,找到 Request limit per model per day:
-
主動修改: 將該值從預設的高標手動調低至 1 或 5。
-
物理隔離: 這樣就算程式跑飛了,一天頂多也就燒掉幾十美金,而不是幾千美金。
第二步:分清「普攻」與「大絕招」
-
日常任務 (95%): 抓取 RSS、翻譯 3C 新聞、簡單摘要。請務必指定使用 Gemini 1.5 Flash,這在免費層級下有極高額度,且付費版也極其便宜。
-
高價值任務 (5%): 需要深度比對多篇評測、撰寫萬字分析。這才動用 Deep Research。
第三步:建立「預算告警」
雖然 Google 的預算告警不會自動斷電,但它能第一時間 Email 通知你「錢正在燒」。
結語
在 AI 自動化的世界裡,「沒設定限額」就等同於「把信用卡交給一個會自動購物的機器人」。Deep Research 很好用,但請記得先幫它戴上口罩(限縮配額),才能在享受便利的同時,守住你的帳單!