第六章:挑選你的 AI 員工腦袋 - LLM 模型選擇與成本控制

在前面的章節中,我們順利地讓虛擬員工開始工作了。但你有沒有想過,這些員工「腦袋裡的智商」是哪裡來的? 預設情況下,只要你在 .env 裡面設定了 OPENAI_API_KEY,CrewAI 在背景就會自動使用 OpenAI 最頂級的模型 gpt-4o 來驅動你的 Agent。

這聽起來很棒,但在真實世界的商業專案中,如果你讓所有的 Agent 都用最高級的腦袋,你會遇到一個非常現實的問題:成本太高了!

如果一個只負責「從網頁中把 10 個數字抓出來」的低階資料整理員,你卻付給他頂級架構師的薪水 (耗費昂貴的 GPT-4o Token),你的專案很快就會把老闆的預算燒光。

🎯 本章目標

  1. 學習如何在 Agent 中,針對不同的角色指定特定的語言模型 (LLM)。
  2. 認識如何串接 OpenAI 以外的模型 (例如寫程式最強的 Claude 3.5)。
  3. 掌握「高低配」的商業架構思維,優化專案的 API 成本。

🧠 第一步:指派不同的腦袋給不同的員工

在 CrewAI 中,這家公司的老闆 (也就是你) 有絕對的權力決定要給員工裝上什麼腦袋。 你可以在建立 Agent 時,明確地加上 llm 屬性來指定模型。

🔥【Vibe Prompt 實戰咒語】 我正在使用 CrewAI。請幫我設定兩個 Agent 來示範如何指定不同的 LLM: 1. 初階資料收集員:他的工作只是去網路上把文章爬下來,不需要太複雜的思考。請幫他設定 llm 為便宜的 "gpt-4o-mini"。 2. 資深總編輯:他的工作是把亂七八糟的資料,改寫成極具商業說服力的銷售文案。請幫他設定 llm 為聰明的 "gpt-4o"。 請給我這兩個 Agent 建立的程式碼範例。

AI 會教你這樣寫:

import os
from crewai import Agent

# 設定 OpenAI API Key
os.environ["OPENAI_API_KEY"] = "你的金鑰"

# 👨‍💻 員工 A:使用便宜、快速的迷你腦袋
junior_researcher = Agent(
    role='初階資料收集員',
    goal='快速收集大量資料,不需過度分析',
    backstory='你做事很快,但你的邏輯不需要太嚴密,你的任務就是把資料找齊交給主管。',
    llm='gpt-4o-mini' # 💡 關鍵!指定便宜的模型,成本只有 gpt-4o 的幾十分之一
)

# 👨‍💼 員工 B:使用昂貴、具備深度推理能力的頂級腦袋
senior_editor = Agent(
    role='資深總編',
    goal='寫出完美、具備洞察力的商業報導',
    backstory='你有二十年的雜誌編輯經驗,對文字極度敏銳,擅長把零碎的資訊化為黃金。',
    llm='gpt-4o' # 💡 指定最強的模型
)

這樣一來,你的系統在執行時,前期爬蟲收集資料的階段只會花費幾毛錢,只有在最後收尾的關鍵時刻,才會動用昂貴的算力。這就是商業上所謂的 「高低配 (High-Low Mix) 策略」


🚀 第二步:想用 Claude 寫程式怎麼辦?(多重宇宙腦袋)

身為一個開發者,你一定聽過業界的傳聞:「GPT-4o 寫文章很棒,但如果要寫複雜的 React 程式碼,Anthropic 推出的 Claude 3.5 Sonnet 才是真正的王者!」

如果你想要在一個團隊裡面,同時聘請一個 OpenAI 的作家,加上一個 Anthropic 的工程師,CrewAI 完全支援這種跨越廠商的「多重宇宙」合作!

要切換到非 OpenAI 的模型,你只需要多準備一把該廠商的鑰匙,並在模型名稱前面加上廠商的前綴 (Provider Prefix)。

import os
from crewai import Agent

# 1. 準備 Anthropic 的金鑰
os.environ["ANTHROPIC_API_KEY"] = "你的_Claude_金鑰"

# 2. 聘請一位來自 Claude 宇宙的工程師
coder_agent = Agent(
    role='資深全端工程師',
    goal='寫出完美無 Bug、效能極佳的 React 程式碼',
    backstory='你是一個追求極致優雅的工程師,你對架構設計有極高的要求。',
    # 💡 加上 anthropic/ 前綴,CrewAI 就知道要去找誰了
    llm='anthropic/claude-3-5-sonnet-20240620' 
)

這樣,你就可以建立一個由 gpt-4o 寫企劃書、交給 claude-3.5-sonnet 寫程式碼的夢幻虛擬團隊了!

💼 [商業應用場景] 資安合規與本地開源模型

當你去跟大企業 (例如銀行或醫院) 提案時,他們通常會有一個死穴:「我們的客戶資料絕對不可以上傳到 OpenAI 的雲端!」 這時候,如果你只會用 GPT-4o,你的案子就飛了。

但如果你懂得 CrewAI 的 LLM 切換機制,你可以跟客戶說:「沒問題!我們可以將部分負責處理機密資料的 Agent,切換為在貴公司機房本地端運行的開源模型 (例如 Llama 3Ollama),保證資料絕對不出公司大門。」 這句話,能讓你的提案勝率大幅提升。

✅ 本章小結

這就是 CrewAI 架構最彈性的地方。在一個團隊中,不是每個人都需要最頂級的腦袋。 「把對的腦袋,用在對的工作上,才能達成專案成本、效能與資安的最佳平衡!」

學會了挑選腦袋,下一章,我們將討論如何把這些腦袋的潛力徹底榨乾。這牽涉到你怎麼幫他們寫「人設與提示詞 (Prompting)」,讓你的虛擬員工不再是死板的機器人!

解鎖完整教學內容

本章為付費內容。加入專案即可解鎖超過 5000 字的深度解析,包含 10 個以上神級 Prompt 與真實 Source Code 範例!