第六章:AI従業員の頭脳を選ぶ - LLMモデルの選択とコスト管理
前の章では、仮想従業員を無事に働かせ始めました。しかし、これらの従業員の「頭の中の知能」はどこから来ているのか考えたことはありますか?
デフォルトでは、.envファイルにOPENAI_API_KEYを設定しておけば、CrewAIはバックグラウンドで自動的にOpenAIの最上位モデルgpt-4oを使ってAgentを動かします。
これは素晴らしいことですが、現実のビジネスプロジェクトで全てのAgentに最高級の頭脳を使わせると、非常に現実的な問題に直面します:コストが高すぎる!
「ウェブページから10個の数字を抽出する」だけの低レベルなデータ整理係に、トップアーキテクト級の給料(高価なGPT-4oトークンの消費)を支払っていたら、プロジェクトの予算はあっという間に底���ついてしまいます。
🎯 本章の目標
- Agentごとに特定の言語モデル(LLM)を指定する方法を学ぶ
- OpenAI以外のモデル(例えばプログラミングに最強のClaude 3.5)を接続する方法を理解する
- 「高低混在」のビジネスアーキテクチャ思考をマスターし、APIコストを最適化する
🧠 ステップ1:従業員ごとに異なる頭脳を割り当てる
CrewAIでは、会社の社長(つまりあなた)が従業員にどの頭脳を組み込むかを完全に決定できます。
Agentを作成する際に、llm属性を明示的に追加してモデルを指定できます。
🔥【Vibe Prompt実践呪文】
私はCrewAIを使用しています。異なるLLMを指定する方法をデモンストレーションするため、2つのAgentを設定してください:1. 初級データ収集係:彼の仕事は単にウェブから記事をクロールするだけで、複雑な思考は不要です。彼のllmを安価な"gpt-4o-mini"に設定してください。2. シニア編集長:彼の仕事は乱雑なデータを、非常に説得力のある販売用コピーに書き換えることです。彼のllmを賢い"gpt-4o"に設定してください。これら2つのAgentを作成するコード例を教えてください。
AIは次のように教えてくれます:
import os
from crewai import Agent
# OpenAI APIキーを設定
os.environ["OPENAI_API_KEY"] = "あなたのキー"
# 👨💻 従業員A:安価で高速なミニ頭脳を使用
junior_researcher = Agent(
role='初級データ収集係',
goal='大量のデータを迅速に収集し、過度な分析は行わない',
backstory='あなたは作業が速いが、論理的に厳密である必要はなく、データを揃えて上司に渡すことが任務です。',
llm='gpt-4o-mini' # 💡 ポイント!安価なモデルを指定。コストはgpt-4oの数十分の一
)
# 👨💼 従業員B:高価で深い推論能力を持つトップ頭脳を使用
senior_editor = Agent(
role='シニア編集長',
goal='完璧で洞察力に富んだビジネスレポートを書く',
backstory='あなたには20年の雑誌編集経験があり、文章に非常に敏感で、断片的な情報を黄金に変えるのが得意です。',
llm='gpt-4o' # 💡 最強のモデルを指定
)
このようにすれば、システムが実行される際、初期のクローリング段階ではわずか数セントしかかからず、最後の仕上げの重要な瞬間だけ高価な計算リソースを使用します。これはビジネスで言うところの**「高低混在(High-Low Mix)戦略」**です。
🚀 ステップ2:Claudeでプログラミングしたい場合(マルチバース頭脳)
開発者として、業界の噂を聞いたことがあるでしょう:「GPT-4oは文章を書くのに優れているが、複雑なReactコードを書くなら、Anthropicが提供するClaude 3.5 Sonnetが真の王者だ!」
1つのチーム内で、OpenAIのライターとAnthropicのエンジニアを同時に雇いたい場合でも、CrewAIはこのようなベンダーを跨いだ「マルチバース」協働を完全にサポートしています!
OpenAI以外のモデルに切り替えるには、そのベンダーのキーを追加で準備し、モデル名の前にベンダープレフィックス(Provider Prefix)を付けるだけです。
import os
from crewai import Agent
# 1. Anthropicのキーを準備
os.environ["ANTHROPIC_API_KEY"] = "あなたの_Claude_キー"
# 2. Claude宇宙から来たエンジニアを雇用
coder_agent = Agent(
role='シニアフルスタックエンジニア',
goal='バグがなく、性能が極めて優れたReactコードを書く',
backstory='あなたは究極のエレガンスを追求するエンジニアで、アーキテクチャ設計に非常に高い要求を持っています。',
# 💡 anthropic/プレフィックスを追加。CrewAIはどこに問い合わせればよいかわかります
llm='anthropic/claude-3-5-sonnet-20240620'
)
これで、gpt-4oで企画書を書き、claude-3-5-sonnetでコードを書く夢の仮想チームを作成できます!
💼 [ビジネスアプリケーションシナリオ] セキュリティコンプライアンスとローカルオープンソースモデル
大企業(例えば銀行や病院)に提案する場合、彼らには通常致命的な弱点があります:「当社の顧客データをOpenAIのクラウドにアップロードすることは絶対に許されない!」 この時点で、GPT-4oしか使えない場合、案件は成立しません。
しかし、CrewAIのLLM切り替えメカニズムを知っていれば、クライアントにこう言えます:「問題ありません!機密データを処理する一部のAgentを、貴社のデータセンターでローカルに実行されるオープンソースモデル(例えばLlama 3やOllama)に切り替えられます。データが会社の外に出ないことを保証します。」
この一言で、提案の勝率が大幅に向上します。
✅ 本章のまとめ
これがCrewAIアーキテクチャの最も柔軟な点です。1つのチームにおいて、全員が最上位の頭脳を必要とするわけではありません。 「適切な頭脳を、適切な仕事に使うことで、プロジェクトのコスト、パフォーマンス、セキュリティの最適なバランスを達成できる!」
頭脳の選び方を学んだので、次の章では、これらの頭脳の潜在能力を徹底的に引き出す方法について議論します。これは、あなたがどのように「キャラクター設定とプロンプティング(Prompting)」を書くかに関係し、あなたの仮想従業員を単なる堅苦しいロボットではなくします!
章のまとめ
- コアコンセプトと原理を理解
- 実装方法とテクニックを習得
- 一般的な問題と解決策に精通
- 実際のプロジェクトに適用可能
さらに読む
- 公式ドキュメントとAPIリファレンス
- GitHubのオープンソース例
- 技術書とオンラインコース
- コミュニティディスカッションと技術ブログ