2026-03-13 12:10:32

2026年に実行するベストローカルLLM:

ハイパフォーマンス (24GB以上のVRAM、できれば複数GPU)

• Kimi K2 - 1Tパラメータ、32Bアクティブ。MoEビースト
• GLM-4.7 (Z AI) - 30B-A3B MoE、SWE-bench 73.8%
• DeepSeek V3.2 - 671B / 37Bアクティブ。依然としてオープンソースの王者
• Qwen3 235B-A22B - 十分なリソースがあれば驚異的な品質/コスト比

ミッドレンジ (16-24 GB VRAM / RAM)

• Qwen3 30B-A3B - その重量以上のパフォーマンス、ロングコンテキストで安定
• Gemma 3 27B - Googleの最高のオープンリリース
• Nemotron 3 Nano 30B - Math500: 91%。数学が必要な場合は業界最高水準

軽量モデル (8-16 GB RAM、専用GPUなしで実行可能)

• Qwen3 8B / 4B / 1.7B - 現在最高の小規模モデルファミリー
• Gemma 3 4B - CPUでも驚くほど有能
• Phi-4 (14B) - Microsoftが少ないリソースで多くを実現

ローカルAIスタックは本当にクラウドに追いついている

原文表示