Ollamaを入れたあと、最初にぶつかるのが「モデルが多すぎて、どれを選べばいいか分からない」という問題です。モデル選びを間違えると、返答が不自然だったり、パソコンが固まったりして、「ローカルAIって使えないな」という誤解につながります。
この記事では、モデル選びの基本ルールと、用途別・メモリ別のおすすめモデルをまとめます。
モデル選びの基本ルール
名前の数字は「AIの規模」
モデル名についている「4b」「9b」「27b」といった数字はパラメータ数(AIの規模)を表します。数字が大きいほど賢くなりますが、そのぶん必要なメモリとファイル容量が増え、返答も遅くなります。
ざっくりした目安はこうです。
- メモリ8GBのパソコン:4bクラスまで
- メモリ16GB:9b〜12bクラスまで
- メモリ32GB以上、またはゲーミングPC:20b〜30bクラスも視野
ファイル容量も無視できません。7bクラスで約4〜5GB、30bクラスになると20GB前後をストレージに置くことになります。
モデル選択欄に出るのは「ほんの一部」
Ollamaアプリのモデル選択欄に並ぶのは、公式が選んだ候補リスト(クラウドモデル中心の数件+ローカルの定番)だけです。検索欄に入力しても、このリストの中から絞り込まれるだけで、世の中の全モデルが出てくるわけではありません。
リストにないモデルを使いたいときは、ターミナル(Windowsならコマンドプロンプト)から1コマンドでダウンロードします。
- 公式サイトのモデル一覧ページで、使いたいモデルの名前を確認する
- ターミナルで「ollama pull モデル名」を実行する(例:ollama pull deepseek-r1)
- ダウンロードが終わると、アプリのモデル選択欄に表示されるようになる
サイズを指定したい場合は、公式サイトのモデルページでタグ(4b、27bなど)を確認し、「ollama pull qwen3.6:4b」のようにサイズ込みの名前で実行します。何も指定しなければ標準サイズがダウンロードされるので、初心者はそのままでOKです。
「cloud」つきのモデルは別物
モデル検索で出てくる名前に「cloud」がついたもの(雲アイコン)は、自分のパソコンではなくOllamaのサーバー上で動くモデルです。高性能ですがアカウント登録が必要で、入力内容は外部に送信されます。この記事で扱うのは、下矢印アイコンの「ローカルモデル」の方です。
迷ったら「とりあえず1つ入れて話す」
スペック表とにらめっこするより、軽いモデルを1つ入れて話してみるのが一番早いです。モデルの入れ替えは簡単なので、合わなければ消して別のものを試せます。
用途別おすすめモデル
日常チャット・日本語の文章作成:Qwen系
日本語の自然さを重視するなら、Alibaba製のQwen(クウェン)系が現在のローカルモデルではトップクラスです。要約、翻訳、ビジネス文書の下書きなど、日本語タスク全般で安定しています。世代交代が速いシリーズで、執筆時点のローカル版の最新はqwen3.6。アプリの検索欄に「qwen」と入力して選ぶだけで、標準サイズがダウンロードされます。
ライセンスが緩やか(Apache 2.0)で商用利用しやすい点も、ブログや仕事で使う人には安心材料です。
バランス重視・軽さ重視:Gemma系
Google製のGemma(ジェンマ)系は、小さいサイズでも品質が高い「軽量の優等生」です。最新のgemma4は、ノートPCでも動くエッジ向けの軽量版(e2b/e4b)から、中型の12b、ハイスペック機向けの大型版(26b/31b)まで5サイズ展開されています。メモリ8GBの一般的なパソコンなら、まずgemma4の軽量版から始めるのが定番です。
じっくり考えさせたい:DeepSeek-R1
数学やロジックの問題、複雑な分析など「考える力」が必要なタスクには、推論特化のDeepSeek-R1が向いています。答えを出す前に思考の過程を出力するタイプのモデルで、その分返答には時間がかかります。日常チャットには不向きですが、1つ入れておくと面白いモデルです。
プログラミング:コード特化モデル
コーディング支援には、qwen3-coderやgpt-oss:20bといったコード向けモデルが定番です。Claude CodeやCodexなどの開発ツールと連携させる場合も、このクラスのモデルが前提になります。サイズが大きめなので、メモリ16GB以上が現実的なラインです。
とにかく賢さ最優先:gpt-oss:120bなど(ハイスペック機向け)
性能を追うなら、ハイエンドGPU搭載機で動くgpt-oss:120bクラスが、一般に手が届く範囲の最上位です。なお、オープンモデルの本当の最強クラス(DeepSeek V4、Kimi K2.6、GLM-5.1など)はクラウドの有料AIに匹敵する性能ですが、パラメータ数が700B〜1兆とサーバー級のマシンが必要で、一般のパソコンでは動きません。「世界最強」ではなく「自分のパソコンで動く中の最強」を探すのが、ローカルAIの正しい楽しみ方です。
制限の少ないモデルが欲しい:Dolphinシリーズ
ローカルならではのジャンルとして、回答拒否をしないよう有志が改造した「無検閲モデル(uncensored/abliterated)」があります。定番は、古くからこのジャンルの代表格であるDolphinシリーズ。利用者が多く安定していますが、ベースが中型クラスまでなので賢さはそれなりです。
なお、生成物に法律が適用されるのは当然として、安全装置が一括で外れるため自己責任の度合いは一段上がります。初心者のうちは通常のモデルで十分です。
無検閲かつ高性能を求めるなら:上位モデルのabliterated版
無検閲モデルの中で性能を求める場合は、Dolphinとは別系統になります。QwenやGemmaといった上位モデルを有志が無検閲化した「abliterated版」がそれで、モデル一覧ページで「abliterated」と検索すると見つかります。理屈の上では「自分のPCで動く最大の上位モデル×無検閲版」が最強です。
ただし、無検閲化の改造で品質や日本語性能はベースモデルより落ちるのが普通で、巨大モデルのabliterated版はそもそも動かせる人が少ないため、定番として定着しているのは中型クラスまでです。「最強」と「定番」が乖離しているジャンルだと思ってください。
メモリ別の早見表
- 8GB:gemma4の軽量版(e4bなど)、qwen3.6の小型版(4bクラス)、llama3.2
- 16GB:qwen3.6の中型版(9b〜12bクラス)、gemma4:12b
- 32GB以上・ゲーミングPC:qwen3.6の大型版(27bクラス)、gemma4:26b、gpt-oss:20b
なお、Apple Silicon搭載のMac(M1以降)はメモリをCPUとGPUで共有する仕組みのため、同じメモリ容量でもローカルAIが快適に動きやすいです。Macユーザーは1ランク上のモデルを狙えることがあります。
モデルの管理と容量対策
モデルを試していると、ストレージがどんどん埋まっていきます。使わないモデルはこまめに削除しましょう。
- チャット画面のモデル選択欄から選べば、ダウンロードと切り替えができる(一覧にないモデルはターミナルで「ollama pull モデル名」)
- 不要なモデルは、ターミナルで「ollama rm モデル名」を実行すると削除できる
- 入っているモデルの一覧は「ollama list」で確認できる
「常用1つ+お試し1つ」くらいの運用にしておくと、容量に悩まされません。
この記事で紹介したモデル一覧
| モデル名 | 用途・特徴 | 必要メモリの目安 | ライセンス | 無検閲 |
|---|---|---|---|---|
| qwen3.6 | 日常チャット・日本語の文章作成。日本語性能トップクラス | 8GB〜(サイズによる) | Apache 2.0 | − |
| gemma4 | バランス・軽さ重視。e2b〜31bの5サイズ展開 | 8GB〜(サイズによる) | Apache 2.0 | − |
| llama3.2 | 軽量の定番 | 8GB | Llamaライセンス | − |
| deepseek-r1 | 推論特化。数学・ロジック向け | 16GB〜 | MIT | − |
| qwen3-coder | プログラミング特化 | 16GB〜 | Apache 2.0 | − |
| gpt-oss:20b | コーディング・高性能用途 | 32GB〜 | Apache 2.0 | − |
| gpt-oss:120b | 一般に手が届く範囲の最上位 | ハイエンドGPU必須 | Apache 2.0 | − |
| dolphin-llama3 | 無検閲モデルの定番(8bなら4.7GB) | 8GB〜 | Llamaライセンス | ○ |
| 上位モデルのabliterated版 | 無検閲かつ高性能。ベースモデルに準ずる | ベースモデルと同等 | ベースモデルに準ずる | ○ |
必要メモリはあくまで目安です。実際の快適さは、量子化の程度や他のアプリのメモリ使用量によっても変わります。ライセンスはいずれも商用利用可能ですが、Llamaライセンスには独自の利用条件があるため、ビジネスで本格利用する場合は原文の確認をおすすめします。また、ライセンスは執筆時点の情報なので、導入前に各モデルの公式ページで最新の条件を確認してください。
まとめ
- モデル名の数字(b)はAIの規模。メモリ8GBなら4bクラス、16GBなら9bクラスが目安
- 日本語重視ならQwen系、軽さ重視ならGemma系が定番
- 「cloud」つきモデルは外部送信されるローカルとは別物なので注意
- 合わなければ消して入れ替えればいいので、まず1つ試すのが正解
モデルの世代交代は数か月単位で起きるため、この記事のモデル名も今後更新していく予定です。最新のラインナップは、Ollamaアプリのモデル検索か、公式サイトのモデル一覧ページで確認できます。


コメント