AI 编程工具越来越多之后,新的问题不是“有没有工具可用”,而是如何管理它们。OllamaLM Studio 负责在本地运行大语言模型,Cherry Studio 负责统一使用多个模型服务,Dify 适合搭建 LLM 应用和工作流,cc-switchCodeIsland 则围绕 AI coding workflow 做增强:一个负责统一管理和切换 AI CLI 配置,另一个负责在 macOS 上观察和处理 AI 编程会话状态。

Ollama

Ollama 是一个本地运行大语言模型的工具。它可以下载、管理和运行模型,并在本机提供 HTTP API,适合做本地聊天、代码辅助、原型验证,以及给其他 AI 工具提供本地模型后端。

项目地址:https://github.com/ollama/ollama

官方文档:https://docs.ollama.com/

macOS 可以通过 Homebrew 安装命令行版本:

brew install ollama

如果需要图形应用,可以安装 Ollama app:

brew install --cask ollama-app

Linux 可以使用官方安装脚本:

curl -fsSL https://ollama.com/install.sh | sh

启动服务:

ollama serve

拉取模型:

ollama pull qwen3

运行模型并进入交互式对话:

ollama run qwen3

查看本地已有模型:

ollama list

删除模型:

ollama rm qwen3

Ollama 默认会在本机监听 11434 端口,可以用 API 调用:

curl http://localhost:11434/api/chat -d '{
  "model": "qwen3",
  "messages": [
    { "role": "user", "content": "用一句话解释什么是 RAG" }
  ]
}'

适合它的场景:

  • 在本机运行开源模型,减少对外部 API 的依赖。
  • 给原型项目提供本地 LLM API。
  • 测试不同模型在中文、代码、摘要等任务上的表现。
  • 配合 Open WebUI、Continue、Cursor、OpenCode 等工具使用。

需要注意,本地模型的体验强依赖硬件。模型越大,占用的内存、显存和磁盘空间越多。日常使用可以先从小模型开始,再根据机器性能选择更大的模型。

LM Studio

LM Studio 是一个本地大语言模型桌面应用。相比 Ollama 更偏命令行和服务端,LM Studio 更适合通过图形界面搜索、下载、运行和测试模型,也可以启动本地 OpenAI-compatible API server。

官网:https://lmstudio.ai/

官方文档:https://lmstudio.ai/docs

macOS 可以通过 Homebrew 安装:

brew install --cask lm-studio

也可以从官网下载 macOS、Windows 或 Linux 安装包。

基础使用流程:

  1. 打开 LM Studio
  2. 在模型搜索里查找 QwenLlamaGemmaDeepSeek 等模型。
  3. 根据机器内存、显存和模型大小选择合适的量化版本。
  4. 下载模型。
  5. 在 Chat 页面加载模型并开始对话。

LM Studio 也可以作为本地 API 服务使用。启动本地 server 后,默认常见地址是:

http://localhost:1234/v1

用 OpenAI-compatible API 调用示例:

curl http://localhost:1234/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{
    "model": "local-model",
    "messages": [
      { "role": "user", "content": "用一句话解释什么是本地大模型" }
    ],
    "temperature": 0.7
  }'

如果某个工具支持自定义 OpenAI base URL,通常可以把地址改成:

http://localhost:1234/v1

适合它的场景:

  • 想用图形界面管理本地模型。
  • 想快速试不同模型的聊天效果。
  • 想离线处理一些文本、摘要或轻量代码任务。
  • 想给本地工具提供 OpenAI-compatible API。
  • 想用 Hugging Face 上的 GGUF 模型,但不想手动管理模型文件。

LM StudioOllama 可以同时存在。偏命令行、脚本化和服务端场景时,可以优先用 Ollama;偏模型浏览、参数调试和桌面聊天时,LM Studio 会更直观。

Cherry Studio

Cherry Studio 是一个跨平台 AI 桌面客户端,支持接入多个 LLM provider,也支持连接本地模型服务,比如 OllamaLM Studio。它更像一个统一聊天和生产力入口,可以把不同模型、助手、话题、文件和工具集中到同一个界面里。

项目地址:https://github.com/CherryHQ/cherry-studio

官网:https://cherry-ai.com/

macOS 可以通过 Homebrew 安装:

brew install --cask cherry-studio

也可以从 GitHub Releases 或官网下载安装 Windows、macOS、Linux 版本。

基础使用流程:

  1. 打开 Cherry Studio
  2. 在设置里添加模型服务商,比如 OpenAI、Anthropic、Gemini、DeepSeek、Ollama 或 LM Studio。
  3. 配置 API key、base URL 和默认模型。
  4. 创建或选择助手。
  5. 在会话里开始使用模型。

如果要连接 Ollama,通常先启动本地服务:

ollama serve

然后在 Cherry Studio 里把 provider 指向本地地址:

http://localhost:11434

如果要连接 LM Studio,先在 LM Studio 里启动本地 server,然后把 OpenAI-compatible base URL 配成:

http://localhost:1234/v1

适合它的场景:

  • 同时使用多个云端模型和本地模型。
  • 想用桌面客户端管理不同助手和会话。
  • 想做多模型对比。
  • 想处理文档、图片、代码片段和长上下文对话。
  • 想把 MCP、本地模型和在线模型放到一个入口里。

Cherry Studio 更适合作为日常使用 AI 的桌面入口。它不负责训练模型,也不直接替代 OllamaLM Studio 的模型运行能力,而是把这些后端能力接入到统一界面里。

Dify

Dify 是一个开源的 LLM 应用开发平台。它不是单纯的聊天客户端,而是用来搭建 AI 应用、工作流、Agent、知识库和 API 服务的平台。适合把模型能力封装成面向团队或业务系统使用的应用。

项目地址:https://github.com/langgenius/dify

官方文档:https://docs.dify.ai/

常见能力包括:

  • 接入 OpenAI、Anthropic、Gemini、DeepSeek、Ollama 等模型服务。
  • 创建聊天助手、文本生成应用和工作流应用。
  • 管理知识库,用于 RAG 检索增强生成。
  • 编排多步骤工作流,把模型、条件判断、HTTP 请求和工具调用串起来。
  • 发布 API,让外部系统调用 Dify 应用。
  • 查看日志、调试提示词和分析调用效果。

本地或服务器自部署通常使用 Docker Compose。部署前需要准备 Docker 和 Docker Compose。官方文档建议最低配置为 2 核 CPU、4 GiB 内存;macOS 使用 Docker Desktop 时,建议给 Docker 虚拟机至少 2 个 vCPU 和 8 GiB 内存。

快速启动:

git clone --branch "$(curl -s https://api.github.com/repos/langgenius/dify/releases/latest | jq -r .tag_name)" https://github.com/langgenius/dify.git
cd dify/docker
cp .env.example .env
docker compose up -d

查看容器状态:

docker compose ps

首次初始化:

http://localhost/install

初始化完成后访问:

http://localhost

如果部署在服务器上,把 localhost 换成服务器 IP 或域名。生产环境建议配置 HTTPS、反向代理、数据备份和访问控制。

适合它的场景:

  • 想把提示词、知识库和模型配置封装成可复用应用。
  • 想搭建内部 AI 助手或客服机器人。
  • 想用可视化工作流编排多步骤 AI 任务。
  • 想给业务系统提供稳定的 AI API。
  • 想在团队里统一管理模型供应商、应用和调用日志。

DifyCherry Studio 的定位不同。Cherry Studio 更像个人桌面 AI 客户端,适合日常聊天和多模型使用;Dify 更像应用平台,适合把 AI 能力产品化、流程化,并提供给其他人或系统使用。

cc-switch

cc-switch 是一个面向 AI coding CLI 的桌面管理工具。它适合同时使用 Claude Code、Codex、Gemini CLI、OpenCode 等工具的场景,可以把 provider 配置、MCP、Prompts、Skills 和会话信息集中在一个界面里管理。

macOS 可以通过 Homebrew 安装:

brew tap farion1231/ccswitch
brew install --cask cc-switch

GitHub: https://github.com/farion1231/cc-switch

它解决的主要问题是配置分散。不同 AI CLI 往往有各自的 JSON、TOML、环境变量和本地配置目录,手动切换 provider 或同步配置很容易出错。cc-switch 把这些操作收拢成可视化界面,适合需要频繁切换模型、服务商或代理配置的人。

适合它的场景:

  • 同时使用多个 AI 编程 CLI。
  • 需要在不同 provider、API key、base URL 之间切换。
  • 希望统一管理 MCP、Prompts 和 Skills。
  • 想查看 AI CLI 会话、日志和使用状态。

如果只是偶尔使用单个 Claude Code 或 Codex,cc-switch 不是必需品。但当工具链变复杂后,它能减少很多手动改配置的成本。

CodeIsland

CodeIsland 是一个 macOS 上的 AI 编程会话状态面板。它利用 MacBook 的 notch / Dynamic Island 区域展示 AI coding agent 的运行状态,让你不用频繁在多个终端窗口之间切换。

macOS 可以通过 Homebrew 安装:

brew tap wxtsky/tap
brew install --cask codeisland

GitHub: https://github.com/wxtsky/CodeIsland

它更偏向“会话监控”和“工作流提醒”。当 Claude Code 等工具正在运行、等待输入、请求权限或完成任务时,CodeIsland 可以在屏幕顶部给出状态提示,并支持跳转回对应终端会话。

适合它的场景:

  • 同时运行多个 Claude Code 会话。
  • 经常忘记某个终端里 AI agent 正在等待确认。
  • 希望从屏幕顶部快速看到会话状态。
  • 使用 cmux、Ghostty、iTerm2、Terminal.app 等终端管理多个项目。

CodeIsland 对重度 AI 编程用户更有价值。尤其是同时开多个项目、多个 agent 会话时,它能减少反复 Alt-Tab 查状态的次数。

总结

这些工具关注的是 AI 编程工作流的不同层面:

  • Ollama:通过命令行和本地服务运行大语言模型。
  • LM Studio:通过桌面界面管理模型,并提供本地 OpenAI-compatible API。
  • Cherry Studio:统一接入云端和本地模型,管理助手、会话和工具。
  • Dify:搭建 LLM 应用、知识库、Agent 和工作流。
  • cc-switch:管理和切换 AI CLI 配置。
  • CodeIsland:观察和处理 AI 编程会话状态。

如果你只是偶尔使用 AI 编程工具,可以先保持简单;如果想要本地模型,可以从 OllamaLM Studio 开始;如果想统一管理云端和本地模型,可以使用 Cherry Studio;如果想把模型能力做成应用或工作流,可以使用 Dify;如果已经同时使用多个 CLI、多个 provider、多个终端会话,cc-switchCodeIsland 这类辅助工具会让工作流更稳定。