AI 编程工具越来越多之后,新的问题不是“有没有工具可用”,而是如何管理它们。Ollama 和 LM Studio 负责在本地运行大语言模型,Cherry Studio 负责统一使用多个模型服务,Dify 适合搭建 LLM 应用和工作流,cc-switch 和 CodeIsland 则围绕 AI coding workflow 做增强:一个负责统一管理和切换 AI CLI 配置,另一个负责在 macOS 上观察和处理 AI 编程会话状态。
Ollama
Ollama 是一个本地运行大语言模型的工具。它可以下载、管理和运行模型,并在本机提供 HTTP API,适合做本地聊天、代码辅助、原型验证,以及给其他 AI 工具提供本地模型后端。
项目地址:https://github.com/ollama/ollama
macOS 可以通过 Homebrew 安装命令行版本:
brew install ollama
如果需要图形应用,可以安装 Ollama app:
brew install --cask ollama-app
Linux 可以使用官方安装脚本:
curl -fsSL https://ollama.com/install.sh | sh
启动服务:
ollama serve
拉取模型:
ollama pull qwen3
运行模型并进入交互式对话:
ollama run qwen3
查看本地已有模型:
ollama list
删除模型:
ollama rm qwen3
Ollama 默认会在本机监听 11434 端口,可以用 API 调用:
curl http://localhost:11434/api/chat -d '{
"model": "qwen3",
"messages": [
{ "role": "user", "content": "用一句话解释什么是 RAG" }
]
}'
适合它的场景:
- 在本机运行开源模型,减少对外部 API 的依赖。
- 给原型项目提供本地 LLM API。
- 测试不同模型在中文、代码、摘要等任务上的表现。
- 配合 Open WebUI、Continue、Cursor、OpenCode 等工具使用。
需要注意,本地模型的体验强依赖硬件。模型越大,占用的内存、显存和磁盘空间越多。日常使用可以先从小模型开始,再根据机器性能选择更大的模型。
LM Studio
LM Studio 是一个本地大语言模型桌面应用。相比 Ollama 更偏命令行和服务端,LM Studio 更适合通过图形界面搜索、下载、运行和测试模型,也可以启动本地 OpenAI-compatible API server。
macOS 可以通过 Homebrew 安装:
brew install --cask lm-studio
也可以从官网下载 macOS、Windows 或 Linux 安装包。
基础使用流程:
- 打开
LM Studio。 - 在模型搜索里查找
Qwen、Llama、Gemma、DeepSeek等模型。 - 根据机器内存、显存和模型大小选择合适的量化版本。
- 下载模型。
- 在 Chat 页面加载模型并开始对话。
LM Studio 也可以作为本地 API 服务使用。启动本地 server 后,默认常见地址是:
http://localhost:1234/v1
用 OpenAI-compatible API 调用示例:
curl http://localhost:1234/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{
"model": "local-model",
"messages": [
{ "role": "user", "content": "用一句话解释什么是本地大模型" }
],
"temperature": 0.7
}'
如果某个工具支持自定义 OpenAI base URL,通常可以把地址改成:
http://localhost:1234/v1
适合它的场景:
- 想用图形界面管理本地模型。
- 想快速试不同模型的聊天效果。
- 想离线处理一些文本、摘要或轻量代码任务。
- 想给本地工具提供 OpenAI-compatible API。
- 想用 Hugging Face 上的 GGUF 模型,但不想手动管理模型文件。
LM Studio 和 Ollama 可以同时存在。偏命令行、脚本化和服务端场景时,可以优先用 Ollama;偏模型浏览、参数调试和桌面聊天时,LM Studio 会更直观。
Cherry Studio
Cherry Studio 是一个跨平台 AI 桌面客户端,支持接入多个 LLM provider,也支持连接本地模型服务,比如 Ollama 和 LM Studio。它更像一个统一聊天和生产力入口,可以把不同模型、助手、话题、文件和工具集中到同一个界面里。
项目地址:https://github.com/CherryHQ/cherry-studio
macOS 可以通过 Homebrew 安装:
brew install --cask cherry-studio
也可以从 GitHub Releases 或官网下载安装 Windows、macOS、Linux 版本。
基础使用流程:
- 打开
Cherry Studio。 - 在设置里添加模型服务商,比如 OpenAI、Anthropic、Gemini、DeepSeek、Ollama 或 LM Studio。
- 配置 API key、base URL 和默认模型。
- 创建或选择助手。
- 在会话里开始使用模型。
如果要连接 Ollama,通常先启动本地服务:
ollama serve
然后在 Cherry Studio 里把 provider 指向本地地址:
http://localhost:11434
如果要连接 LM Studio,先在 LM Studio 里启动本地 server,然后把 OpenAI-compatible base URL 配成:
http://localhost:1234/v1
适合它的场景:
- 同时使用多个云端模型和本地模型。
- 想用桌面客户端管理不同助手和会话。
- 想做多模型对比。
- 想处理文档、图片、代码片段和长上下文对话。
- 想把 MCP、本地模型和在线模型放到一个入口里。
Cherry Studio 更适合作为日常使用 AI 的桌面入口。它不负责训练模型,也不直接替代 Ollama 或 LM Studio 的模型运行能力,而是把这些后端能力接入到统一界面里。
Dify
Dify 是一个开源的 LLM 应用开发平台。它不是单纯的聊天客户端,而是用来搭建 AI 应用、工作流、Agent、知识库和 API 服务的平台。适合把模型能力封装成面向团队或业务系统使用的应用。
项目地址:https://github.com/langgenius/dify
常见能力包括:
- 接入 OpenAI、Anthropic、Gemini、DeepSeek、Ollama 等模型服务。
- 创建聊天助手、文本生成应用和工作流应用。
- 管理知识库,用于 RAG 检索增强生成。
- 编排多步骤工作流,把模型、条件判断、HTTP 请求和工具调用串起来。
- 发布 API,让外部系统调用 Dify 应用。
- 查看日志、调试提示词和分析调用效果。
本地或服务器自部署通常使用 Docker Compose。部署前需要准备 Docker 和 Docker Compose。官方文档建议最低配置为 2 核 CPU、4 GiB 内存;macOS 使用 Docker Desktop 时,建议给 Docker 虚拟机至少 2 个 vCPU 和 8 GiB 内存。
快速启动:
git clone --branch "$(curl -s https://api.github.com/repos/langgenius/dify/releases/latest | jq -r .tag_name)" https://github.com/langgenius/dify.git
cd dify/docker
cp .env.example .env
docker compose up -d
查看容器状态:
docker compose ps
首次初始化:
http://localhost/install
初始化完成后访问:
http://localhost
如果部署在服务器上,把 localhost 换成服务器 IP 或域名。生产环境建议配置 HTTPS、反向代理、数据备份和访问控制。
适合它的场景:
- 想把提示词、知识库和模型配置封装成可复用应用。
- 想搭建内部 AI 助手或客服机器人。
- 想用可视化工作流编排多步骤 AI 任务。
- 想给业务系统提供稳定的 AI API。
- 想在团队里统一管理模型供应商、应用和调用日志。
Dify 和 Cherry Studio 的定位不同。Cherry Studio 更像个人桌面 AI 客户端,适合日常聊天和多模型使用;Dify 更像应用平台,适合把 AI 能力产品化、流程化,并提供给其他人或系统使用。
cc-switch
cc-switch 是一个面向 AI coding CLI 的桌面管理工具。它适合同时使用 Claude Code、Codex、Gemini CLI、OpenCode 等工具的场景,可以把 provider 配置、MCP、Prompts、Skills 和会话信息集中在一个界面里管理。
macOS 可以通过 Homebrew 安装:
brew tap farion1231/ccswitch
brew install --cask cc-switch
GitHub: https://github.com/farion1231/cc-switch
它解决的主要问题是配置分散。不同 AI CLI 往往有各自的 JSON、TOML、环境变量和本地配置目录,手动切换 provider 或同步配置很容易出错。cc-switch 把这些操作收拢成可视化界面,适合需要频繁切换模型、服务商或代理配置的人。
适合它的场景:
- 同时使用多个 AI 编程 CLI。
- 需要在不同 provider、API key、base URL 之间切换。
- 希望统一管理 MCP、Prompts 和 Skills。
- 想查看 AI CLI 会话、日志和使用状态。
如果只是偶尔使用单个 Claude Code 或 Codex,cc-switch 不是必需品。但当工具链变复杂后,它能减少很多手动改配置的成本。
CodeIsland
CodeIsland 是一个 macOS 上的 AI 编程会话状态面板。它利用 MacBook 的 notch / Dynamic Island 区域展示 AI coding agent 的运行状态,让你不用频繁在多个终端窗口之间切换。
macOS 可以通过 Homebrew 安装:
brew tap wxtsky/tap
brew install --cask codeisland
GitHub: https://github.com/wxtsky/CodeIsland
它更偏向“会话监控”和“工作流提醒”。当 Claude Code 等工具正在运行、等待输入、请求权限或完成任务时,CodeIsland 可以在屏幕顶部给出状态提示,并支持跳转回对应终端会话。
适合它的场景:
- 同时运行多个 Claude Code 会话。
- 经常忘记某个终端里 AI agent 正在等待确认。
- 希望从屏幕顶部快速看到会话状态。
- 使用 cmux、Ghostty、iTerm2、Terminal.app 等终端管理多个项目。
CodeIsland 对重度 AI 编程用户更有价值。尤其是同时开多个项目、多个 agent 会话时,它能减少反复 Alt-Tab 查状态的次数。
总结
这些工具关注的是 AI 编程工作流的不同层面:
Ollama:通过命令行和本地服务运行大语言模型。LM Studio:通过桌面界面管理模型,并提供本地 OpenAI-compatible API。Cherry Studio:统一接入云端和本地模型,管理助手、会话和工具。Dify:搭建 LLM 应用、知识库、Agent 和工作流。cc-switch:管理和切换 AI CLI 配置。CodeIsland:观察和处理 AI 编程会话状态。
如果你只是偶尔使用 AI 编程工具,可以先保持简单;如果想要本地模型,可以从 Ollama 或 LM Studio 开始;如果想统一管理云端和本地模型,可以使用 Cherry Studio;如果想把模型能力做成应用或工作流,可以使用 Dify;如果已经同时使用多个 CLI、多个 provider、多个终端会话,cc-switch 和 CodeIsland 这类辅助工具会让工作流更稳定。