本地模型 · 免费

在你自己的机器上跑 AI 模型

一键下载、运行 Ollama 模型。项目通过一个本地端点直接调用 embedding 和补全——免 Key、零成本、不出本机。

下载 ServBay 看如何调用

本地模型，一个端点直达你的项目

模型跑在你自己的机器上，通过一个本地端点暴露。你的 PHP / Node / Python 项目像调云端 API 一样调用它——只是数据从不离开本机。

你的项目

PHP · Node · Python

本地端点

统一 API 入口

Ollama 模型

跑在你的机器上

三步用上本地模型

一键下载

在 ServBay 里挑一个模型点下载，支持断点续传，不怕中断。

自动暴露端点

模型一就绪，就通过一个本地端点统一暴露，无需任何配置。

项目直接调用

把项目指向本地端点，像调云端 API 一样调用 embedding 和补全。

你能得到什么

一键模型下载，支持断点续传

本地模型经一个端点统一暴露

在 PHP / Node / Python 项目里调用 embedding 和补全

免 Key、零成本，数据不出本机

〔随版上线〕llama.cpp 与 MLX 支持即将到来

像调云端 API 一样，调用本地模型

一个标准接口，换模型只改一个名字。

ServBay · localhost:11434

# 调用本地模型，和云端 API 一模一样

curl http://localhost:11434/v1/chat/completions \

-d '{"model": "llama3", "messages": […]}'

# 换模型？只改 model 名字

"model": "qwen2"

能在本机跑的主流开源模型

Ollama 模型库里的开源模型，一键下载即用。

Llama

Qwen

DeepSeek

Mistral

Gemma

Phi

……以及 Ollama 库里的更多模型

常见问题

能跑哪些模型？

Ollama 库里的所有开源模型，从 Llama、Qwen 到 DeepSeek、Mistral，一键下载、运行。

本地项目能直接调用吗？

能。通过一个本地端点，你的 PHP / Node / Python 项目可以直接调用 embedding 和补全。

数据会上传吗？

不会。模型和调用全程在你自己的机器上，数据不出本机。

文档

发行说明

关于我们