本地模型 · 免费

在你自己的机器上跑 AI 模型

一键下载、运行 Ollama 模型。项目通过一个本地端点直接调用 embedding 和补全——免 Key、零成本、不出本机。

在你自己的机器上跑 AI 模型

本地模型,一个端点直达你的项目

模型跑在你自己的机器上,通过一个本地端点暴露。你的 PHP / Node / Python 项目像调云端 API 一样调用它——只是数据从不离开本机。

你的项目
PHP · Node · Python
本地端点
统一 API 入口
Ollama 模型
跑在你的机器上

三步用上本地模型

1

一键下载

在 ServBay 里挑一个模型点下载,支持断点续传,不怕中断。

2

自动暴露端点

模型一就绪,就通过一个本地端点统一暴露,无需任何配置。

3

项目直接调用

把项目指向本地端点,像调云端 API 一样调用 embedding 和补全。

你能得到什么

一键模型下载,支持断点续传
本地模型经一个端点统一暴露
在 PHP / Node / Python 项目里调用 embedding 和补全
免 Key、零成本,数据不出本机
〔随版上线〕llama.cpp 与 MLX 支持即将到来

像调云端 API 一样,调用本地模型

一个标准接口,换模型只改一个名字。

ServBay · localhost:11434
# 调用本地模型,和云端 API 一模一样
curl http://localhost:11434/v1/chat/completions \
-d '{"model": "llama3", "messages": […]}'
# 换模型?只改 model 名字
"model": "qwen2"

能在本机跑的主流开源模型

Ollama 模型库里的开源模型,一键下载即用。

Llama
Qwen
DeepSeek
Mistral
Gemma
Phi

……以及 Ollama 库里的更多模型

常见问题

能跑哪些模型?

Ollama 库里的所有开源模型,从 Llama、Qwen 到 DeepSeek、Mistral,一键下载、运行。

本地项目能直接调用吗?

能。通过一个本地端点,你的 PHP / Node / Python 项目可以直接调用 embedding 和补全。

数据会上传吗?

不会。模型和调用全程在你自己的机器上,数据不出本机。

免费下载

ServBay AI Helper
ServBay AI Helper