本地模型 · 免費

在你自己的機器上運行 AI 模型

一鍵下載、運行 Ollama 模型。項目可透過本地端點直接調用 embedding 和補全——免 Key、零成本、不出本機。

下載 ServBay 查看如何調用

本地模型，一個端點直達你的項目

模型運行在你自己的機器上，通過本地端點對外提供服務。你的 PHP / Node / Python 專案可以像調用雲端 API 一樣調用它——只是資料永遠不會離開本機。

你的專案

PHP · Node · Python

本機端點

統一 API 入口

Ollama 模型

在你的機器上運行

三步即可使用本地模型

一鍵下載

在 ServBay 裡選擇一個模型下載，支援斷點續傳，不怕中斷。

自動暴露端點

模型一旦就緒，即可透過單一本地端點統一暴露，無需任何設定。

項目直接調用

將項目指向本地端點，像調用雲端 API 一樣呼叫 embedding 和補全。

你可以獲得什麼

一鍵模型下載，支援斷點續傳

本地模型透過一個端點統一暴露

在 PHP / Node / Python 專案中調用 embedding 和補全

免 Key、零成本，資料不出本機

〔隨版本上線〕llama.cpp 與 MLX 支援即將到來

像調用雲端 API 一樣，調用本地模型

一個標準介面，換模型只需改一個名稱。

ServBay · localhost:11434

# 調用本地模型，與雲端 API 完全相同

curl http://localhost:11434/v1/chat/completions \

-d '{"model": "llama3", "messages": […]}'

# 換模型？只改 model 名稱

"model": "qwen2"

可在本機運行的主流開源模型

Ollama 模型庫中的開源模型，一鍵下載即可使用。

Llama

Qwen

DeepSeek

Mistral

Gemma

Phi

……以及 Ollama 庫裡的更多模型

常見問題

可以運行哪些模型？

Ollama 庫中的所有開源模型，從 Llama、Qwen 到 DeepSeek、Mistral，一鍵下載、運行。

本機專案能直接調用嗎？

可以。透過本地端點，你的 PHP / Node / Python 專案可以直接調用 embedding 和補全。

資料會上傳嗎？

不會。模型和調用全程都在你自己的機器上，資料不會離開本機。

文檔

發行說明

關於我們