本地模型 · 免費

在你自己的機器上運行 AI 模型

一鍵下載、運行 Ollama 模型。項目可透過本地端點直接調用 embedding 和補全——免 Key、零成本、不出本機。

在你自己的機器上運行 AI 模型

本地模型,一個端點直達你的項目

模型運行在你自己的機器上,通過本地端點對外提供服務。你的 PHP / Node / Python 專案可以像調用雲端 API 一樣調用它——只是資料永遠不會離開本機。

你的專案
PHP · Node · Python
本機端點
統一 API 入口
Ollama 模型
在你的機器上運行

三步即可使用本地模型

1

一鍵下載

在 ServBay 裡選擇一個模型下載,支援斷點續傳,不怕中斷。

2

自動暴露端點

模型一旦就緒,即可透過單一本地端點統一暴露,無需任何設定。

3

項目直接調用

將項目指向本地端點,像調用雲端 API 一樣呼叫 embedding 和補全。

你可以獲得什麼

一鍵模型下載,支援斷點續傳
本地模型透過一個端點統一暴露
在 PHP / Node / Python 專案中調用 embedding 和補全
免 Key、零成本,資料不出本機
〔隨版本上線〕llama.cpp 與 MLX 支援即將到來

像調用雲端 API 一樣,調用本地模型

一個標準介面,換模型只需改一個名稱。

ServBay · localhost:11434
# 調用本地模型,與雲端 API 完全相同
curl http://localhost:11434/v1/chat/completions \
-d '{"model": "llama3", "messages": […]}'
# 換模型?只改 model 名稱
"model": "qwen2"

可在本機運行的主流開源模型

Ollama 模型庫中的開源模型,一鍵下載即可使用。

Llama
Qwen
DeepSeek
Mistral
Gemma
Phi

……以及 Ollama 庫裡的更多模型

常見問題

可以運行哪些模型?

Ollama 庫中的所有開源模型,從 Llama、Qwen 到 DeepSeek、Mistral,一鍵下載、運行。

本機專案能直接調用嗎?

可以。透過本地端點,你的 PHP / Node / Python 專案可以直接調用 embedding 和補全。

資料會上傳嗎?

不會。模型和調用全程都在你自己的機器上,資料不會離開本機。

免費下載

ServBay AI Helper
ServBay AI Helper