Mô hình cục bộ · Miễn phí

Chạy mô hình AI trên máy của bạn

Tải xuống và chạy mô hình Ollama chỉ với một cú nhấp chuột. Dự án gọi trực tiếp embedding và hoàn thành thông qua một endpoint cục bộ—không cần Key, không tốn chi phí, không rời khỏi máy của bạn.

Chạy mô hình AI trên máy của bạn

Mô hình cục bộ, một điểm cuối kết nối trực tiếp với dự án của bạn

Mô hình chạy trên máy của bạn và được cung cấp qua một endpoint cục bộ. Dự án PHP / Node / Python của bạn có thể gọi nó như gọi một API trên đám mây—chỉ khác là dữ liệu không bao giờ rời khỏi máy của bạn.

Dự án của bạn
PHP · Node · Python
Điểm cuối cục bộ
Cổng API thống nhất
Mô hình Ollama
Chạy trên máy của bạn

Ba bước để sử dụng mô hình cục bộ

1

Tải xuống một lần nhấn

Chọn một mô hình trong ServBay để tải về, hỗ trợ tiếp tục tải khi bị gián đoạn, không lo bị ngắt quãng.

2

Tự động lộ điểm cuối

Ngay khi mô hình sẵn sàng, nó sẽ được cung cấp qua một điểm cuối cục bộ duy nhất mà không cần bất kỳ cấu hình nào.

3

Gọi trực tiếp dự án

Chỉ định dự án đến endpoint cục bộ, gọi embedding và hoàn thành giống như gọi API trên đám mây.

Bạn sẽ nhận được gì

Tải mô hình chỉ với một cú nhấp chuột, hỗ trợ tiếp tục tải khi bị gián đoạn
Mô hình cục bộ được cung cấp thông qua một điểm cuối duy nhất
Gọi embedding và hoàn thiện trong dự án PHP / Node / Python
Miễn Key, không tốn chi phí, dữ liệu không rời khỏi máy của bạn
〔Ra mắt cùng phiên bản〕llama.cpp và MLX sẽ được hỗ trợ sớm

Gọi mô hình cục bộ giống như gọi API trên đám mây

Một giao diện chuẩn, chỉ cần đổi tên để thay đổi mô hình.

ServBay · localhost:11434
# Gọi mô hình cục bộ, giống hệt như API trên đám mây
curl http://localhost:11434/v1/chat/completions \
-d '{"model": "llama3", "messages": […]}'
# Đổi mô hình? Chỉ thay tên model
"model": "qwen2"

Các mô hình mã nguồn mở phổ biến có thể chạy trên máy cục bộ

Các mô hình mã nguồn mở trong thư viện mô hình Ollama, chỉ cần một lần nhấn để tải về và sử dụng ngay.

Llama
Qwen
DeepSeek
Mistral
Gemma
Phi

...và nhiều mô hình khác trong thư viện Ollama

Câu hỏi thường gặp

Có thể chạy những mô hình nào?

Tất cả các mô hình mã nguồn mở trong thư viện Ollama, từ Llama, Qwen đến DeepSeek, Mistral, đều có thể tải xuống và chạy chỉ với một cú nhấp chuột.

Dự án cục bộ có thể gọi trực tiếp không?

Có thể. Thông qua một endpoint cục bộ, dự án PHP / Node / Python của bạn có thể gọi trực tiếp embedding và hoàn thiện.

Dữ liệu có được tải lên không?

Không. Mô hình và quá trình gọi đều diễn ra trên chính máy của bạn, dữ liệu không rời khỏi máy.

Tải về miễn phí

ServBay AI Helper
ServBay AI Helper