Mô hình cục bộ · Miễn phí

Chạy mô hình AI trên máy của bạn

Tải xuống và chạy mô hình Ollama chỉ với một cú nhấp chuột. Dự án gọi trực tiếp embedding và hoàn thành thông qua một endpoint cục bộ—không cần Key, không tốn chi phí, không rời khỏi máy của bạn.

Mô hình cục bộ, một điểm cuối kết nối trực tiếp với dự án của bạn

Mô hình chạy trên máy của bạn và được cung cấp qua một endpoint cục bộ. Dự án PHP / Node / Python của bạn có thể gọi nó như gọi một API trên đám mây—chỉ khác là dữ liệu không bao giờ rời khỏi máy của bạn.

Dự án của bạn

PHP · Node · Python

Điểm cuối cục bộ

Cổng API thống nhất

Mô hình Ollama

Chạy trên máy của bạn

Ba bước để sử dụng mô hình cục bộ

Tải xuống một lần nhấn

Chọn một mô hình trong ServBay để tải về, hỗ trợ tiếp tục tải khi bị gián đoạn, không lo bị ngắt quãng.

Tự động lộ điểm cuối

Ngay khi mô hình sẵn sàng, nó sẽ được cung cấp qua một điểm cuối cục bộ duy nhất mà không cần bất kỳ cấu hình nào.

Gọi trực tiếp dự án

Chỉ định dự án đến endpoint cục bộ, gọi embedding và hoàn thành giống như gọi API trên đám mây.

Bạn sẽ nhận được gì

Tải mô hình chỉ với một cú nhấp chuột, hỗ trợ tiếp tục tải khi bị gián đoạn

Mô hình cục bộ được cung cấp thông qua một điểm cuối duy nhất

Gọi embedding và hoàn thiện trong dự án PHP / Node / Python

Miễn Key, không tốn chi phí, dữ liệu không rời khỏi máy của bạn

〔Ra mắt cùng phiên bản〕llama.cpp và MLX sẽ được hỗ trợ sớm

Gọi mô hình cục bộ giống như gọi API trên đám mây

Một giao diện chuẩn, chỉ cần đổi tên để thay đổi mô hình.

ServBay · localhost:11434

# Gọi mô hình cục bộ, giống hệt như API trên đám mây

curl http://localhost:11434/v1/chat/completions \

-d '{"model": "llama3", "messages": […]}'

# Đổi mô hình? Chỉ thay tên model

"model": "qwen2"

Các mô hình mã nguồn mở phổ biến có thể chạy trên máy cục bộ

Các mô hình mã nguồn mở trong thư viện mô hình Ollama, chỉ cần một lần nhấn để tải về và sử dụng ngay.

Llama

Qwen

DeepSeek

Mistral

Gemma

Phi

...và nhiều mô hình khác trong thư viện Ollama

Câu hỏi thường gặp

Có thể chạy những mô hình nào?

Tất cả các mô hình mã nguồn mở trong thư viện Ollama, từ Llama, Qwen đến DeepSeek, Mistral, đều có thể tải xuống và chạy chỉ với một cú nhấp chuột.

Dự án cục bộ có thể gọi trực tiếp không?

Có thể. Thông qua một endpoint cục bộ, dự án PHP / Node / Python của bạn có thể gọi trực tiếp embedding và hoàn thiện.

Dữ liệu có được tải lên không?

Không. Mô hình và quá trình gọi đều diễn ra trên chính máy của bạn, dữ liệu không rời khỏi máy.

Tài liệu

Ghi chú phát hành

Về chúng tôi