Model lokal · Gratis

Jalankan model AI di mesin Anda sendiri

Unduh dan jalankan model Ollama dengan satu klik. Proyek memanggil embedding dan pelengkapan langsung melalui endpoint lokal—tanpa kunci, tanpa biaya, dan tetap di perangkat lokal.

Jalankan model AI di mesin Anda sendiri

Model lokal, satu endpoint langsung ke proyek Anda

Model berjalan di mesin Anda sendiri dan diekspos melalui endpoint lokal. Proyek PHP / Node / Python Anda memanggilnya seperti menggunakan API cloud—hanya saja data tidak pernah meninggalkan perangkat Anda.

Proyek Anda
PHP · Node · Python
Endpoint lokal
Pintu masuk API terpadu
Model Ollama
Berjalan di mesin Anda

Tiga langkah untuk menggunakan model lokal

1

Unduh Sekali Klik

Pilih sebuah model di ServBay untuk diunduh, mendukung resume unduhan, tidak perlu khawatir jika terputus.

2

Ekspos endpoint secara otomatis

Model pertama siap dan langsung diekspos melalui satu endpoint lokal tanpa perlu konfigurasi apa pun.

3

Panggilan langsung proyek

Arahkan proyek ke endpoint lokal dan panggil embedding serta pelengkapan seperti memanggil API cloud.

Apa yang akan kamu dapatkan

Unduh model sekali klik, mendukung melanjutkan dari titik terakhir
Model lokal diekspos melalui satu endpoint
Panggil embedding dan pelengkapan di proyek PHP / Node / Python
Tanpa Key, tanpa biaya, data tetap di perangkat Anda
〔Rilis Bersama〕Dukungan untuk llama.cpp dan MLX akan segera hadir

Panggil model lokal seperti memanggil API cloud

Satu antarmuka standar, ganti model hanya perlu mengubah satu nama.

ServBay · localhost:11434
# Memanggil model lokal, sama persis dengan API cloud
curl http://localhost:11434/v1/chat/completions \
-d '{"model": "llama3", "messages": […]}'
# Ganti model? Hanya ubah nama model
"model": "qwen2"

Model open source utama yang dapat dijalankan di perangkat ini

Model open source di perpustakaan model Ollama, dapat diunduh dan digunakan dengan satu klik.

Llama
Qwen
DeepSeek
Mistral
Gemma
Phi

...dan lebih banyak model di perpustakaan Ollama

Pertanyaan Umum

Model apa yang dapat dijalankan?

Semua model open source di perpustakaan Ollama, dari Llama, Qwen hingga DeepSeek, Mistral, dapat diunduh dan dijalankan dengan satu klik.

Apakah proyek lokal dapat langsung dipanggil?

Bisa. Melalui endpoint lokal, proyek PHP / Node / Python Anda dapat langsung memanggil embedding dan pelengkapan.

Apakah data akan diunggah?

Tidak. Model dan seluruh proses pemanggilan berjalan di mesin Anda sendiri, data tidak keluar dari perangkat Anda.

Unduh Gratis

ServBay AI Helper
ServBay AI Helper