Model lokal · Gratis

Jalankan model AI di mesin Anda sendiri

Unduh dan jalankan model Ollama dengan satu klik. Proyek memanggil embedding dan pelengkapan langsung melalui endpoint lokal—tanpa kunci, tanpa biaya, dan tetap di perangkat lokal.

Model lokal, satu endpoint langsung ke proyek Anda

Model berjalan di mesin Anda sendiri dan diekspos melalui endpoint lokal. Proyek PHP / Node / Python Anda memanggilnya seperti menggunakan API cloud—hanya saja data tidak pernah meninggalkan perangkat Anda.

Proyek Anda

PHP · Node · Python

Endpoint lokal

Pintu masuk API terpadu

Model Ollama

Berjalan di mesin Anda

Tiga langkah untuk menggunakan model lokal

Unduh Sekali Klik

Pilih sebuah model di ServBay untuk diunduh, mendukung resume unduhan, tidak perlu khawatir jika terputus.

Ekspos endpoint secara otomatis

Model pertama siap dan langsung diekspos melalui satu endpoint lokal tanpa perlu konfigurasi apa pun.

Panggilan langsung proyek

Arahkan proyek ke endpoint lokal dan panggil embedding serta pelengkapan seperti memanggil API cloud.

Apa yang akan kamu dapatkan

Unduh model sekali klik, mendukung melanjutkan dari titik terakhir

Model lokal diekspos melalui satu endpoint

Panggil embedding dan pelengkapan di proyek PHP / Node / Python

Tanpa Key, tanpa biaya, data tetap di perangkat Anda

〔Rilis Bersama〕Dukungan untuk llama.cpp dan MLX akan segera hadir

Panggil model lokal seperti memanggil API cloud

Satu antarmuka standar, ganti model hanya perlu mengubah satu nama.

ServBay · localhost:11434

# Memanggil model lokal, sama persis dengan API cloud

curl http://localhost:11434/v1/chat/completions \

-d '{"model": "llama3", "messages": […]}'

# Ganti model? Hanya ubah nama model

"model": "qwen2"

Model open source utama yang dapat dijalankan di perangkat ini

Model open source di perpustakaan model Ollama, dapat diunduh dan digunakan dengan satu klik.

Llama

Qwen

DeepSeek

Mistral

Gemma

Phi

...dan lebih banyak model di perpustakaan Ollama

Pertanyaan Umum

Model apa yang dapat dijalankan?

Semua model open source di perpustakaan Ollama, dari Llama, Qwen hingga DeepSeek, Mistral, dapat diunduh dan dijalankan dengan satu klik.

Apakah proyek lokal dapat langsung dipanggil?

Bisa. Melalui endpoint lokal, proyek PHP / Node / Python Anda dapat langsung memanggil embedding dan pelengkapan.

Apakah data akan diunggah?

Tidak. Model dan seluruh proses pemanggilan berjalan di mesin Anda sendiri, data tidak keluar dari perangkat Anda.

Dokumen

Catatan Rilis

Tentang Kami