Modello locale · Gratuito

Esegui modelli AI sulla tua macchina

Scarica e avvia i modelli Ollama con un solo clic. Il progetto richiama direttamente embedding e completamento tramite un endpoint locale—senza chiavi, a costo zero e tutto in locale.

Esegui modelli AI sulla tua macchina

Modello locale, un endpoint diretto al tuo progetto

Il modello viene eseguito sulla tua macchina e viene esposto tramite un endpoint locale. I tuoi progetti PHP / Node / Python lo chiamano come un'API cloud, ma i dati non lasciano mai il tuo dispositivo.

Il tuo progetto
PHP · Node · Python
Endpoint locale
Ingresso API unificato
Modello Ollama
Eseguito sulla tua macchina

Tre passaggi per utilizzare il modello locale

1

Download con un clic

Scegli un modello da scaricare in ServBay, il download supporta la ripresa automatica, quindi non devi preoccuparti delle interruzioni.

2

Esposizione automatica degli endpoint

Non appena il modello è pronto, viene esposto tramite un endpoint locale unificato, senza bisogno di alcuna configurazione.

3

Chiamata diretta del progetto

Punta il progetto verso l'endpoint locale e richiama embedding e completamento come se stessi utilizzando un'API cloud.

Cosa puoi ottenere

Download del modello con un clic, supporta la ripresa dei download interrotti
I modelli locali sono esposti tramite un unico endpoint
Richiama embedding e completamento nei progetti PHP / Node / Python
Nessuna chiave, zero costi, i dati non lasciano il dispositivo
Supporto per llama.cpp e MLX in arrivo con la prossima versione

Richiama i modelli locali come se stessi utilizzando un'API cloud.

Un'interfaccia standard: per cambiare modello basta modificare un nome.

ServBay · localhost:11434
# Chiama il modello locale, esattamente come l'API cloud
curl http://localhost:11434/v1/chat/completions \
-d '{"model": "llama3", "messages": […]}'
# Cambiare modello? Basta modificare il nome del model
"model": "qwen2"

Modelli open source principali eseguibili in locale

Modelli open source nella libreria dei modelli di Ollama, scaricabili e utilizzabili con un clic.

Llama
Qwen
DeepSeek
Mistral
Gemma
Phi

...e molti altri modelli nella libreria di Ollama

Domande frequenti

Quali modelli possono essere eseguiti?

Tutti i modelli open source nella libreria Ollama, da Llama, Qwen a DeepSeek, Mistral: scarica e avvia con un solo clic.

Il progetto locale può essere chiamato direttamente?

Sì. Tramite un endpoint locale, il tuo progetto PHP / Node / Python può chiamare direttamente embedding e completamento.

I dati verranno caricati?

No. Il modello e tutte le operazioni vengono eseguiti interamente sulla tua macchina, i dati non lasciano mai il dispositivo.

Download gratuito

ServBay AI Helper
ServBay AI Helper