Modello locale · Gratuito

Esegui modelli AI sulla tua macchina

Scarica e avvia i modelli Ollama con un solo clic. Il progetto richiama direttamente embedding e completamento tramite un endpoint locale—senza chiavi, a costo zero e tutto in locale.

Modello locale, un endpoint diretto al tuo progetto

Il modello viene eseguito sulla tua macchina e viene esposto tramite un endpoint locale. I tuoi progetti PHP / Node / Python lo chiamano come un'API cloud, ma i dati non lasciano mai il tuo dispositivo.

Il tuo progetto

PHP · Node · Python

Endpoint locale

Ingresso API unificato

Modello Ollama

Eseguito sulla tua macchina

Tre passaggi per utilizzare il modello locale

Download con un clic

Scegli un modello da scaricare in ServBay, il download supporta la ripresa automatica, quindi non devi preoccuparti delle interruzioni.

Esposizione automatica degli endpoint

Non appena il modello è pronto, viene esposto tramite un endpoint locale unificato, senza bisogno di alcuna configurazione.

Chiamata diretta del progetto

Punta il progetto verso l'endpoint locale e richiama embedding e completamento come se stessi utilizzando un'API cloud.

Cosa puoi ottenere

Download del modello con un clic, supporta la ripresa dei download interrotti

I modelli locali sono esposti tramite un unico endpoint

Richiama embedding e completamento nei progetti PHP / Node / Python

Nessuna chiave, zero costi, i dati non lasciano il dispositivo

Supporto per llama.cpp e MLX in arrivo con la prossima versione

Richiama i modelli locali come se stessi utilizzando un'API cloud.

Un'interfaccia standard: per cambiare modello basta modificare un nome.

ServBay · localhost:11434

# Chiama il modello locale, esattamente come l'API cloud

curl http://localhost:11434/v1/chat/completions \

-d '{"model": "llama3", "messages": […]}'

# Cambiare modello? Basta modificare il nome del model

"model": "qwen2"

Modelli open source principali eseguibili in locale

Modelli open source nella libreria dei modelli di Ollama, scaricabili e utilizzabili con un clic.

Llama

Qwen

DeepSeek

Mistral

Gemma

Phi

...e molti altri modelli nella libreria di Ollama

Domande frequenti

Quali modelli possono essere eseguiti?

Tutti i modelli open source nella libreria Ollama, da Llama, Qwen a DeepSeek, Mistral: scarica e avvia con un solo clic.

Il progetto locale può essere chiamato direttamente?

Sì. Tramite un endpoint locale, il tuo progetto PHP / Node / Python può chiamare direttamente embedding e completamento.

I dati verranno caricati?

No. Il modello e tutte le operazioni vengono eseguiti interamente sulla tua macchina, i dati non lasciano mai il dispositivo.

Documentazione

Note di rilascio

Chi siamo