Modelo local · Grátis

Execute modelos de IA na sua própria máquina

Baixe e execute modelos Ollama com um clique. O projeto chama embedding e completions diretamente por um endpoint local—sem necessidade de chave, custo zero e tudo localmente.

Execute modelos de IA na sua própria máquina

Modelo local, um endpoint direto para o seu projeto

O modelo roda na sua própria máquina, exposto por meio de um endpoint local. Seu projeto em PHP / Node / Python pode chamá-lo como uma API na nuvem — só que os dados nunca saem do seu computador.

Seu projeto
PHP · Node · Python
Endpoint local
Entrada unificada de API
Modelo Ollama
Executando na sua máquina

Use modelos locais em três etapas

1

Download com um clique

Escolha um modelo no ServBay para baixar; o download suporta retomada, então não se preocupe com interrupções.

2

Expor endpoint automaticamente

Assim que o primeiro modelo estiver pronto, ele será exposto por meio de um endpoint local unificado, sem necessidade de qualquer configuração.

3

Chamada direta do projeto

Direcione seu projeto para um endpoint local e chame embedding e completamento como se estivesse acessando uma API na nuvem.

O que você pode obter

Download de modelo com um clique, com suporte para retomada de download
Modelos locais são expostos de forma unificada por meio de um endpoint
Chame embedding e completamento em projetos PHP / Node / Python
Sem chave, custo zero, dados permanecem no dispositivo
〔Lançamento na versão〕llama.cpp e MLX em breve disponíveis

Chame modelos locais como se estivesse chamando uma API na nuvem

Uma interface padrão, basta alterar um nome para trocar o modelo.

ServBay · localhost:11434
# Chame o modelo local exatamente como a API na nuvem.
curl http://localhost:11434/v1/chat/completions \
-d '{"model": "llama3", "messages": […]}'
# Trocar modelo? Apenas altere o nome do model
"model": "qwen2"

Principais modelos de código aberto que podem ser executados localmente

Modelos open source do repositório Ollama, prontos para uso com apenas um clique.

Llama
Qwen
DeepSeek
Mistral
Gemma
Phi

...e mais modelos na biblioteca Ollama

Perguntas frequentes

Quais modelos podem ser executados?

Todos os modelos open source do repositório Ollama, de Llama, Qwen a DeepSeek e Mistral, podem ser baixados e executados com um clique.

Projetos locais podem ser chamados diretamente?

Sim. Por meio de um endpoint local, seu projeto PHP / Node / Python pode chamar diretamente embedding e completamento.

Os dados serão enviados?

Não. O modelo e todas as chamadas são executados na sua própria máquina, e os dados não saem do seu dispositivo.

Download grátis

ServBay AI Helper
ServBay AI Helper