Modelo local · Grátis

Execute modelos de IA na sua própria máquina

Baixe e execute modelos Ollama com um clique. O projeto chama embedding e completions diretamente por um endpoint local—sem necessidade de chave, custo zero e tudo localmente.

Baixar ServBay Veja como chamar

Execute modelos de IA na sua própria máquina

Modelo local, um endpoint direto para o seu projeto

O modelo roda na sua própria máquina, exposto por meio de um endpoint local. Seu projeto em PHP / Node / Python pode chamá-lo como uma API na nuvem — só que os dados nunca saem do seu computador.

Seu projeto

PHP · Node · Python

Endpoint local

Entrada unificada de API

Modelo Ollama

Executando na sua máquina

Use modelos locais em três etapas

Download com um clique

Escolha um modelo no ServBay para baixar; o download suporta retomada, então não se preocupe com interrupções.

Expor endpoint automaticamente

Assim que o primeiro modelo estiver pronto, ele será exposto por meio de um endpoint local unificado, sem necessidade de qualquer configuração.

Chamada direta do projeto

Direcione seu projeto para um endpoint local e chame embedding e completamento como se estivesse acessando uma API na nuvem.

O que você pode obter

Download de modelo com um clique, com suporte para retomada de download

Modelos locais são expostos de forma unificada por meio de um endpoint

Chame embedding e completamento em projetos PHP / Node / Python

Sem chave, custo zero, dados permanecem no dispositivo

〔Lançamento na versão〕llama.cpp e MLX em breve disponíveis

Chame modelos locais como se estivesse chamando uma API na nuvem

Uma interface padrão, basta alterar um nome para trocar o modelo.

ServBay · localhost:11434

# Chame o modelo local exatamente como a API na nuvem.

curl http://localhost:11434/v1/chat/completions \

-d '{"model": "llama3", "messages": […]}'

# Trocar modelo? Apenas altere o nome do model

"model": "qwen2"

Principais modelos de código aberto que podem ser executados localmente

Modelos open source do repositório Ollama, prontos para uso com apenas um clique.

Llama

Qwen

DeepSeek

Mistral

Gemma

Phi

...e mais modelos na biblioteca Ollama

Perguntas frequentes

Quais modelos podem ser executados?

Todos os modelos open source do repositório Ollama, de Llama, Qwen a DeepSeek e Mistral, podem ser baixados e executados com um clique.

Projetos locais podem ser chamados diretamente?

Sim. Por meio de um endpoint local, seu projeto PHP / Node / Python pode chamar diretamente embedding e completamento.

Os dados serão enviados?

Não. O modelo e todas as chamadas são executados na sua própria máquina, e os dados não saem do seu dispositivo.

Documento

Notas de versão

Sobre nós