Rode IA Local no Arch Linux: LM Studio + Open WebUI

Quer rodar modelos de linguagem no seu próprio computador, sem depender de nuvem e sem pagar por API? Neste guia você vai instalar o LM Studio, baixar um modelo e deixar tudo acessível via uma interface bonita usando o Open WebUI com Docker.

O que você vai precisar

Arch Linux (ou derivados como Manjaro, EndeavourOS)
Uma GPU razoável ou uma CPU moderna com bastante RAM (8 GB no mínimo, 16 GB recomendado)
Docker instalado
Vontade de brincar com IA local 🤖

Parte 1 — Instalando o LM Studio

O LM Studio é um aplicativo gráfico que facilita baixar, gerenciar e rodar modelos de linguagem localmente. Ele funciona como um servidor local de IA, compatível com a API do OpenAI.

Via AUR (jeito Arch)

Se você usa yay ou paru, é direto ao ponto:

yay -S lmstudio

ou com paru:

paru -S lmstudio

Aguarde a compilação e instalação. Pode demorar um pouco na primeira vez.

Via AppImage (alternativa)

Se preferir não usar o AUR, você pode baixar o AppImage direto do site oficial:

Acesse lmstudio.ai e baixe o arquivo .AppImage para Linux.
Dê permissão de execução:

chmod +x LM_Studio-*.AppImage

Execute:

./LM_Studio-*.AppImage

💡 Dica: Para integrar melhor ao sistema, você pode usar o appimaged ou criar um .desktop manualmente em ~/.local/share/applications/.

Parte 2 — Baixando um modelo

Com o LM Studio aberto, você vai ver uma interface bem amigável. Veja como baixar seu primeiro modelo:

Clique na aba de busca (ícone de lupa ou “Discover”) na barra lateral esquerda.
Pesquise um modelo. Boas pedidas para começar:

mistral — leve e eficiente
llama3 — da Meta, muito capaz
phi3 — surpreendentemente bom para o tamanho
gemma — da Google, ótimo custo-benefício

Escolha a versão correta para sua máquina:

Q4_K_M — bom equilíbrio entre velocidade e qualidade
Q8_0 — mais qualidade, precisa de mais RAM
Modelos com 7B no nome têm 7 bilhões de parâmetros (mais leve); 13B é mais pesado mas melhor

Clique em Download e aguarde. Os modelos costumam ter entre 4 GB e 10 GB.

💡 Quanto de RAM eu preciso? Uma regra prática: um modelo 7B Q4 precisa de cerca de 5–6 GB de RAM (ou VRAM se usar GPU). Um 13B Q4 precisa de ~9 GB.

Parte 3 — Rodando o servidor local

Para que o Open WebUI consiga se comunicar com o LM Studio, você precisa ativar o servidor local dele:

Vá na aba “Local Server” (ícone <-> na barra lateral).
Selecione o modelo que você baixou no menu suspenso.
Clique em “Start Server”.

O servidor vai subir na porta 1234 por padrão, acessível em http://localhost:1234.

Você pode testar se está funcionando abrindo o terminal e rodando:

curl http://localhost:1234/v1/models

Se aparecer uma lista de modelos em JSON, está tudo certo! ✅

Parte 4 — Instalando o Docker

Se você ainda não tem o Docker no Arch, é rapidinho:

sudo pacman -S docker
sudo systemctl enable --now docker
sudo usermod -aG docker $USER

⚠️ Importante: Depois de rodar o usermod, faça logout e login novamente (ou reinicie) para que seu usuário reconheça o grupo docker. Caso contrário, você precisará usar sudo em todos os comandos Docker.

Parte 5 — Rodando o Open WebUI

O Open WebUI é uma interface web estilo ChatGPT que se conecta ao seu servidor local. Com ele você tem:

Histórico de conversas organizado
Suporte a múltiplos modelos
Upload de documentos (RAG)
Interface muito mais agradável que o terminal

Para subir o container, rode:

sudo systemctl enable --now docker

docker run -d -p 3000:8080 \
  --add-host=host.docker.internal:host-gateway \
  -v open-webui:/app/backend/data \
  --name open-webui \
  --restart always \
  ghcr.io/open-webui/open-webui:main

O que cada parte faz:

Opção	O que faz
`-d`	Roda em segundo plano
`-p 3000:8080`	Expõe na porta 3000 do seu PC
`--add-host=host.docker.internal:host-gateway`	Permite o container acessar o LM Studio no host
`-v open-webui:/app/backend/data`	Salva seus dados (conversas, config) em um volume persistente
`--restart always`	Reinicia automaticamente com o sistema

Aguarde o download da imagem (pode demorar alguns minutos na primeira vez) e depois acesse:

http://localhost:3000

Parte 6 — Conectando o Open WebUI ao LM Studio

Acesse http://localhost:3000 no navegador.
Na primeira vez, crie uma conta local (não precisa de email real, é só para o sistema local).
Vá em Configurações → Connections (ou Conexões).
Em OpenAI API, coloque a URL:

http://host.docker.internal:1234/v1

No campo de API Key, coloque qualquer coisa (ex: lmstudio) — o LM Studio não valida isso.
Clique em Save e depois em Verify Connection.

Se aparecer um ✅ verde, está conectado! Agora você pode voltar para a tela principal e já vai ver o modelo disponível para conversar.

⚠️ Resolução de Problemas: Erro de Conexão (Network Error)

O Problema: Open WebUI não conecta ao LM Studio

Ao tentar conectar o Open WebUI ao LM Studio, aparece o erro Network Problem ou OpenAI: Network Problem, e o container Docker não consegue acessar o servidor de modelos.

A Causa

O LM Studio, por padrão, escuta apenas em 127.0.0.1:1234 (localhost). Isso significa que apenas programas rodando diretamente na sua máquina física podem se comunicar com ele.

O container Docker roda em uma rede isolada do sistema operacional principal. Quando ele tenta acessar a sua máquina através de host.docker.internal (que aponta para a ponte de rede do Docker, como 172.17.0.1), a requisição chega ao LM Studio com esse IP de rede interna. Como o LM Studio recusa qualquer conexão que não venha estritamente de 127.0.0.1, a conexão falha silenciosamente ou trava.

🧭 A Solução: O que é o Caddy e por que usá-lo?

O Caddy é um servidor web moderno, extremamente leve, rápido e escrito em Go. Ele é muito conhecido por sua simplicidade de configuração comparado a alternativas tradicionais como Nginx ou Apache.

Neste cenário, nós o utilizamos como um Proxy Reverso.

Como o Proxy Reverso funciona aqui?

Imagine o Caddy como um intermediário amigável:

O Caddy se posiciona na porta 12345 e aceita conexões de qualquer lugar (incluindo do container Docker).
O container do Open WebUI faz a requisição para a porta 12345.
O Caddy recebe essa chamada e a “reempacota”, enviando-a localmente para 127.0.0.1:1234 (o LM Studio).
Como a requisição agora vem diretamente do Caddy (que está rodando na mesma máquina), o LM Studio acha que é uma conexão local legítima e responde sem problemas.

Passo 1: Instalar o Caddy

Instale o gerenciador em seu sistema Arch Linux:

sudo pacman -S caddy

Passo 2: Executar o Proxy Reverso temporariamente

Para testar o funcionamento, execute o Caddy diretamente no terminal:

caddy reverse-proxy --from :12345 --to 127.0.0.1:1234

--from :12345: Diz ao Caddy para escutar em todas as interfaces de rede na porta 12345.
--to 127.0.0.1:1234: Redireciona todo o tráfego recebido diretamente para a porta local do LM Studio.

Passo 3: Liberar a porta no firewall (Se aplicável)

Se você utiliza o UFW como firewall ativo, libere a porta usada pelo Caddy:

sudo ufw allow 12345/tcp

Passo 4: Testar a conexão

Com o Caddy rodando no terminal do Passo 2, abra outro terminal e force o container Docker a fazer um teste de comunicação direta:

docker exec -it open-webui curl http://host.docker.internal:12345/v1/models

Se retornar uma estrutura em JSON contendo a lista dos seus modelos carregados no LM Studio, a ponte está funcionando perfeitamente.

🔄 Como Manter o Caddy Rodando para Sempre (Serviço do Sistema)

Executar o comando diretamente no terminal serve para testes, mas se você fechar o terminal, o Caddy para de funcionar. Para torná-lo permanente e garantir que ele inicie sozinho junto com o sistema operacional, usaremos o Systemd para criar um serviço em segundo plano (daemon).

Passo 1: Criar o arquivo de configuração do serviço

Crie um novo arquivo de serviço do Systemd usando o editor de texto nano:

sudo nano /etc/systemd/system/caddy-lmstudio.service

Passo 2: Estrutura do Arquivo de Serviço

Cole o conteúdo abaixo dentro do editor.

⚠️ Importante: Substitua o campo User=gabriel pelo seu nome de usuário correto do sistema, caso seja diferente.

[Unit]
Description=Caddy Reverse Proxy for LM Studio
After=network.target

[Service]
Type=simple
ExecStart=/usr/bin/caddy reverse-proxy --from :12345 --to 127.0.0.1:1234
Restart=always
RestartSec=5s
User=gabriel

[Install]
WantedBy=multi-user.target

O que essas diretivas significam?

After=network.target: Garante que o Caddy só tente iniciar depois que a sua rede de internet estiver totalmente ativa.
Restart=always: Se o LM Studio fechar, se a máquina oscilar ou se o Caddy falhar por qualquer motivo, o sistema tentará reiniciar o proxy automaticamente.
RestartSec=5s: Aguarda 5 segundos antes de tentar reiniciar o serviço em caso de falha, evitando sobrecarregar o processador.

Salve o arquivo pressionando Ctrl + O, confirme com Enter e saia com Ctrl + X.

Passo 3: Ativar e Iniciar o Serviço

Agora, informe ao gerenciador de sistema (systemd) que um novo arquivo foi criado e ordene que o Caddy comece a rodar imediatamente e em todas as próximas inicializações.

# Atualiza o systemd para ler o novo arquivo de serviço
sudo systemctl daemon-reload

# Habilita o serviço para iniciar junto com o boot do sistema
sudo systemctl enable caddy-lmstudio.service

# Inicializa o serviço agora mesmo
sudo systemctl start caddy-lmstudio.service

🛠️ Comandos de Diagnóstico e Controle

Durante o uso diário ou se encontrar dificuldades, utilize estes comandos para gerenciar o proxy:

Verificar se o serviço está ativo e rodando:

sudo systemctl status caddy-lmstudio.service

Parar o proxy reverso temporariamente:

sudo systemctl stop caddy-lmstudio.service

Reiniciar o serviço (útil se o LM Studio for atualizado ou travar):

sudo systemctl restart caddy-lmstudio.service

Visualizar logs em tempo real (essencial para encontrar erros ocultos):

journalctl -u caddy-lmstudio.service -f -n 50

Dicas Finais

Para parar o Open WebUI:

docker stop open-webui

Para iniciar novamente:

docker start open-webui

Para ver os logs se algo der errado:

docker logs open-webui

Usando GPU NVIDIA?
Instale o nvidia-container-toolkit e adicione --gpus all no comando do Docker para acelerar bastante a inferência:

sudo pacman -S nvidia-container-toolkit

docker run -d \
  --name open-webui \
  --network host \
  --restart always \
  -v open-webui:/app/backend/data \
  ghcr.io/open-webui/open-webui:main

Note que no caso com GPU, a imagem muda para :cuda.

Conclusão

Agora você tem uma stack completa de IA rodando 100% local no seu Arch Linux:

LM Studio gerencia e serve os modelos
Open WebUI entrega uma interface rica e completa
Docker mantém tudo isolado e fácil de gerenciar

Seus dados ficam no seu computador, você não paga por token e pode experimentar dezenas de modelos diferentes. Bem-vindo ao mundo da IA local! 🚀

Rode IA Local no Arch Linux: LM Studio + Open WebUI#

O que você vai precisar#

Parte 1 — Instalando o LM Studio#

Via AUR (jeito Arch)#

Via AppImage (alternativa)#

Parte 2 — Baixando um modelo#

Parte 3 — Rodando o servidor local#

Parte 4 — Instalando o Docker#

Parte 5 — Rodando o Open WebUI#

Parte 6 — Conectando o Open WebUI ao LM Studio#

⚠️ Resolução de Problemas: Erro de Conexão (Network Error)#

O Problema: Open WebUI não conecta ao LM Studio#

A Causa#

🧭 A Solução: O que é o Caddy e por que usá-lo?#

Como o Proxy Reverso funciona aqui?#

Passo 1: Instalar o Caddy#

Passo 2: Executar o Proxy Reverso temporariamente#

Passo 3: Liberar a porta no firewall (Se aplicável)#

Passo 4: Testar a conexão#

🔄 Como Manter o Caddy Rodando para Sempre (Serviço do Sistema)#

Passo 1: Criar o arquivo de configuração do serviço#

Passo 2: Estrutura do Arquivo de Serviço#

Passo 3: Ativar e Iniciar o Serviço#

🛠️ Comandos de Diagnóstico e Controle#

Dicas Finais#

Conclusão#