Rode IA Local no Arch Linux: LM Studio + Open WebUI
Quer rodar modelos de linguagem no seu próprio computador, sem depender de nuvem e sem pagar por API? Neste guia você vai instalar o LM Studio, baixar um modelo e deixar tudo acessível via uma interface bonita usando o Open WebUI com Docker.
O que você vai precisar
- Arch Linux (ou derivados como Manjaro, EndeavourOS)
- Uma GPU razoável ou uma CPU moderna com bastante RAM (8 GB no mínimo, 16 GB recomendado)
- Docker instalado
- Vontade de brincar com IA local 🤖
Parte 1 — Instalando o LM Studio
O LM Studio é um aplicativo gráfico que facilita baixar, gerenciar e rodar modelos de linguagem localmente. Ele funciona como um servidor local de IA, compatível com a API do OpenAI.
Via AUR (jeito Arch)
Se você usa yay ou paru, é direto ao ponto:
yay -S lmstudio
ou com paru:
paru -S lmstudio
Aguarde a compilação e instalação. Pode demorar um pouco na primeira vez.
Via AppImage (alternativa)
Se preferir não usar o AUR, você pode baixar o AppImage direto do site oficial:
- Acesse lmstudio.ai e baixe o arquivo
.AppImagepara Linux. - Dê permissão de execução:
chmod +x LM_Studio-*.AppImage
- Execute:
./LM_Studio-*.AppImage
💡 Dica: Para integrar melhor ao sistema, você pode usar o
appimagedou criar um.desktopmanualmente em~/.local/share/applications/.
Parte 2 — Baixando um modelo
Com o LM Studio aberto, você vai ver uma interface bem amigável. Veja como baixar seu primeiro modelo:
- Clique na aba de busca (ícone de lupa ou “Discover”) na barra lateral esquerda.
- Pesquise um modelo. Boas pedidas para começar:
mistral— leve e eficientellama3— da Meta, muito capazphi3— surpreendentemente bom para o tamanhogemma— da Google, ótimo custo-benefício
- Escolha a versão correta para sua máquina:
Q4_K_M— bom equilíbrio entre velocidade e qualidadeQ8_0— mais qualidade, precisa de mais RAM- Modelos com
7Bno nome têm 7 bilhões de parâmetros (mais leve);13Bé mais pesado mas melhor
- Clique em Download e aguarde. Os modelos costumam ter entre 4 GB e 10 GB.
💡 Quanto de RAM eu preciso? Uma regra prática: um modelo
7B Q4precisa de cerca de 5–6 GB de RAM (ou VRAM se usar GPU). Um13B Q4precisa de ~9 GB.
Parte 3 — Rodando o servidor local
Para que o Open WebUI consiga se comunicar com o LM Studio, você precisa ativar o servidor local dele:
- Vá na aba “Local Server” (ícone
<->na barra lateral). - Selecione o modelo que você baixou no menu suspenso.
- Clique em “Start Server”.
O servidor vai subir na porta 1234 por padrão, acessível em http://localhost:1234.
Você pode testar se está funcionando abrindo o terminal e rodando:
curl http://localhost:1234/v1/models
Se aparecer uma lista de modelos em JSON, está tudo certo! ✅
Parte 4 — Instalando o Docker
Se você ainda não tem o Docker no Arch, é rapidinho:
sudo pacman -S docker
sudo systemctl enable --now docker
sudo usermod -aG docker $USER
⚠️ Importante: Depois de rodar o
usermod, faça logout e login novamente (ou reinicie) para que seu usuário reconheça o grupodocker. Caso contrário, você precisará usarsudoem todos os comandos Docker.
Parte 5 — Rodando o Open WebUI
O Open WebUI é uma interface web estilo ChatGPT que se conecta ao seu servidor local. Com ele você tem:
- Histórico de conversas organizado
- Suporte a múltiplos modelos
- Upload de documentos (RAG)
- Interface muito mais agradável que o terminal
Para subir o container, rode:
docker run -d -p 3000:8080 \
--add-host=host.docker.internal:host-gateway \
-v open-webui:/app/backend/data \
--name open-webui \
--restart always \
ghcr.io/open-webui/open-webui:main
O que cada parte faz:
| Opção | O que faz |
|---|---|
-d | Roda em segundo plano |
-p 3000:8080 | Expõe na porta 3000 do seu PC |
--add-host=host.docker.internal:host-gateway | Permite o container acessar o LM Studio no host |
-v open-webui:/app/backend/data | Salva seus dados (conversas, config) em um volume persistente |
--restart always | Reinicia automaticamente com o sistema |
Aguarde o download da imagem (pode demorar alguns minutos na primeira vez) e depois acesse:
http://localhost:3000
Parte 6 — Conectando o Open WebUI ao LM Studio
- Acesse
http://localhost:3000no navegador. - Na primeira vez, crie uma conta local (não precisa de email real, é só para o sistema local).
- Vá em Configurações → Connections (ou Conexões).
- Em OpenAI API, coloque a URL:
http://host.docker.internal:1234/v1
- No campo de API Key, coloque qualquer coisa (ex:
lmstudio) — o LM Studio não valida isso. - Clique em Save e depois em Verify Connection.
Se aparecer um ✅ verde, está conectado! Agora você pode voltar para a tela principal e já vai ver o modelo disponível para conversar.
Dicas Finais
Para parar o Open WebUI:
docker stop open-webui
Para iniciar novamente:
docker start open-webui
Para ver os logs se algo der errado:
docker logs open-webui
Usando GPU NVIDIA?
Instale o nvidia-container-toolkit e adicione --gpus all no comando do Docker para acelerar bastante a inferência:
sudo pacman -S nvidia-container-toolkit
docker run -d \
--name open-webui \
--network host \
--restart always \
-v open-webui:/app/backend/data \
ghcr.io/open-webui/open-webui:main
Note que no caso com GPU, a imagem muda para
:cuda.
Conclusão
Agora você tem uma stack completa de IA rodando 100% local no seu Arch Linux:
- LM Studio gerencia e serve os modelos
- Open WebUI entrega uma interface rica e completa
- Docker mantém tudo isolado e fácil de gerenciar
Seus dados ficam no seu computador, você não paga por token e pode experimentar dezenas de modelos diferentes. Bem-vindo ao mundo da IA local! 🚀