🏗️
Blog
IA Além do LLM
Para quem já sabe o básico e quer ir fundo. Aqui o assunto é como os modelos funcionam em produção: memória, roteamento, ferramentas, agentes. O lado técnico que pouca gente explica direito.
5artigos
340XP total
01
⚡ KV Cache: Memória Eficiente
Por que um modelo de 30GB pode precisar de 60GB de VRAM — e como o KV Cache resolve isso.
⏱ 8 min·+60 XP
02
🧩 Mixture of Experts (MoE)
200B parâmetros que não cabem na GPU — veja como o MoE ativa só o que é necessário.
⏱ 10 min·+70 XP
03
🔧 Tool Calling e Agentes
Como a IA aprendeu a usar ferramentas externas — e por que isso transformou LLMs em agentes.
⏱ 9 min·+70 XP
04
🏗️ Harness: a Infraestrutura do Agente
Os 6 componentes que fazem um agente de IA funcionar de verdade.
⏱ 15 min·+80 XP
05
📊 Como Avaliar Modelos de IA
MMLU, HumanEval, benchmark contamination — como saber se um modelo é realmente melhor.
⏱ 8 min·+60 XP