LangGraph: agentes como state machines (com cycles)

Quando um agente precisa de loops (ReAct), human-in-loop, persistência de estado entre sessões e cycles condicionais, o paradigma DAG (Airflow, Prefect, Dagster) é insuficiente. LangGraph (lançado jan/2024 pela LangChain) trouxe state machines explícitas para LLMs: nós, arestas, reducers, checkpointers e time travel — vocabulário inspirado em XState e Erlang/OTP mas adaptado para o cenário de agentes.

O que LangGraph traz que LCEL não tinha

Necessidade	LCEL (RunnableSequence)	LangGraph (StateGraph)
Pipeline linear	Idiomático: a \| b \| c	Funciona mas verbose
Cycles (ReAct loop)	Impossível	Nativo: add_edge("act", "think")
Conditional routing	RunnableBranch (limitado)	add_conditional_edges()
State mutation explícita	Estado passa via chains	TypedDict + reducers
Human-in-the-loop	Manual	interrupt_before/after
Persistência entre requests	Manual	Checkpointer (Sqlite/Postgres/Redis)
Time travel	Não	get_state_history + update_state
Subgraphs/hierarquia	Composição funcional	Subgraphs como nós
Observabilidade	LangSmith básico	LangSmith com hierarquia full

NecessidadePipeline linear

LCEL (RunnableSequence)Idiomático: a | b | c

LangGraph (StateGraph)Funciona mas verbose

NecessidadeCycles (ReAct loop)

LCEL (RunnableSequence)Impossível

LangGraph (StateGraph)Nativo: add_edge("act", "think")

NecessidadeConditional routing

LCEL (RunnableSequence)RunnableBranch (limitado)

LangGraph (StateGraph)add_conditional_edges()

NecessidadeState mutation explícita

LCEL (RunnableSequence)Estado passa via chains

LangGraph (StateGraph)TypedDict + reducers

NecessidadeHuman-in-the-loop

LCEL (RunnableSequence)Manual

LangGraph (StateGraph)interrupt_before/after

NecessidadePersistência entre requests

LCEL (RunnableSequence)Manual

LangGraph (StateGraph)Checkpointer (Sqlite/Postgres/Redis)

NecessidadeTime travel

LCEL (RunnableSequence)Não

LangGraph (StateGraph)get_state_history + update_state

NecessidadeSubgraphs/hierarquia

LCEL (RunnableSequence)Composição funcional

LangGraph (StateGraph)Subgraphs como nós

NecessidadeObservabilidade

LCEL (RunnableSequence)LangSmith básico

LangGraph (StateGraph)LangSmith com hierarquia full

Hello LangGraph — agente ReAct mínimo

react_agent.py

from typing import TypedDict, Annotated, Sequence
import operator
from langgraph.graph import StateGraph, START, END
from langchain_anthropic import ChatAnthropic
from langchain_core.messages import BaseMessage, HumanMessage, AIMessage, ToolMessage
from langchain_core.tools import tool

# 1. State schema
class AgentState(TypedDict):
    messages: Annotated[Sequence[BaseMessage], operator.add]  # reducer: concat

# 2. Tools
@tool
def get_weather(city: str) -> str:
    """Retorna a temperatura atual da cidade."""
    return f"Em {city}: 22°C, ensolarado"

tools = [get_weather]
model = ChatAnthropic(model="claude-sonnet-4-7").bind_tools(tools)

# 3. Nodes
def call_model(state: AgentState) -> dict:
    response = model.invoke(state["messages"])
    return {"messages": [response]}

def call_tool(state: AgentState) -> dict:
    last_message = state["messages"][-1]
    tool_calls = last_message.tool_calls
    outputs = []
    for tc in tool_calls:
        tool_fn = {t.name: t for t in tools}[tc["name"]]
        result = tool_fn.invoke(tc["args"])
        outputs.append(ToolMessage(content=str(result), tool_call_id=tc["id"]))
    return {"messages": outputs}

# 4. Conditional router
def should_continue(state: AgentState) -> str:
    last_message = state["messages"][-1]
    if not last_message.tool_calls:
        return END
    return "tools"

# 5. Build graph
graph = StateGraph(AgentState)
graph.add_node("agent", call_model)
graph.add_node("tools", call_tool)
graph.add_edge(START, "agent")
graph.add_conditional_edges("agent", should_continue)
graph.add_edge("tools", "agent")  # ⬅️ CICLO — volta ao agente após tool

app = graph.compile()

result = app.invoke({"messages": [HumanMessage("Qual a temperatura em São Paulo?")]})
for m in result["messages"]:
    print(f"{m.type}: {m.content[:80]}")

💡

O ciclo é o coração do ReAct. O agente pode chamar tools quantas vezes precisar antes de decidir responder ao usuário. DAG proibiria isso.

Checkpointing e time travel

checkpointing.py

from langgraph.checkpoint.postgres import PostgresSaver

# Checkpointer persiste estado a cada nó
checkpointer = PostgresSaver.from_conn_string("postgresql://localhost/langgraph")
checkpointer.setup()

app = graph.compile(checkpointer=checkpointer)

# thread_id identifica a conversa
config = {"configurable": {"thread_id": "user-42-conv-1"}}

# Primeira mensagem
app.invoke({"messages": [HumanMessage("Olá")]}, config=config)

# Segunda mensagem — engine carrega estado anterior
app.invoke({"messages": [HumanMessage("Continuando: temperatura em SP?")]}, config=config)

# Time travel — listar histórico
for snapshot in app.get_state_history(config):
    print(f"Step {snapshot.metadata['step']}: next={snapshot.next}")
    print(f"  Messages: {len(snapshot.values['messages'])}")

# Voltar a um estado específico e bifurcar
target = list(app.get_state_history(config))[3]   # snapshot de 3 steps atrás
new_config = app.update_state(target.config, {"messages": [HumanMessage("Pergunta diferente")]})
app.invoke(None, new_config)   # executa a partir do snapshot bifurcado

⚠️

Time travel cria thread_id implícitos novos quando você bifurca. Em produção, isso explode rapidamente se não houver TTL/cleanup. Postgres com partitioning por thread_id é o padrão.

Human-in-the-loop

human_in_loop.py

# Cenário: agente sugere ação destrutiva, humano precisa aprovar
from langgraph.graph import StateGraph
from langgraph.checkpoint.memory import MemorySaver

class State(TypedDict):
    messages: Annotated[list, operator.add]
    pending_action: dict | None

def plan(state):
    # LLM propõe ação destrutiva (ex.: deletar arquivo)
    return {"pending_action": {"type": "delete", "target": "/tmp/important.db"}}

def execute(state):
    action = state["pending_action"]
    # Em produção: subprocess.run / API call etc.
    return {"messages": [AIMessage(f"Executado: {action}")]}

graph = StateGraph(State)
graph.add_node("plan", plan)
graph.add_node("execute", execute)
graph.add_edge(START, "plan")
graph.add_edge("plan", "execute")
graph.add_edge("execute", END)

# 🛑 PAUSAR antes de "execute" para esperar aprovação
app = graph.compile(
    checkpointer=MemorySaver(),
    interrupt_before=["execute"],
)

config = {"configurable": {"thread_id": "req-1"}}
result = app.invoke({"messages": [], "pending_action": None}, config)
print("Pausado em:", app.get_state(config).next)
# > Pausado em: ('execute',)

# Backend retorna ao usuário: "Aprovar deletar /tmp/important.db?"
# Frontend mostra modal, usuário clica em "Aprovar"

# Resume — invoke com None continua do checkpoint
app.invoke(None, config)

Arquitetura interna do StateGraph

🗺️ Componentes de um LangGraph deployment

StateGraph(SchemaTypedDict)

add_node(name, fn)

add_edge(a, b) — estática

add_conditional_edges(a, router)

.compile(checkpointer, interrupts)

Pregel-inspired engine

BSP-style step (parallel nodes)

Reducer merge automático

Conditional routing após cada step

Stream events para observability

MemorySaver (dev/test)

SqliteSaver (single-node)

PostgresSaver (produção)

RedisSaver (latência crítica)

AsyncCheckpointer para alta concorrência

LangGraph Cloud (managed)

LangGraph Server (self-hosted)

FastAPI wrapper custom

Stream via SSE/Websocket

LangSmith integration nativa

Fluxo de decisão: quando usar LangGraph

📋 Você precisa de um agente que pesquisa, propõe um plano, espera aprovação humana, depois executa em múltiplas etapas com retry em falhas.

✓ LangGraph com interrupt_before + PostgresSaver

Os 4 requisitos (multi-step, human approval, persistência entre requests, retry com cycles) são exatamente o caso de uso primário. LCEL não suporta human-in-loop nativo; CrewAI não tem cycles + retry idiomático; AutoGen funciona mas é overkill para sequência linear com 1 interrupt.

Alt: CrewAI hierarchical —

Alt: AutoGen v0.4 —

Alt: Lógica custom + LCEL —

🗺️ Árvore de decisão

Precisa de cycles ou conditionals?Se não → LCEL basta

Precisa human-in-loop?Se sim → LangGraph wins

Precisa estado entre requests?Se sim → LangGraph com checkpointer

Precisa distribuição cross-host?AutoGen v0.4 supera aqui

Múltiplos papéis especializados?CrewAI mais idiomático

Timeline do LangGraph

Out 2022

LangChain v0.0

Harrison Chase — primeira versão

Set 2023

LCEL

LangChain Expression Language — composição via pipe

Jan 2024

LangGraph 0.1

StateGraph + checkpointer — spin-off para agentes

Mai 2024

LangGraph Cloud

Managed deployment com long-running threads

Out 2024

LangGraph Studio

Visual debugging IDE — time travel UI

2025

create_react_agent unified

High-level API replicando ReAct em uma chamada

2025

Subgraphs maduros

Composição hierárquica como padrão de produção

2026

MCP integration

Tools MCP-native, padronizando com Anthropic/OpenAI

Perguntas frequentes

❓ LangGraph requer LangChain?

Você pode usar LangGraph sem cadeias LCEL — só StateGraph + funções Python puras. Mas a maioria dos exemplos usa ChatModels da LangChain por conveniência. Tools podem ser plain Python functions decoradas com @tool ou objetos da LangChain.

❓ Como observar/debugar?

LangSmith é integração first-class — toda chamada de nó vira span. Sem LangSmith, app.stream() emite events de cada step e você loga manualmente. LangGraph Studio (Electron app gratuito) dá visualização de grafo com time travel.

❓ Latência em produção?

Checkpointer add ~10–50ms por nó. PostgresSaver com pgbouncer + connection pool é o padrão para alta carga. Se latência é crítica, RedisSaver é ~10× mais rápido mas requer cleanup explícito (sem TTL nativo para checkpoints).

❓ Posso ter centenas de threads concorrentes?

Sim. Thread_id é a unidade de isolamento. Postgres com particionamento por thread_id escala para milhares concorrentes. LangGraph Cloud gerencia isso automaticamente. Para self-hosted, async checkpointer + uvloop é setup recomendado.

Referências

LangGraph docslangchain-ai.github.io/langgraph

LangGraph GitHubgithub.com/langchain-ai/langgraph

LCEL → LangGraph migrationblog.langchain.dev/langgraph (jan 2024 launch post)

Pregel paperMalewicz et al. "Pregel: A System for Large-Scale Graph Processing". SIGMOD 2010 — inspiração do engine

ReActYao et al. "ReAct: Synergizing Reasoning and Acting in Language Models". ICLR 2023

LangGraph Studiogithub.com/langchain-ai/langgraph-studio

Persistêncialangchain-ai.github.io/langgraph/concepts/persistence

O que LangGraph traz que LCEL não tinha

Necessidade	LCEL (RunnableSequence)	LangGraph (StateGraph)
Pipeline linear	Idiomático: a \| b \| c	Funciona mas verbose
Cycles (ReAct loop)	Impossível	Nativo: add_edge("act", "think")
Conditional routing	RunnableBranch (limitado)	add_conditional_edges()
State mutation explícita	Estado passa via chains	TypedDict + reducers
Human-in-the-loop	Manual	interrupt_before/after
Persistência entre requests	Manual	Checkpointer (Sqlite/Postgres/Redis)
Time travel	Não	get_state_history + update_state
Subgraphs/hierarquia	Composição funcional	Subgraphs como nós
Observabilidade	LangSmith básico	LangSmith com hierarquia full

NecessidadePipeline linear

LCEL (RunnableSequence)Idiomático: a | b | c

LangGraph (StateGraph)Funciona mas verbose

NecessidadeCycles (ReAct loop)

LCEL (RunnableSequence)Impossível

LangGraph (StateGraph)Nativo: add_edge("act", "think")

NecessidadeConditional routing

LCEL (RunnableSequence)RunnableBranch (limitado)

LangGraph (StateGraph)add_conditional_edges()

NecessidadeState mutation explícita

LCEL (RunnableSequence)Estado passa via chains

LangGraph (StateGraph)TypedDict + reducers

NecessidadeHuman-in-the-loop

LCEL (RunnableSequence)Manual

LangGraph (StateGraph)interrupt_before/after

NecessidadePersistência entre requests

LCEL (RunnableSequence)Manual

LangGraph (StateGraph)Checkpointer (Sqlite/Postgres/Redis)

NecessidadeTime travel

LCEL (RunnableSequence)Não

LangGraph (StateGraph)get_state_history + update_state

NecessidadeSubgraphs/hierarquia

LCEL (RunnableSequence)Composição funcional

LangGraph (StateGraph)Subgraphs como nós

NecessidadeObservabilidade

LCEL (RunnableSequence)LangSmith básico

LangGraph (StateGraph)LangSmith com hierarquia full

Hello LangGraph — agente ReAct mínimo

react_agent.py

from typing import TypedDict, Annotated, Sequence
import operator
from langgraph.graph import StateGraph, START, END
from langchain_anthropic import ChatAnthropic
from langchain_core.messages import BaseMessage, HumanMessage, AIMessage, ToolMessage
from langchain_core.tools import tool

# 1. State schema
class AgentState(TypedDict):
    messages: Annotated[Sequence[BaseMessage], operator.add]  # reducer: concat

# 2. Tools
@tool
def get_weather(city: str) -> str:
    """Retorna a temperatura atual da cidade."""
    return f"Em {city}: 22°C, ensolarado"

tools = [get_weather]
model = ChatAnthropic(model="claude-sonnet-4-7").bind_tools(tools)

# 3. Nodes
def call_model(state: AgentState) -> dict:
    response = model.invoke(state["messages"])
    return {"messages": [response]}

def call_tool(state: AgentState) -> dict:
    last_message = state["messages"][-1]
    tool_calls = last_message.tool_calls
    outputs = []
    for tc in tool_calls:
        tool_fn = {t.name: t for t in tools}[tc["name"]]
        result = tool_fn.invoke(tc["args"])
        outputs.append(ToolMessage(content=str(result), tool_call_id=tc["id"]))
    return {"messages": outputs}

# 4. Conditional router
def should_continue(state: AgentState) -> str:
    last_message = state["messages"][-1]
    if not last_message.tool_calls:
        return END
    return "tools"

# 5. Build graph
graph = StateGraph(AgentState)
graph.add_node("agent", call_model)
graph.add_node("tools", call_tool)
graph.add_edge(START, "agent")
graph.add_conditional_edges("agent", should_continue)
graph.add_edge("tools", "agent")  # ⬅️ CICLO — volta ao agente após tool

app = graph.compile()

result = app.invoke({"messages": [HumanMessage("Qual a temperatura em São Paulo?")]})
for m in result["messages"]:
    print(f"{m.type}: {m.content[:80]}")

💡

O ciclo é o coração do ReAct. O agente pode chamar tools quantas vezes precisar antes de decidir responder ao usuário. DAG proibiria isso.

Checkpointing e time travel

checkpointing.py

from langgraph.checkpoint.postgres import PostgresSaver

# Checkpointer persiste estado a cada nó
checkpointer = PostgresSaver.from_conn_string("postgresql://localhost/langgraph")
checkpointer.setup()

app = graph.compile(checkpointer=checkpointer)

# thread_id identifica a conversa
config = {"configurable": {"thread_id": "user-42-conv-1"}}

# Primeira mensagem
app.invoke({"messages": [HumanMessage("Olá")]}, config=config)

# Segunda mensagem — engine carrega estado anterior
app.invoke({"messages": [HumanMessage("Continuando: temperatura em SP?")]}, config=config)

# Time travel — listar histórico
for snapshot in app.get_state_history(config):
    print(f"Step {snapshot.metadata['step']}: next={snapshot.next}")
    print(f"  Messages: {len(snapshot.values['messages'])}")

# Voltar a um estado específico e bifurcar
target = list(app.get_state_history(config))[3]   # snapshot de 3 steps atrás
new_config = app.update_state(target.config, {"messages": [HumanMessage("Pergunta diferente")]})
app.invoke(None, new_config)   # executa a partir do snapshot bifurcado

⚠️

Time travel cria thread_id implícitos novos quando você bifurca. Em produção, isso explode rapidamente se não houver TTL/cleanup. Postgres com partitioning por thread_id é o padrão.

Human-in-the-loop

human_in_loop.py

# Cenário: agente sugere ação destrutiva, humano precisa aprovar
from langgraph.graph import StateGraph
from langgraph.checkpoint.memory import MemorySaver

class State(TypedDict):
    messages: Annotated[list, operator.add]
    pending_action: dict | None

def plan(state):
    # LLM propõe ação destrutiva (ex.: deletar arquivo)
    return {"pending_action": {"type": "delete", "target": "/tmp/important.db"}}

def execute(state):
    action = state["pending_action"]
    # Em produção: subprocess.run / API call etc.
    return {"messages": [AIMessage(f"Executado: {action}")]}

graph = StateGraph(State)
graph.add_node("plan", plan)
graph.add_node("execute", execute)
graph.add_edge(START, "plan")
graph.add_edge("plan", "execute")
graph.add_edge("execute", END)

# 🛑 PAUSAR antes de "execute" para esperar aprovação
app = graph.compile(
    checkpointer=MemorySaver(),
    interrupt_before=["execute"],
)

config = {"configurable": {"thread_id": "req-1"}}
result = app.invoke({"messages": [], "pending_action": None}, config)
print("Pausado em:", app.get_state(config).next)
# > Pausado em: ('execute',)

# Backend retorna ao usuário: "Aprovar deletar /tmp/important.db?"
# Frontend mostra modal, usuário clica em "Aprovar"

# Resume — invoke com None continua do checkpoint
app.invoke(None, config)

Arquitetura interna do StateGraph

🗺️ Componentes de um LangGraph deployment

StateGraph(SchemaTypedDict)

add_node(name, fn)

add_edge(a, b) — estática

add_conditional_edges(a, router)

.compile(checkpointer, interrupts)

Pregel-inspired engine

BSP-style step (parallel nodes)

Reducer merge automático

Conditional routing após cada step

Stream events para observability

MemorySaver (dev/test)

SqliteSaver (single-node)

PostgresSaver (produção)

RedisSaver (latência crítica)

AsyncCheckpointer para alta concorrência

LangGraph Cloud (managed)

LangGraph Server (self-hosted)

FastAPI wrapper custom

Stream via SSE/Websocket

LangSmith integration nativa

Fluxo de decisão: quando usar LangGraph

📋 Você precisa de um agente que pesquisa, propõe um plano, espera aprovação humana, depois executa em múltiplas etapas com retry em falhas.

✓ LangGraph com interrupt_before + PostgresSaver

Alt: CrewAI hierarchical —

Alt: AutoGen v0.4 —

Alt: Lógica custom + LCEL —

🗺️ Árvore de decisão

Precisa de cycles ou conditionals?Se não → LCEL basta

Precisa human-in-loop?Se sim → LangGraph wins

Precisa estado entre requests?Se sim → LangGraph com checkpointer

Precisa distribuição cross-host?AutoGen v0.4 supera aqui

Múltiplos papéis especializados?CrewAI mais idiomático

Timeline do LangGraph

Out 2022

LangChain v0.0

Harrison Chase — primeira versão

Set 2023

LCEL

LangChain Expression Language — composição via pipe

Jan 2024

LangGraph 0.1

StateGraph + checkpointer — spin-off para agentes

Mai 2024

LangGraph Cloud

Managed deployment com long-running threads

Out 2024

LangGraph Studio

Visual debugging IDE — time travel UI

2025

create_react_agent unified

High-level API replicando ReAct em uma chamada

2025

Subgraphs maduros

Composição hierárquica como padrão de produção

2026

MCP integration

Tools MCP-native, padronizando com Anthropic/OpenAI

Perguntas frequentes

❓ LangGraph requer LangChain?

❓ Como observar/debugar?

❓ Latência em produção?

❓ Posso ter centenas de threads concorrentes?

Referências

LangGraph docslangchain-ai.github.io/langgraph

LangGraph GitHubgithub.com/langchain-ai/langgraph

LCEL → LangGraph migrationblog.langchain.dev/langgraph (jan 2024 launch post)

Pregel paperMalewicz et al. "Pregel: A System for Large-Scale Graph Processing". SIGMOD 2010 — inspiração do engine

ReActYao et al. "ReAct: Synergizing Reasoning and Acting in Language Models". ICLR 2023

LangGraph Studiogithub.com/langchain-ai/langgraph-studio

Persistêncialangchain-ai.github.io/langgraph/concepts/persistence

O que LangGraph traz que LCEL não tinha

Hello LangGraph — agente ReAct mínimo

Checkpointing e time travel

Human-in-the-loop

Arquitetura interna do StateGraph

Fluxo de decisão: quando usar LangGraph

Timeline do LangGraph

Perguntas frequentes

Referências

Próximos passos sugeridos

Discussão

LangGraph: agentes como state machines (com cycles)

O que LangGraph traz que LCEL não tinha

Hello LangGraph — agente ReAct mínimo

Checkpointing e time travel

Human-in-the-loop

Arquitetura interna do StateGraph

Fluxo de decisão: quando usar LangGraph

Timeline do LangGraph

Perguntas frequentes

Referências

Próximos passos sugeridos

Discussão