Blind Planning · Visual Course

Disciplina de evidência

Blind planning só produz planos comparáveis se cada agente seguir as mesmas regras de prova: brightdata scrape para qualquer URL, Read do path local inteiro, RE forense no binário em disco — e citar comando + linha, nunca só o metadata.json. Esta lição transforma essas regras em um reflexo.

Leia primeiro (fonte primária)

PROMPT-BLIND-PLANNING.md § Disciplina de evidência + PROMPT-CORPUS-EMBEDS.md (corpus v1.3.0)

A regra de ouro do prompt cego: a sessão é cega de propósito. REs antigos, gists, cursos e esta conversa não são fonte de verdade. A única prova admissível é um artefato fresco — o arquivo de brightdata scrape, o trecho lido do path completo, a linha de saída de strings. Tudo aqui é citado de arquivo real; nada é inventado.

O que você vai dominar

Ao final desta lição você consegue

Explicar por que blind planning exige uma única norma de evidência para todos os agentes.
Aplicar a cadeia de custódia: cada afirmação atrelada a um exhibit, nunca a um resumo.
Escolher o método obrigatório por fonte: URL → brightdata; path → Read inteiro; binário → strings/grep.
Reconhecer e rejeitar as palavras proibidas ("provavelmente", "deve ser", "parece que") sem prova.
Distinguir o corpus injetado (evidência pré-aprovada) da Fase 1 (RE forense fresco) que ele não dispensa.

Suposições tolas (o pouco que assumimos de você)

Você já viu a lição 1 — sabe que o harness é o produto e que tudo gira em torno de provar, não prometer.
Você sabe abrir um terminal e rodar um comando. Não precisa saber o que é brightdata ainda — vamos apresentar.
Você é esperto; só é novo nesta disciplina. Nada aqui é condescendência — é cadeia de custódia.

A ideia central

Blind planning existe para produzir planos independentes comparáveis. Se um agente "lembra" da sessão passada e outro lê o disco do zero, os planos não são comparáveis — são contaminados. A evidência comum é o que mantém a comparação honesta.

Cada agente do blind planning recebe o mesmo problema e planeja sozinho, sem ver o plano dos outros. Para que os planos possam ser comparados de forma justa, todos precisam partir das mesmas regras de evidência — não da intuição, não da memória de uma sessão anterior, não de um resumo conveniente que alguém escreveu antes.

Por isso o prompt proíbe tratar REs anteriores, gists, cursos ou esta própria conversa como fonte de verdade. A Fase 1 ainda exige reverse engineering (RE) forense fresco: ir ao binário e ao disco e extrair a prova agora. O corpus em PROMPT-CORPUS-EMBEDS.md é evidência — mas porque foi coletado com a mesma disciplina e injetado para todos igualmente.

Pense como… um julgamento com cadeia de custódia. O resumo de uma testemunha ("acho que ele estava lá") é inadmissível sem o exhibit: o arquivo do scrape, a leitura integral do path, a linha de strings. A analogia quebra num ponto: no tribunal a prova é do passado; aqui você produz a prova na hora, no boundary real, e a anexa ao plano.

As proibições da sessão cega

Proibido como verdade: docs/alembic/*.md de outras sessões, gists publicados, cursos anteriores, esta conversa. Proibido como ferramenta: WebSearch, WebFetch e o MCP Bright Data — a única porta para a web é o CLI brightdata.

Proibido como linguagem: "provavelmente", "deve ser", "parece que", "imagino que" — qualquer afirmação sem um comando + saída ou um path + trecho verbatim por baixo.

Corpus (a exceção honesta): PROMPT-CORPUS-EMBEDS.md v1.3.0 carrega scrapes pré-coletados em corpus-cache/. É evidência injetada — mas a Fase 1 não é dispensada: o RE forense em binários e disco continua obrigatório.

A disciplina de evidência é o que move um plano da coluna da esquerda para a da direita — e só a da direita pode ser comparada honestamente com a de outro agente.

Os agentes nunca se veem (cegos), mas partem da mesma evidência — por isso os planos podem ser comparados lado a lado de forma justa.

classes de fonte com método obrigatório (URL · path · binário)

scrapes pré-coletados no corpus injetado v1.3.0

afirmações de comportamento aceitas só com metadata.json

A fronteira é binária: ou há um exhibit por baixo (oliva) ou é não-evidência (rust). Não existe meio-termo "plausível".

Guarde istoEvidência = um artefato que você produziu e pode citar (comando+linha, path+trecho, linha de strings). Não-evidência = um resumo, uma memória, um "deve ser". Blind planning recusa a segunda categoria — sempre.

A cadeia de custódia

Toda afirmação que entra no plano precisa de uma cadeia de custódia intacta: da fonte ao exhibit, do exhibit à citação. Se algum elo falta — você leu só o resumo, ou só viu o nome do arquivo — a afirmação é inadmissível e não pode sustentar uma decisão.

Da fonte ao exhibit à citação: a corrente que torna uma afirmação admissível. Onde a corrente se rompe (faixa inferior), a afirmação é descartada.

Quatro elos. Quebre qualquer um e a afirmação cai. É a mesma lógica do Proof Gate do harness, aplicada ao planejamento.

Nunca há um quarto caminho. Ou você tem o exhibit, ou coleta, ou declara incerteza — jamais "provavelmente".

CuidadoA armadilha mais comum do iniciante: ler o understanding.md ou o metadata.json de um pacote e tratar isso como prova do comportamento. Eles descrevem; não comprovam. Comportamento se prova com strings no binário, grep no código, ou a leitura do path inteiro — não com o resumo que alguém deixou.

A tabela de evidência

Esta é a tabela que você consulta antes de afirmar qualquer coisa. Identifique a fonte, use o método obrigatório, e nunca caia no proibido.

Fonte	Método obrigatório	Citar	Proibido
URL externa	`brightdata scrape <url> -o corpus-cache/<slug>.md`	comando + linha-chave	`WebSearch`, `WebFetch`, MCP
Path local	`Read` do arquivo inteiro	path + trecho verbatim	só `understanding.md` / `metadata.json`
Binário instalado	`strings`, `grep`, artefatos em disco	a linha de saída	especular sem a linha
Imagens (HF)	descrição visual completa nos embeds	o que se vê na imagem	só o nome do arquivo

Fonte: PROMPT-BLIND-PLANNING.md § Disciplina de evidência

A regra do "inteiro"

Ler o path inteiro não é zelo: um Read parcial deixa você citar um trecho fora de contexto e concluir errado. O arquivo todo é o exhibit; meia leitura é meio exhibit.

Por que só o CLI brightdata

WebSearch/WebFetch e o MCP devolvem texto sem um arquivo auditável. O CLI brightdata grava o scrape em corpus-cache/ — um exhibit em disco que qualquer um pode reabrir e conferir.

Mesma tabela, em forma de mapa: a fonte escolhe a porta; não há atalho que pule a porta.

Um Read parcial deixa você citar um trecho que o resto do arquivo contradiz. O exhibit só está completo quando o arquivo está.

Os comandos reais

A teoria vira hábito quando você vê os comandos exatos. Estes são os três gestos da disciplina — coletar uma URL, indexar o RE de um binário, e o que não usar.

Infográfico em estilo editorial flat com três cartões lado a lado, cada um um gesto da disciplina de evidência: cartão 1 'URL → brightdata scrape' com o comando e uma seta para a pasta corpus-cache; cartão 2 'Binário → strings / grep / jq' com a linha de saída destacada; cartão 3 'Proibido' em tom de alerta listando WebSearch, WebFetch e MCP riscados; rodapé com a frase pergunte-se qual é o meu exhibit.

Os três gestos lado a lado: coletar (brightdata), provar no binário (strings/grep/jq) e o que nunca usar. O rodapé é o reflexo a treinar.

brightdata — coletar uma URL como exhibit em disco

brightdata budget                          # confere o orçamento ANTES de coletar em volume
brightdata scrape https://martinfowler.com/articles/agentic-ai.html \
  -o docs/alembic/corpus-cache/martinfowler-harness.md

RE forense — Fase 1, prova de comportamento no binário

# comportamento se prova no binário/disco, nunca no resumo do pacote
strings -a ~/.local/bin/droid | rg 'propose_mission|start_mission_run'
jq '.interactionMode' ~/.factory/sessions/*/*.settings.json

proibido — devolve texto sem exhibit auditável

✗ WebSearch "como o droid inicia uma missão"
✗ WebFetch https://...        # sem arquivo em corpus-cache/, não é prova
✗ mcp__Bright_Data__*         # o MCP é proibido; só o CLI brightdata

O scrape vira um arquivo versionado que qualquer agente reabre e confere. É isso que o torna prova — e que falta no WebFetch.

Não é estilo: o hedge sinaliza que falta o exhibit. Troque a incerteza vaga por [uncertain] explícito, ou colete a prova.

O reflexo a treinar: toda vez que você for afirmar algo, pergunte "qual é o meu exhibit?". Se a resposta for um comando que você rodou e uma linha que você pode colar, pode afirmar. Se for "eu lembro" ou "o resumo dizia", pare e colete a prova.

Preveja antes de revelar

Um agente escreve no plano: "o droid provavelmente inicia a missão via start_mission_run", citando o understanding.md do pacote. Admissível ou rejeitado? E o que faltou?

Rejeitado. Há duas falhas: a palavra "provavelmente" (afirmação sem prova) e a fonte errada (o understanding.md descreve, não comprova o comportamento). O exhibit que faltou: strings -a ~/.local/bin/droid | rg 'start_mission_run' — a linha real no binário. Com ela, vira: "o binário contém start_mission_run (strings)" — sem "provavelmente".

O corpus injetado (a exceção honesta)

Há uma exceção à regra "colete tudo na hora": o corpus de PROMPT-CORPUS-EMBEDS.md. São scrapes que já foram coletados com a mesma disciplina e injetados no prompt — então contam como evidência sem você precisar re-coletar. Mas atenção: o corpus cobre a web pública; ele não dispensa a Fase 1, o RE forense do que está instalado na sua máquina.

corpus-cache/ — os exhibits da web, pré-coletados e versionados

docs/alembic/corpus-cache/
  langchain-anatomy.md
  arxiv-2604.25850.md
  martinfowler-harness.md
  ...                                        # 10 scrapes · PROMPT-CORPUS-EMBEDS v1.3.0

O corpus é um atalho legítimo para a web pública — não um passe livre. O comportamento do que está instalado ainda se prova com RE forense fresco.

Papo técnico (pode pular)Por que "injetado" conta e "lembrado" não? Porque o corpus é determinístico e auditável: está versionado (v1.3.0), todo agente recebe os mesmos 10 arquivos, e cada um aponta para um scrape original. Memória de sessão é o oposto: não-versionada, não-compartilhada, não-auditável — exatamente o que contamina a comparação.

Experimente: a máquina de veredito

Clique em cada tipo de afirmação. A máquina mostra a afirmação, dá o veredito (válido ou rejeitado) e — quando rejeita — diz o exhibit que faltou. Use isto para calibrar o seu próprio reflexo de "qual é a minha prova?".

A máquina abaixo é determinística: o veredito depende só de existir um exhibit citável — não da plausibilidade.

A afirmação no plano

…

✓ VÁLIDO

…

DicaNote o padrão: os dois rejeitados (metadata e memória) descrevem ou lembram; os três válidos apontam para um artefato que você produziu. A pergunta-chave nunca é "isso é plausível?" — é "isso é um exhibit?".

Você é o aluno e também o professor: pegue a última afirmação que você escreveu num plano e pergunte "qual é o meu exhibit, e a cadeia de custódia está intacta?". Se hesitar, é sinal de que falta um scrape, um Read inteiro ou uma linha de strings. A seguir (0003): com a evidência garantida, vêm os três acordes — o que fundir depois de provar.

Passo a passo: de um boato a uma prova

Veja a disciplina aplicada a um caso real do blind planning: descobrir como o droid inicia uma missão. Acompanhe os quatro passos — depois tente o "agora você".

Provar o comportamento de um binário instalado

Nomeie a afirmação e o boato. "O droid inicia missões via algum comando interno." Boato = o que o resumo do pacote sugere. Ainda não é prova.

Escolha a fonte e o método. A fonte é um binário instalado → método obrigatório: strings/grep no arquivo em disco, não o understanding.md.

Produza o exhibit. strings -a ~/.local/bin/droid | rg 'start_mission_run' → devolve a linha contendo start_mission_run. Esse é o exhibit.

Cite, sem palavra proibida. No plano: "o binário droid contém o símbolo start_mission_run (via strings)" — comando + linha, zero "provavelmente". Cadeia de custódia intacta.

Agora você: precisa saber o interactionMode padrão das sessões do factory. Qual é a fonte? Qual o método e o comando? E como você citaria? (Dica: é um arquivo de settings em disco — pense em jq.)

Confira o "agora você"

Pensou na sua resposta para o passo 5?

Fonte = arquivo de settings em disco (não um resumo). Método/comando = jq '.interactionMode' ~/.factory/sessions/*/*.settings.json. Citação = "as sessions do factory gravam interactionMode = <valor lido> (via jq no settings.json)" — path + valor real, sem "deve ser".

Recapitulando em 6 slides

Por que existe

Planos comparáveis exigem prova comum

Blind planning compara planos independentes. Eles só são comparáveis se todos partem das mesmas regras de evidência — não da memória, não da intuição.

A metáfora

Cadeia de custódia

Fonte → exhibit → citação → plano. Quebre um elo (só resumo, só nome de arquivo) e a afirmação é inadmissível.

A tabela

Cada fonte, uma porta

URL → brightdata scrape. Path → Read inteiro. Binário → strings/grep. Imagem → descrição visual. Sem atalho.

O proibido

Palavras e ferramentas banidas

Banido: "provavelmente / deve ser / parece que" sem prova; WebSearch, WebFetch, o MCP; e metadata.json sozinho como prova de comportamento.

A exceção

O corpus injetado

PROMPT-CORPUS-EMBEDS.md v1.3.0: 10 scrapes da web, versionados e injetados, contam como evidência — mas não dispensam o RE forense da Fase 1.

O reflexo

"Qual é o meu exhibit?"

Antes de afirmar, sempre: se há um comando rodado + uma linha colável, afirme. Se é "eu lembro", pare e colete a prova.

1 / 6setas ← →

Simples ↔ Técnico: a mesma regra, duas alturas

Alterne entre a explicação leiga e a precisa. Use "Técnico" quando quiser os nomes exatos; "Simples" quando quiser a intuição.

Em linguagem de gente: antes de escrever qualquer coisa no plano, você precisa ter visto com os próprios olhos — rodado o comando, lido o arquivo todo, olhado a imagem. "Alguém me contou" e "eu acho que lembro" não valem. Se todos os agentes seguem isso, os planos podem ser comparados de forma justa, porque ninguém está chutando.

Com os termos exatos: a disciplina de evidência define um método obrigatório por classe de fonte — URL → brightdata scrape -o corpus-cache/; path → Read integral citando path + trecho; binário → strings/grep/jq citando a linha. Proíbe WebSearch/WebFetch/MCP Bright Data e os hedges sem prova. O corpus-cache/ (PROMPT-CORPUS-EMBEDS v1.3.0, 10 scrapes) é evidência injetada determinística; a Fase 1 (RE forense em disco) permanece obrigatória. É o Proof Gate do harness levado para o planejamento.

As Dez ideias para levar desta lição

Blind planning compara planos independentes — só justo se a evidência for comum.
Evidência = um exhibit que você produziu e pode citar; não um resumo ou uma memória.
Cadeia de custódia: fonte → exhibit → citação → plano. Um elo faltando derruba a afirmação.
URL → brightdata scrape -o corpus-cache/. Nunca WebSearch/WebFetch/MCP.
Path local → Read do arquivo inteiro, citando path + trecho verbatim.
Binário → comportamento se prova com strings/grep/jq, citando a linha.
"Provavelmente / deve ser / parece que" sem prova = afirmação rejeitada.
understanding.md e metadata.json descrevem; não comprovam comportamento.
O corpus injetado é evidência (versionada, compartilhada) — a Fase 1 não é dispensada.
Antes de afirmar, sempre: "qual é o meu exhibit?". Sem ele, colete a prova.

Cartões de memória & verificação

Vire cada cartão (clique, ou Enter/Espaço) e tente responder antes de ver o verso — prática de recuperação vale mais que reler. Depois, as três perguntas fecham a lição.

Por quê

Por que blind planning precisa de uma norma de evidência única?

clique para virar

Porque compara planos independentes: só são comparáveis de forma justa se todos partem da mesma prova, não da memória ou intuição de cada um.

URL

Qual o método obrigatório para uma URL externa?

clique para virar

brightdata scrape <url> -o corpus-cache/<slug>.md, citando comando + linha-chave. Nunca WebSearch, WebFetch ou o MCP.

Path

Como provar algo a partir de um path local?

clique para virar

Read do arquivo inteiro, citando path + trecho verbatim. Só o understanding.md ou metadata.json não basta.

Binário

Como se prova o comportamento de um binário instalado?

clique para virar

Com strings/grep/jq sobre o arquivo em disco, citando a linha — o RE forense da Fase 1, que o corpus não dispensa.

Linguagem

Quais palavras sinalizam uma afirmação inadmissível?

clique para virar

"Provavelmente", "deve ser", "parece que", "imagino que" — qualquer hedge sem comando + saída ou path + trecho por baixo.

Corpus

Por que o corpus injetado conta como evidência, e a memória não?

clique para virar

O corpus é versionado, compartilhado e auditável (v1.3.0, mesmos 10 scrapes p/ todos). Memória de sessão é não-versionada e não-compartilhada — contamina a comparação.

Checagem cumulativa

Acerte as três para fechar a lição. A pontuação aparece abaixo. Leia o porquê de cada opção — o feedback ensina tanto quanto a pergunta.

1. Um agente quer citar como uma página da web funciona. O que é evidência válida?

(b). Só o CLI brightdata grava um exhibit auditável em corpus-cache/. WebFetch (a) é proibido e não deixa arquivo; a memória de sessão (c) é não-auditável e contamina a comparação.

2. Para provar como um binário instalado se comporta, a fonte correta é:

(c). Comportamento se prova no artefato real. understanding.md (a) e metadata.json (b) descrevem — não comprovam — e por si sós são inadmissíveis para uma afirmação de comportamento.

3. O corpus injetado (PROMPT-CORPUS-EMBEDS v1.3.0) significa que:

(a). O corpus é evidência injetada para a web pública; a Fase 1 (RE forense em binários/disco) não é dispensada (b é falso). E ele não tem relação com memória de sessão, que segue proibida (c falso).

Acertos: 0/3

Em uma frase, para você mesmo: "Antes de afirmar, meu exhibit é ____, coletado por ____, e a cadeia de custódia está ____." Se consegue preencher as três lacunas com confiança, está pronto para a lição 0003 — os três acordes.

Pergunte ao seu professor (o agente)

Releia PROMPT-BLIND-PLANNING.md § Disciplina de evidência

Ficou em dúvida se uma fonte específica é admissível? Pergunte ao agente: "esta afirmação tem cadeia de custódia intacta? qual exhibit falta?". Esse hábito de checar a prova é exatamente o que a próxima lição assume pronto.