Passo 2 · Blind Planning · Disciplina de evidência
Blind Planning · Visual Course

Disciplina de evidência

Blind planning só produz planos comparáveis se cada agente seguir as mesmas regras de prova: brightdata scrape para qualquer URL, Read do path local inteiro, RE forense no binário em disco — e citar comando + linha, nunca só o metadata.json. Esta lição transforma essas regras em um reflexo.

Leia primeiro (fonte primária)
PROMPT-BLIND-PLANNING.md § Disciplina de evidência + PROMPT-CORPUS-EMBEDS.md (corpus v1.3.0)

A regra de ouro do prompt cego: a sessão é cega de propósito. REs antigos, gists, cursos e esta conversa não são fonte de verdade. A única prova admissível é um artefato fresco — o arquivo de brightdata scrape, o trecho lido do path completo, a linha de saída de strings. Tudo aqui é citado de arquivo real; nada é inventado.

0

O que você vai dominar


Ao final desta lição você consegue
  • Explicar por que blind planning exige uma única norma de evidência para todos os agentes.
  • Aplicar a cadeia de custódia: cada afirmação atrelada a um exhibit, nunca a um resumo.
  • Escolher o método obrigatório por fonte: URL → brightdata; path → Read inteiro; binário → strings/grep.
  • Reconhecer e rejeitar as palavras proibidas ("provavelmente", "deve ser", "parece que") sem prova.
  • Distinguir o corpus injetado (evidência pré-aprovada) da Fase 1 (RE forense fresco) que ele não dispensa.
Suposições tolas (o pouco que assumimos de você)
  • Você já viu a lição 1 — sabe que o harness é o produto e que tudo gira em torno de provar, não prometer.
  • Você sabe abrir um terminal e rodar um comando. Não precisa saber o que é brightdata ainda — vamos apresentar.
  • Você é esperto; só é novo nesta disciplina. Nada aqui é condescendência — é cadeia de custódia.
1

A ideia central


Blind planning existe para produzir planos independentes comparáveis. Se um agente "lembra" da sessão passada e outro lê o disco do zero, os planos não são comparáveis — são contaminados. A evidência comum é o que mantém a comparação honesta.

Cada agente do blind planning recebe o mesmo problema e planeja sozinho, sem ver o plano dos outros. Para que os planos possam ser comparados de forma justa, todos precisam partir das mesmas regras de evidência — não da intuição, não da memória de uma sessão anterior, não de um resumo conveniente que alguém escreveu antes.

Por isso o prompt proíbe tratar REs anteriores, gists, cursos ou esta própria conversa como fonte de verdade. A Fase 1 ainda exige reverse engineering (RE) forense fresco: ir ao binário e ao disco e extrair a prova agora. O corpus em PROMPT-CORPUS-EMBEDS.md é evidência — mas porque foi coletado com a mesma disciplina e injetado para todos igualmente.

Pense como… um julgamento com cadeia de custódia. O resumo de uma testemunha ("acho que ele estava lá") é inadmissível sem o exhibit: o arquivo do scrape, a leitura integral do path, a linha de strings. A analogia quebra num ponto: no tribunal a prova é do passado; aqui você produz a prova na hora, no boundary real, e a anexa ao plano.

As proibições da sessão cega

Proibido como verdade: docs/alembic/*.md de outras sessões, gists publicados, cursos anteriores, esta conversa. Proibido como ferramenta: WebSearch, WebFetch e o MCP Bright Data — a única porta para a web é o CLI brightdata.

Proibido como linguagem: "provavelmente", "deve ser", "parece que", "imagino que" — qualquer afirmação sem um comando + saída ou um path + trecho verbatim por baixo.

Corpus (a exceção honesta): PROMPT-CORPUS-EMBEDS.md v1.3.0 carrega scrapes pré-coletados em corpus-cache/. É evidência injetada — mas a Fase 1 não é dispensada: o RE forense em binários e disco continua obrigatório.

por que a evidência comum existe: dois planos só são comparáveis se partem da mesma prova PLANO CONTAMINADO ✱ parte da memória da sessão passada ✱ cita um resumo, não a fonte ✱ "provavelmente funciona assim" ✱ não dá para reproduzir nem comparar PLANO FUNDAMENTADO ◆ parte do disco e do binário, agora ◆ cita comando + linha / path + trecho ◆ marca [uncertain] quando não sabe ◆ reproduzível → comparável → justo
A disciplina de evidência é o que move um plano da coluna da esquerda para a da direita — e só a da direita pode ser comparada honestamente com a de outro agente.
como a evidência comum torna dois planos cegos comparáveis evidência comum corpus + RE forense Agente cego A Agente cego B plano A plano B comparáveis ✓ (mesma base de prova)
Os agentes nunca se veem (cegos), mas partem da mesma evidência — por isso os planos podem ser comparados lado a lado de forma justa.
0
classes de fonte com método obrigatório (URL · path · binário)
0
scrapes pré-coletados no corpus injetado v1.3.0
0
afirmações de comportamento aceitas só com metadata.json
o que pode sustentar uma decisão no plano EVIDÊNCIA — comando+linha · path+trecho · linha de strings não-evidência: resumo · memória · "deve ser" só a região verde-oliva pode entrar no plano e ser comparada
A fronteira é binária: ou há um exhibit por baixo (oliva) ou é não-evidência (rust). Não existe meio-termo "plausível".
Guarde istoEvidência = um artefato que você produziu e pode citar (comando+linha, path+trecho, linha de strings). Não-evidência = um resumo, uma memória, um "deve ser". Blind planning recusa a segunda categoria — sempre.
2

A cadeia de custódia


Toda afirmação que entra no plano precisa de uma cadeia de custódia intacta: da fonte ao exhibit, do exhibit à citação. Se algum elo falta — você leu só o resumo, ou só viu o nome do arquivo — a afirmação é inadmissível e não pode sustentar uma decisão.

Infográfico em estilo editorial flat mostrando a cadeia de custódia da evidência em blind planning: à esquerda três fontes (URL externa, path local, binário instalado), no centro o exhibit produzido por cada uma (arquivo de scrape, trecho lido, linha de strings), à direita a citação anexada ao plano; uma faixa inferior lista as fontes rejeitadas (memória de sessão, gist, metadata.json sozinho).

Da fonte ao exhibit à citação: a corrente que torna uma afirmação admissível. Onde a corrente se rompe (faixa inferior), a afirmação é descartada.

Fonte URL · path · binário Exhibit scrape · trecho · linha Citação comando + linha-chave Plano elo faltando (só resumo, só nome do arquivo) → afirmação REJEITADA, não chega ao plano a corrente completa torna a afirmação admissível
Quatro elos. Quebre qualquer um e a afirmação cai. É a mesma lógica do Proof Gate do harness, aplicada ao planejamento.
o teste de uma linha antes de escrever qualquer afirmação tenho um exhibit? sim cite e afirme (admissível) não colete a prova agora (scrape/Read/strings) ou marque [uncertain]
Nunca há um quarto caminho. Ou você tem o exhibit, ou coleta, ou declara incerteza — jamais "provavelmente".
CuidadoA armadilha mais comum do iniciante: ler o understanding.md ou o metadata.json de um pacote e tratar isso como prova do comportamento. Eles descrevem; não comprovam. Comportamento se prova com strings no binário, grep no código, ou a leitura do path inteiro — não com o resumo que alguém deixou.
3

A tabela de evidência


Esta é a tabela que você consulta antes de afirmar qualquer coisa. Identifique a fonte, use o método obrigatório, e nunca caia no proibido.

FonteMétodo obrigatórioCitarProibido
URL externabrightdata scrape <url> -o corpus-cache/<slug>.mdcomando + linha-chaveWebSearch, WebFetch, MCP
Path localRead do arquivo inteiropath + trecho verbatimunderstanding.md / metadata.json
Binário instaladostrings, grep, artefatos em discoa linha de saídaespecular sem a linha
Imagens (HF)descrição visual completa nos embedso que se vê na imagemsó o nome do arquivo

Fonte: PROMPT-BLIND-PLANNING.md § Disciplina de evidência

A regra do "inteiro"

Ler o path inteiro não é zelo: um Read parcial deixa você citar um trecho fora de contexto e concluir errado. O arquivo todo é o exhibit; meia leitura é meio exhibit.

Por que só o CLI brightdata

WebSearch/WebFetch e o MCP devolvem texto sem um arquivo auditável. O CLI brightdata grava o scrape em corpus-cache/ — um exhibit em disco que qualquer um pode reabrir e conferir.

cada fonte tem UMA porta válida para virar evidência URL brightdata scrape → corpus-cache/ Path Read (inteiro) → path + trecho Binário strings / grep → a linha Imagem descrição visual → nos embeds
Mesma tabela, em forma de mapa: a fonte escolhe a porta; não há atalho que pule a porta.
por que ler o path INTEIRO: meia leitura = meio exhibit Read parcial trecho lido — fora de contexto resto não lido — pode inverter a conclusão Read inteiro arquivo todo = exhibit completo, citável
Um Read parcial deixa você citar um trecho que o resto do arquivo contradiz. O exhibit só está completo quando o arquivo está.
4

Os comandos reais


A teoria vira hábito quando você vê os comandos exatos. Estes são os três gestos da disciplina — coletar uma URL, indexar o RE de um binário, e o que não usar.

Infográfico em estilo editorial flat com três cartões lado a lado, cada um um gesto da disciplina de evidência: cartão 1 'URL → brightdata scrape' com o comando e uma seta para a pasta corpus-cache; cartão 2 'Binário → strings / grep / jq' com a linha de saída destacada; cartão 3 'Proibido' em tom de alerta listando WebSearch, WebFetch e MCP riscados; rodapé com a frase pergunte-se qual é o meu exhibit.

Os três gestos lado a lado: coletar (brightdata), provar no binário (strings/grep/jq) e o que nunca usar. O rodapé é o reflexo a treinar.

brightdata — coletar uma URL como exhibit em disco
brightdata budget                          # confere o orçamento ANTES de coletar em volume
brightdata scrape https://martinfowler.com/articles/agentic-ai.html \
  -o docs/alembic/corpus-cache/martinfowler-harness.md
RE forense — Fase 1, prova de comportamento no binário
# comportamento se prova no binário/disco, nunca no resumo do pacote
strings -a ~/.local/bin/droid | rg 'propose_mission|start_mission_run'
jq '.interactionMode' ~/.factory/sessions/*/*.settings.json
proibido — devolve texto sem exhibit auditável
 WebSearch "como o droid inicia uma missão"
 WebFetch https://...        # sem arquivo em corpus-cache/, não é prova
 mcp__Bright_Data__*         # o MCP é proibido; só o CLI brightdata
por que só o CLI brightdata: ele deixa um exhibit em disco URL brightdata scrape corpus-cache/<slug>.md citável ✓ WebFetch / WebSearch / MCP → texto sem arquivo → não citável ✗
O scrape vira um arquivo versionado que qualquer agente reabre e confere. É isso que o torna prova — e que falta no WebFetch.
o detector de linguagem: o que dispara a rejeição REJEITADO (hedge sem prova) ✱ "provavelmente …" ✱ "deve ser …" · "parece que …" PASSA (ancorado em exhibit) ◆ "o binário contém X (strings)" ◆ "settings.json grava Y (jq)"
Não é estilo: o hedge sinaliza que falta o exhibit. Troque a incerteza vaga por [uncertain] explícito, ou colete a prova.
O reflexo a treinar: toda vez que você for afirmar algo, pergunte "qual é o meu exhibit?". Se a resposta for um comando que você rodou e uma linha que você pode colar, pode afirmar. Se for "eu lembro" ou "o resumo dizia", pare e colete a prova.
Preveja antes de revelar

Um agente escreve no plano: "o droid provavelmente inicia a missão via start_mission_run", citando o understanding.md do pacote. Admissível ou rejeitado? E o que faltou?

Rejeitado. Há duas falhas: a palavra "provavelmente" (afirmação sem prova) e a fonte errada (o understanding.md descreve, não comprova o comportamento). O exhibit que faltou: strings -a ~/.local/bin/droid | rg 'start_mission_run' — a linha real no binário. Com ela, vira: "o binário contém start_mission_run (strings)" — sem "provavelmente".
5

O corpus injetado (a exceção honesta)


Há uma exceção à regra "colete tudo na hora": o corpus de PROMPT-CORPUS-EMBEDS.md. São scrapes que já foram coletados com a mesma disciplina e injetados no prompt — então contam como evidência sem você precisar re-coletar. Mas atenção: o corpus cobre a web pública; ele não dispensa a Fase 1, o RE forense do que está instalado na sua máquina.

corpus-cache/ — os exhibits da web, pré-coletados e versionados
docs/alembic/corpus-cache/
  langchain-anatomy.md
  arxiv-2604.25850.md
  martinfowler-harness.md
  ...                                        # 10 scrapes · PROMPT-CORPUS-EMBEDS v1.3.0
o que o corpus dispensa — e o que ele JAMAIS dispensa CORPUS INJETADO ✓ ◆ scrapes da web pública, já coletados ◆ versionado: v1.3.0, 10 arquivos ◆ conta como evidência sem re-coletar ◆ mesma disciplina, injetado p/ todos FASE 1 — NÃO DISPENSADA ✱ binários instalados (droid, factory…) ✱ sessões e settings em disco ✱ exige strings / grep / jq AGORA ✱ o corpus não cobre a sua máquina
O corpus é um atalho legítimo para a web pública — não um passe livre. O comportamento do que está instalado ainda se prova com RE forense fresco.
Papo técnico (pode pular)Por que "injetado" conta e "lembrado" não? Porque o corpus é determinístico e auditável: está versionado (v1.3.0), todo agente recebe os mesmos 10 arquivos, e cada um aponta para um scrape original. Memória de sessão é o oposto: não-versionada, não-compartilhada, não-auditável — exatamente o que contamina a comparação.
6

Experimente: a máquina de veredito


Clique em cada tipo de afirmação. A máquina mostra a afirmação, dá o veredito (válido ou rejeitado) e — quando rejeita — diz o exhibit que faltou. Use isto para calibrar o seu próprio reflexo de "qual é a minha prova?".

como ler a máquina: a entrada aponta para um exhibit (✓) ou não (✗) scrape · Read inteiro · strings = têm exhibit metadata · memória = sem exhibit
A máquina abaixo é determinística: o veredito depende só de existir um exhibit citável — não da plausibilidade.
A afirmação no plano
✓ VÁLIDO

DicaNote o padrão: os dois rejeitados (metadata e memória) descrevem ou lembram; os três válidos apontam para um artefato que você produziu. A pergunta-chave nunca é "isso é plausível?" — é "isso é um exhibit?".
Você é o aluno e também o professor: pegue a última afirmação que você escreveu num plano e pergunte "qual é o meu exhibit, e a cadeia de custódia está intacta?". Se hesitar, é sinal de que falta um scrape, um Read inteiro ou uma linha de strings. A seguir (0003): com a evidência garantida, vêm os três acordes — o que fundir depois de provar.
7

Passo a passo: de um boato a uma prova


Veja a disciplina aplicada a um caso real do blind planning: descobrir como o droid inicia uma missão. Acompanhe os quatro passos — depois tente o "agora você".

Provar o comportamento de um binário instalado
1
Nomeie a afirmação e o boato. "O droid inicia missões via algum comando interno." Boato = o que o resumo do pacote sugere. Ainda não é prova.
2
Escolha a fonte e o método. A fonte é um binário instalado → método obrigatório: strings/grep no arquivo em disco, não o understanding.md.
3
Produza o exhibit. strings -a ~/.local/bin/droid | rg 'start_mission_run' → devolve a linha contendo start_mission_run. Esse é o exhibit.
4
Cite, sem palavra proibida. No plano: "o binário droid contém o símbolo start_mission_run (via strings)" — comando + linha, zero "provavelmente". Cadeia de custódia intacta.
5
Agora você: precisa saber o interactionMode padrão das sessões do factory. Qual é a fonte? Qual o método e o comando? E como você citaria? (Dica: é um arquivo de settings em disco — pense em jq.)
Confira o "agora você"

Pensou na sua resposta para o passo 5?

Fonte = arquivo de settings em disco (não um resumo). Método/comando = jq '.interactionMode' ~/.factory/sessions/*/*.settings.json. Citação = "as sessions do factory gravam interactionMode = <valor lido> (via jq no settings.json)" — path + valor real, sem "deve ser".
8

Recapitulando em 6 slides


Por que existe

Planos comparáveis exigem prova comum

Blind planning compara planos independentes. Eles só são comparáveis se todos partem das mesmas regras de evidência — não da memória, não da intuição.

A metáfora

Cadeia de custódia

Fonte → exhibit → citação → plano. Quebre um elo (só resumo, só nome de arquivo) e a afirmação é inadmissível.

A tabela

Cada fonte, uma porta

URL → brightdata scrape. Path → Read inteiro. Binário → strings/grep. Imagem → descrição visual. Sem atalho.

O proibido

Palavras e ferramentas banidas

Banido: "provavelmente / deve ser / parece que" sem prova; WebSearch, WebFetch, o MCP; e metadata.json sozinho como prova de comportamento.

A exceção

O corpus injetado

PROMPT-CORPUS-EMBEDS.md v1.3.0: 10 scrapes da web, versionados e injetados, contam como evidência — mas não dispensam o RE forense da Fase 1.

O reflexo

"Qual é o meu exhibit?"

Antes de afirmar, sempre: se há um comando rodado + uma linha colável, afirme. Se é "eu lembro", pare e colete a prova.

1 / 6setas

Simples ↔ Técnico: a mesma regra, duas alturas

Alterne entre a explicação leiga e a precisa. Use "Técnico" quando quiser os nomes exatos; "Simples" quando quiser a intuição.

Em linguagem de gente: antes de escrever qualquer coisa no plano, você precisa ter visto com os próprios olhos — rodado o comando, lido o arquivo todo, olhado a imagem. "Alguém me contou" e "eu acho que lembro" não valem. Se todos os agentes seguem isso, os planos podem ser comparados de forma justa, porque ninguém está chutando.
Com os termos exatos: a disciplina de evidência define um método obrigatório por classe de fonte — URL → brightdata scrape -o corpus-cache/; path → Read integral citando path + trecho; binário → strings/grep/jq citando a linha. Proíbe WebSearch/WebFetch/MCP Bright Data e os hedges sem prova. O corpus-cache/ (PROMPT-CORPUS-EMBEDS v1.3.0, 10 scrapes) é evidência injetada determinística; a Fase 1 (RE forense em disco) permanece obrigatória. É o Proof Gate do harness levado para o planejamento.
As Dez ideias para levar desta lição
  1. Blind planning compara planos independentes — só justo se a evidência for comum.
  2. Evidência = um exhibit que você produziu e pode citar; não um resumo ou uma memória.
  3. Cadeia de custódia: fonte → exhibit → citação → plano. Um elo faltando derruba a afirmação.
  4. URL → brightdata scrape -o corpus-cache/. Nunca WebSearch/WebFetch/MCP.
  5. Path local → Read do arquivo inteiro, citando path + trecho verbatim.
  6. Binário → comportamento se prova com strings/grep/jq, citando a linha.
  7. "Provavelmente / deve ser / parece que" sem prova = afirmação rejeitada.
  8. understanding.md e metadata.json descrevem; não comprovam comportamento.
  9. O corpus injetado é evidência (versionada, compartilhada) — a Fase 1 não é dispensada.
  10. Antes de afirmar, sempre: "qual é o meu exhibit?". Sem ele, colete a prova.
9

Cartões de memória & verificação


Vire cada cartão (clique, ou Enter/Espaço) e tente responder antes de ver o verso — prática de recuperação vale mais que reler. Depois, as três perguntas fecham a lição.

Por quê
Por que blind planning precisa de uma norma de evidência única?
clique para virar
Porque compara planos independentes: só são comparáveis de forma justa se todos partem da mesma prova, não da memória ou intuição de cada um.
URL
Qual o método obrigatório para uma URL externa?
clique para virar
brightdata scrape <url> -o corpus-cache/<slug>.md, citando comando + linha-chave. Nunca WebSearch, WebFetch ou o MCP.
Path
Como provar algo a partir de um path local?
clique para virar
Read do arquivo inteiro, citando path + trecho verbatim. Só o understanding.md ou metadata.json não basta.
Binário
Como se prova o comportamento de um binário instalado?
clique para virar
Com strings/grep/jq sobre o arquivo em disco, citando a linha — o RE forense da Fase 1, que o corpus não dispensa.
Linguagem
Quais palavras sinalizam uma afirmação inadmissível?
clique para virar
"Provavelmente", "deve ser", "parece que", "imagino que" — qualquer hedge sem comando + saída ou path + trecho por baixo.
Corpus
Por que o corpus injetado conta como evidência, e a memória não?
clique para virar
O corpus é versionado, compartilhado e auditável (v1.3.0, mesmos 10 scrapes p/ todos). Memória de sessão é não-versionada e não-compartilhada — contamina a comparação.

Checagem cumulativa

Acerte as três para fechar a lição. A pontuação aparece abaixo. Leia o porquê de cada opção — o feedback ensina tanto quanto a pergunta.

1. Um agente quer citar como uma página da web funciona. O que é evidência válida?
(b). Só o CLI brightdata grava um exhibit auditável em corpus-cache/. WebFetch (a) é proibido e não deixa arquivo; a memória de sessão (c) é não-auditável e contamina a comparação.
2. Para provar como um binário instalado se comporta, a fonte correta é:
(c). Comportamento se prova no artefato real. understanding.md (a) e metadata.json (b) descrevem — não comprovam — e por si sós são inadmissíveis para uma afirmação de comportamento.
3. O corpus injetado (PROMPT-CORPUS-EMBEDS v1.3.0) significa que:
(a). O corpus é evidência injetada para a web pública; a Fase 1 (RE forense em binários/disco) não é dispensada (b é falso). E ele não tem relação com memória de sessão, que segue proibida (c falso).
Acertos: 0/3
Em uma frase, para você mesmo: "Antes de afirmar, meu exhibit é ____, coletado por ____, e a cadeia de custódia está ____." Se consegue preencher as três lacunas com confiança, está pronto para a lição 0003 — os três acordes.
Pergunte ao seu professor (o agente)
Releia PROMPT-BLIND-PLANNING.md § Disciplina de evidência

Ficou em dúvida se uma fonte específica é admissível? Pergunte ao agente: "esta afirmação tem cadeia de custódia intacta? qual exhibit falta?". Esse hábito de checar a prova é exatamente o que a próxima lição assume pronto.