Blind planning só produz planos comparáveis se cada agente seguir as mesmas regras de prova: brightdata scrape para qualquer URL, Read do path local inteiro, RE forense no binário em disco — e citar comando + linha, nunca só o metadata.json. Esta lição transforma essas regras em um reflexo.
A regra de ouro do prompt cego: a sessão é cega de propósito. REs antigos, gists, cursos e esta conversa não são fonte de verdade. A única prova admissível é um artefato fresco — o arquivo de brightdata scrape, o trecho lido do path completo, a linha de saída de strings. Tudo aqui é citado de arquivo real; nada é inventado.
0
O que você vai dominar
Ao final desta lição você consegue
Explicar por que blind planning exige uma única norma de evidência para todos os agentes.
Aplicar a cadeia de custódia: cada afirmação atrelada a um exhibit, nunca a um resumo.
Escolher o método obrigatório por fonte: URL → brightdata; path → Read inteiro; binário → strings/grep.
Reconhecer e rejeitar as palavras proibidas ("provavelmente", "deve ser", "parece que") sem prova.
Distinguir o corpus injetado (evidência pré-aprovada) da Fase 1 (RE forense fresco) que ele não dispensa.
Suposições tolas (o pouco que assumimos de você)
Você já viu a lição 1 — sabe que o harness é o produto e que tudo gira em torno de provar, não prometer.
Você sabe abrir um terminal e rodar um comando. Não precisa saber o que é brightdata ainda — vamos apresentar.
Você é esperto; só é novo nesta disciplina. Nada aqui é condescendência — é cadeia de custódia.
1
A ideia central
Blind planning existe para produzir planos independentes comparáveis. Se um agente "lembra" da sessão passada e outro lê o disco do zero, os planos não são comparáveis — são contaminados. A evidência comum é o que mantém a comparação honesta.
Cada agente do blind planning recebe o mesmo problema e planeja sozinho, sem ver o plano dos outros. Para que os planos possam ser comparados de forma justa, todos precisam partir das mesmas regras de evidência — não da intuição, não da memória de uma sessão anterior, não de um resumo conveniente que alguém escreveu antes.
Por isso o prompt proíbe tratar REs anteriores, gists, cursos ou esta própria conversa como fonte de verdade. A Fase 1 ainda exige reverse engineering (RE) forense fresco: ir ao binário e ao disco e extrair a prova agora. O corpus em PROMPT-CORPUS-EMBEDS.mdé evidência — mas porque foi coletado com a mesma disciplina e injetado para todos igualmente.
Pense como… um julgamento com cadeia de custódia. O resumo de uma testemunha ("acho que ele estava lá") é inadmissível sem o exhibit: o arquivo do scrape, a leitura integral do path, a linha de strings. A analogia quebra num ponto: no tribunal a prova é do passado; aqui você produz a prova na hora, no boundary real, e a anexa ao plano.
As proibições da sessão cega
Proibido como verdade:docs/alembic/*.md de outras sessões, gists publicados, cursos anteriores, esta conversa. Proibido como ferramenta:WebSearch, WebFetch e o MCP Bright Data — a única porta para a web é o CLI brightdata.
Proibido como linguagem: "provavelmente", "deve ser", "parece que", "imagino que" — qualquer afirmação sem um comando + saída ou um path + trecho verbatim por baixo.
Corpus (a exceção honesta):PROMPT-CORPUS-EMBEDS.md v1.3.0 carrega scrapes pré-coletados em corpus-cache/. É evidência injetada — mas a Fase 1 não é dispensada: o RE forense em binários e disco continua obrigatório.
A disciplina de evidência é o que move um plano da coluna da esquerda para a da direita — e só a da direita pode ser comparada honestamente com a de outro agente.Os agentes nunca se veem (cegos), mas partem da mesma evidência — por isso os planos podem ser comparados lado a lado de forma justa.
0
classes de fonte com método obrigatório (URL · path · binário)
0
scrapes pré-coletados no corpus injetado v1.3.0
0
afirmações de comportamento aceitas só com metadata.json
A fronteira é binária: ou há um exhibit por baixo (oliva) ou é não-evidência (rust). Não existe meio-termo "plausível".
Guarde istoEvidência = um artefato que você produziu e pode citar (comando+linha, path+trecho, linha de strings). Não-evidência = um resumo, uma memória, um "deve ser". Blind planning recusa a segunda categoria — sempre.
2
A cadeia de custódia
Toda afirmação que entra no plano precisa de uma cadeia de custódia intacta: da fonte ao exhibit, do exhibit à citação. Se algum elo falta — você leu só o resumo, ou só viu o nome do arquivo — a afirmação é inadmissível e não pode sustentar uma decisão.
Da fonte ao exhibit à citação: a corrente que torna uma afirmação admissível. Onde a corrente se rompe (faixa inferior), a afirmação é descartada.
Quatro elos. Quebre qualquer um e a afirmação cai. É a mesma lógica do Proof Gate do harness, aplicada ao planejamento.Nunca há um quarto caminho. Ou você tem o exhibit, ou coleta, ou declara incerteza — jamais "provavelmente".
CuidadoA armadilha mais comum do iniciante: ler o understanding.md ou o metadata.json de um pacote e tratar isso como prova do comportamento. Eles descrevem; não comprovam. Comportamento se prova com strings no binário, grep no código, ou a leitura do path inteiro — não com o resumo que alguém deixou.
3
A tabela de evidência
Esta é a tabela que você consulta antes de afirmar qualquer coisa. Identifique a fonte, use o método obrigatório, e nunca caia no proibido.
Fonte
Método obrigatório
Citar
Proibido
URL externa
brightdata scrape <url> -o corpus-cache/<slug>.md
comando + linha-chave
WebSearch, WebFetch, MCP
Path local
Read do arquivo inteiro
path + trecho verbatim
só understanding.md / metadata.json
Binário instalado
strings, grep, artefatos em disco
a linha de saída
especular sem a linha
Imagens (HF)
descrição visual completa nos embeds
o que se vê na imagem
só o nome do arquivo
Fonte: PROMPT-BLIND-PLANNING.md § Disciplina de evidência
A regra do "inteiro"
Ler o path inteiro não é zelo: um Read parcial deixa você citar um trecho fora de contexto e concluir errado. O arquivo todo é o exhibit; meia leitura é meio exhibit.
Por que só o CLI brightdata
WebSearch/WebFetch e o MCP devolvem texto sem um arquivo auditável. O CLI brightdata grava o scrape em corpus-cache/ — um exhibit em disco que qualquer um pode reabrir e conferir.
Mesma tabela, em forma de mapa: a fonte escolhe a porta; não há atalho que pule a porta.Um Read parcial deixa você citar um trecho que o resto do arquivo contradiz. O exhibit só está completo quando o arquivo está.
4
Os comandos reais
A teoria vira hábito quando você vê os comandos exatos. Estes são os três gestos da disciplina — coletar uma URL, indexar o RE de um binário, e o que não usar.
Os três gestos lado a lado: coletar (brightdata), provar no binário (strings/grep/jq) e o que nunca usar. O rodapé é o reflexo a treinar.
brightdata — coletar uma URL como exhibit em disco
brightdata budget # confere o orçamento ANTES de coletar em volume
brightdata scrape https://martinfowler.com/articles/agentic-ai.html \
-o docs/alembic/corpus-cache/martinfowler-harness.md
RE forense — Fase 1, prova de comportamento no binário
# comportamento se prova no binário/disco, nunca no resumo do pacote
strings -a ~/.local/bin/droid | rg 'propose_mission|start_mission_run'
jq '.interactionMode' ~/.factory/sessions/*/*.settings.json
proibido — devolve texto sem exhibit auditável
✗ WebSearch "como o droid inicia uma missão"
✗ WebFetch https://... # sem arquivo em corpus-cache/, não é prova✗ mcp__Bright_Data__* # o MCP é proibido; só o CLI brightdata
O scrape vira um arquivo versionado que qualquer agente reabre e confere. É isso que o torna prova — e que falta no WebFetch.Não é estilo: o hedge sinaliza que falta o exhibit. Troque a incerteza vaga por [uncertain] explícito, ou colete a prova.
O reflexo a treinar: toda vez que você for afirmar algo, pergunte "qual é o meu exhibit?". Se a resposta for um comando que você rodou e uma linha que você pode colar, pode afirmar. Se for "eu lembro" ou "o resumo dizia", pare e colete a prova.
Preveja antes de revelar
Um agente escreve no plano: "o droid provavelmente inicia a missão via start_mission_run", citando o understanding.md do pacote. Admissível ou rejeitado? E o que faltou?
Rejeitado. Há duas falhas: a palavra "provavelmente" (afirmação sem prova) e a fonte errada (o understanding.mddescreve, não comprova o comportamento). O exhibit que faltou: strings -a ~/.local/bin/droid | rg 'start_mission_run' — a linha real no binário. Com ela, vira: "o binário contém start_mission_run (strings)" — sem "provavelmente".
5
O corpus injetado (a exceção honesta)
Há uma exceção à regra "colete tudo na hora": o corpus de PROMPT-CORPUS-EMBEDS.md. São scrapes que já foram coletados com a mesma disciplina e injetados no prompt — então contam como evidência sem você precisar re-coletar. Mas atenção: o corpus cobre a web pública; ele não dispensa a Fase 1, o RE forense do que está instalado na sua máquina.
corpus-cache/ — os exhibits da web, pré-coletados e versionados
O corpus é um atalho legítimo para a web pública — não um passe livre. O comportamento do que está instalado ainda se prova com RE forense fresco.
Papo técnico (pode pular)Por que "injetado" conta e "lembrado" não? Porque o corpus é determinístico e auditável: está versionado (v1.3.0), todo agente recebe os mesmos 10 arquivos, e cada um aponta para um scrape original. Memória de sessão é o oposto: não-versionada, não-compartilhada, não-auditável — exatamente o que contamina a comparação.
6
Experimente: a máquina de veredito
Clique em cada tipo de afirmação. A máquina mostra a afirmação, dá o veredito (válido ou rejeitado) e — quando rejeita — diz o exhibit que faltou. Use isto para calibrar o seu próprio reflexo de "qual é a minha prova?".
A máquina abaixo é determinística: o veredito depende só de existir um exhibit citável — não da plausibilidade.
A afirmação no plano
…
✓ VÁLIDO
…
DicaNote o padrão: os dois rejeitados (metadata e memória) descrevem ou lembram; os três válidos apontam para um artefato que você produziu. A pergunta-chave nunca é "isso é plausível?" — é "isso é um exhibit?".
Você é o aluno e também o professor: pegue a última afirmação que você escreveu num plano e pergunte "qual é o meu exhibit, e a cadeia de custódia está intacta?". Se hesitar, é sinal de que falta um scrape, um Read inteiro ou uma linha de strings. A seguir (0003): com a evidência garantida, vêm os três acordes — o que fundir depois de provar.
7
Passo a passo: de um boato a uma prova
Veja a disciplina aplicada a um caso real do blind planning: descobrir como o droid inicia uma missão. Acompanhe os quatro passos — depois tente o "agora você".
Provar o comportamento de um binário instalado
1
Nomeie a afirmação e o boato. "O droid inicia missões via algum comando interno." Boato = o que o resumo do pacote sugere. Ainda não é prova.
2
Escolha a fonte e o método. A fonte é um binário instalado → método obrigatório: strings/grep no arquivo em disco, não o understanding.md.
3
Produza o exhibit.strings -a ~/.local/bin/droid | rg 'start_mission_run' → devolve a linha contendo start_mission_run. Esse é o exhibit.
4
Cite, sem palavra proibida. No plano: "o binário droid contém o símbolo start_mission_run (via strings)" — comando + linha, zero "provavelmente". Cadeia de custódia intacta.
5
Agora você: precisa saber o interactionMode padrão das sessões do factory. Qual é a fonte? Qual o método e o comando? E como você citaria? (Dica: é um arquivo de settings em disco — pense em jq.)
Confira o "agora você"
Pensou na sua resposta para o passo 5?
Fonte = arquivo de settings em disco (não um resumo). Método/comando = jq '.interactionMode' ~/.factory/sessions/*/*.settings.json. Citação = "as sessions do factory gravam interactionMode = <valor lido> (via jq no settings.json)" — path + valor real, sem "deve ser".
8
Recapitulando em 6 slides
Por que existe
Planos comparáveis exigem prova comum
Blind planning compara planos independentes. Eles só são comparáveis se todos partem das mesmas regras de evidência — não da memória, não da intuição.
1
A metáfora
Cadeia de custódia
Fonte → exhibit → citação → plano. Quebre um elo (só resumo, só nome de arquivo) e a afirmação é inadmissível.
Banido: "provavelmente / deve ser / parece que" sem prova; WebSearch, WebFetch, o MCP; e metadata.json sozinho como prova de comportamento.
4
A exceção
O corpus injetado
PROMPT-CORPUS-EMBEDS.md v1.3.0: 10 scrapes da web, versionados e injetados, contam como evidência — mas não dispensam o RE forense da Fase 1.
5
O reflexo
"Qual é o meu exhibit?"
Antes de afirmar, sempre: se há um comando rodado + uma linha colável, afirme. Se é "eu lembro", pare e colete a prova.
6
1 / 6setas ←→
Simples ↔ Técnico: a mesma regra, duas alturas
Alterne entre a explicação leiga e a precisa. Use "Técnico" quando quiser os nomes exatos; "Simples" quando quiser a intuição.
Em linguagem de gente: antes de escrever qualquer coisa no plano, você precisa ter visto com os próprios olhos — rodado o comando, lido o arquivo todo, olhado a imagem. "Alguém me contou" e "eu acho que lembro" não valem. Se todos os agentes seguem isso, os planos podem ser comparados de forma justa, porque ninguém está chutando.
Com os termos exatos: a disciplina de evidência define um método obrigatório por classe de fonte — URL → brightdata scrape -o corpus-cache/; path → Read integral citando path + trecho; binário → strings/grep/jq citando a linha. Proíbe WebSearch/WebFetch/MCP Bright Data e os hedges sem prova. O corpus-cache/ (PROMPT-CORPUS-EMBEDS v1.3.0, 10 scrapes) é evidência injetada determinística; a Fase 1 (RE forense em disco) permanece obrigatória. É o Proof Gate do harness levado para o planejamento.
As Dez ideias para levar desta lição
Blind planning compara planos independentes — só justo se a evidência for comum.
Evidência = um exhibit que você produziu e pode citar; não um resumo ou uma memória.
Cadeia de custódia: fonte → exhibit → citação → plano. Um elo faltando derruba a afirmação.
URL → brightdata scrape -o corpus-cache/. Nunca WebSearch/WebFetch/MCP.
Path local → Read do arquivo inteiro, citando path + trecho verbatim.
Binário → comportamento se prova com strings/grep/jq, citando a linha.
"Provavelmente / deve ser / parece que" sem prova = afirmação rejeitada.
understanding.md e metadata.jsondescrevem; não comprovam comportamento.
O corpus injetado é evidência (versionada, compartilhada) — a Fase 1 não é dispensada.
Antes de afirmar, sempre: "qual é o meu exhibit?". Sem ele, colete a prova.
9
Cartões de memória & verificação
Vire cada cartão (clique, ou Enter/Espaço) e tente responder antes de ver o verso — prática de recuperação vale mais que reler. Depois, as três perguntas fecham a lição.
Por quê
Por que blind planning precisa de uma norma de evidência única?
clique para virar
Porque compara planos independentes: só são comparáveis de forma justa se todos partem da mesma prova, não da memória ou intuição de cada um.
URL
Qual o método obrigatório para uma URL externa?
clique para virar
brightdata scrape <url> -o corpus-cache/<slug>.md, citando comando + linha-chave. NuncaWebSearch, WebFetch ou o MCP.
Path
Como provar algo a partir de um path local?
clique para virar
Read do arquivo inteiro, citando path + trecho verbatim. Só o understanding.md ou metadata.json não basta.
Binário
Como se prova o comportamento de um binário instalado?
clique para virar
Com strings/grep/jq sobre o arquivo em disco, citando a linha — o RE forense da Fase 1, que o corpus não dispensa.
Linguagem
Quais palavras sinalizam uma afirmação inadmissível?
clique para virar
"Provavelmente", "deve ser", "parece que", "imagino que" — qualquer hedge sem comando + saída ou path + trecho por baixo.
Corpus
Por que o corpus injetado conta como evidência, e a memória não?
clique para virar
O corpus é versionado, compartilhado e auditável (v1.3.0, mesmos 10 scrapes p/ todos). Memória de sessão é não-versionada e não-compartilhada — contamina a comparação.
Checagem cumulativa
Acerte as três para fechar a lição. A pontuação aparece abaixo. Leia o porquê de cada opção — o feedback ensina tanto quanto a pergunta.
1. Um agente quer citar como uma página da web funciona. O que é evidência válida?
(b). Só o CLI brightdata grava um exhibit auditável em corpus-cache/. WebFetch (a) é proibido e não deixa arquivo; a memória de sessão (c) é não-auditável e contamina a comparação.
2. Para provar como um binário instalado se comporta, a fonte correta é:
(c). Comportamento se prova no artefato real. understanding.md (a) e metadata.json (b) descrevem — não comprovam — e por si sós são inadmissíveis para uma afirmação de comportamento.
3. O corpus injetado (PROMPT-CORPUS-EMBEDS v1.3.0) significa que:
(a). O corpus é evidência injetada para a web pública; a Fase 1 (RE forense em binários/disco) não é dispensada (b é falso). E ele não tem relação com memória de sessão, que segue proibida (c falso).
Acertos: 0/3
Em uma frase, para você mesmo: "Antes de afirmar, meu exhibit é ____, coletado por ____, e a cadeia de custódia está ____." Se consegue preencher as três lacunas com confiança, está pronto para a lição 0003 — os três acordes.
Ficou em dúvida se uma fonte específica é admissível? Pergunte ao agente: "esta afirmação tem cadeia de custódia intacta? qual exhibit falta?". Esse hábito de checar a prova é exatamente o que a próxima lição assume pronto.