Lição 2

Dados e prompts: estrutura de entrada e disciplina de validação

Este capítulo explica como organizar os materiais fornecidos à IA sob três perspectivas: fontes de informação, horizonte temporal e restrições de prompt. O objetivo é reduzir a contaminação das decisões de trading por alucinações e narrativas de sobrevivência.

1. Ponto de Partida: a Qualidade da Saída Depende da Estrutura da Entrada

A Lição 1 delineou seis posições em que a IA se insere no fluxo de trabalho de negociação, com a organização da informação na vanguarda. Se os resumos forem imprecisos, as datas se confundirem ou as fontes não puderem ser rastreadas, a subsequente geração de hipóteses, discussões de backtesting e listas de verificação de risco apenas amplificam os vieses iniciais. Por isso, a Lição 2 não prioriza técnicas para "fazer perguntas melhores", mas discute a disciplina estrutural necessária na etapa de entrada: as saídas do modelo devem ser tratadas como sujeitas a verificação por padrão, e não como fatos estabelecidos.

Em contextos de negociação, alucinações geralmente não significam que o modelo esteja deliberadamente fabricando informações, mas que ele gera conteúdo fluente e confiante que não pode ser vinculado a fontes primárias verificáveis. Formas comuns incluem: inventar anúncios ou links, confundir capitalização de mercado com oferta circulante, aplicar dados desatualizados a questões atuais, usar frases como "dados on-chain mostram" sem fornecer endereços, janelas de tempo ou padrões estatísticos. A solução não é rejeitar a IA por completo, mas especificar o nível da fonte, o limite de tempo e as etapas de validação para cada informação que entra na cadeia de decisão.

2. Classificação de Fontes: Construindo um Framework Acionável de Classificação

Antes de submeter materiais à IA, é aconselhável classificar as fontes de informação e exigir que o modelo rotule cada ponto-chave por grau no prompt. O objetivo da classificação não é o formalismo, mas esclarecer qual conteúdo pode ser declarado como fato e qual só pode servir como indício ou julgamento não verificado.

  • Fontes primárias incluem sites oficiais do projeto, registros de lançamento no GitHub, anúncios de exchanges e órgãos reguladores, exploradores de blockchain e dados de transações exportáveis. Esses materiais são relativamente confiáveis, mas ainda exigem vigilância contra páginas de phishing e anúncios forjados; links e domínios exigem verificação manual.

  • Fontes secundárias incluem relatórios de instituições de pesquisa, documentos de auditoria e páginas de proof-of-reserve. Elas ajudam a compreender mecanismos, mas é necessário verificar se a data de publicação e o escopo da auditoria cobrem a estrutura atual.

  • Mídia mainstream: interpretações de políticas podem ser referenciadas, mas conclusões-chave devem ser verificadas em cruz com documentos primários.

  • Mídias sociais, KOLs e conteúdo comunitário são adequados apenas como pontos de entrada para descoberta de problemas e não devem justificar uma negociação de forma independente. Capturas de tela anônimas e "informações privilegiadas" são por padrão excluídas da lógica de negociação.

Os prompts podem exigir: apenas fontes de alto grau para declarações factuais; fontes de médio ou baixo grau devem ser rotuladas como "reportadamente" ou "não verificado"; itens sem fonte ou data devem ser uniformemente marcados para verificação. Mesmo que o modelo ainda cometa erros, esse formato de saída facilita a filtragem manual.

3. Carimbos de Data e Padrões: Dados de Cripto São Propensos a "Dados Antigos em Novos Contextos"

O treinamento e a recuperação do modelo ficam atrasados em relação aos desenvolvimentos em tempo real, e os mecanismos dos projetos frequentemente atualizam. Ao consultar, especifique intervalos de tempo: por exemplo, analise apenas materiais após uma determinada data; sinalize informações potencialmente desatualizadas como "a partir de [data]". Ao comparar preços ou métricas, especifique o intervalo de candlestick, a exchange, o par de negociação, se é spot ou perpétuo, etc. Para estatísticas on-chain, indique o nome da blockchain, o endereço do contrato, a janela estatística e se fluxos de entrada/saída da exchange estão incluídos. A mesma pergunta sob padrões diferentes pode gerar conclusões opostas; os padrões devem ser um campo fixo do prompt, não uma reflexão posterior.

4. Narrativas de Sobrevivência e Evidências Contrárias

Discussões sobre cripto frequentemente mostram apenas casos lucrativos, usam apenas amostras de mercado em alta ou citam backtests de períodos de alta. As narrativas da IA tendem a tornar as histórias completas, ignorando amostras concorrentes fracassadas. Contramedidas incluem: exigir evidências tanto favoráveis quanto contrárias; especificar o tamanho da amostra e o período de tempo; responder explicitamente "não é possível determinar" quando a evidência for insuficiente, em vez de forçar uma conclusão. O diálogo orientado à pesquisa é mais adequado para apresentar cenários e condições de falha do que gerar diretamente recomendações de compra ou venda.

5. Estrutura do Prompt: Restrição de Forma em Vez de Flores Retóricas

Prompts eficazes geralmente incluem quatro partes:

  • Declaração de escopo: função de assistente de pesquisa, sem recomendações de tokens, sem retornos garantidos.

  • Condições de restrição: sem links fabricados, marcar incertezas, regras de classificação de fontes.

  • Formato de saída: argumento, base, grau da fonte, data, condições de invalidação.

  • Etapas de validação: verificações manuais necessárias, como abrir URLs de anúncios ou verificar hashes de transações on-chain.

Ao final de cada conversa, gere uma lista de verificação de validação a ser completada manualmente antes de prosseguir para hipóteses ou etapas de negociação. O comprimento do prompt não é o mais importante; o que importa é se a fonte, o período de tempo e os padrões estão fixados.

6. Divisão de Dados do Trabalho: Números Fornecidos por Humanos, Modelo Lida com Interpretação

Uma divisão de trabalho mais robusta: dados de mercado e on-chain devem ser exportados de APIs, exchanges ou exploradores e colados para a IA em tabelas brutas ou com campos claros. O modelo interpreta significados, identifica inconsistências e ajuda a estruturar hipóteses, mas não gera valores críticos de forma independente. Se o modelo participa de cálculos, exija que ele exiba fórmulas e etapas intermediárias, com as conclusões principais recalculadas manualmente. Conversas longas correm o risco de desvio de contexto; tópicos importantes devem iniciar novos threads, e fatos verificados devem ser arquivados separadamente para referência apenas em interações subsequentes, reduzindo a contaminação de contexto.

7. Resumo da Lição

Esta lição aborda a etapa anterior ao uso da IA: de onde vêm os materiais, se incluem datas e padrões, e se fontes de baixo grau podem ser usadas como racional de negociação. Alucinações e narrativas de sobrevivência geralmente não são o modelo "falando sem sentido", mas resultado de declarações não verificáveis, dados desatualizados ou histórias de sucesso selecionadas na entrada. Ao incorporar classificação de fontes, limites de tempo e listas de verificação de validação em um processo fixo, as saídas tornam-se por padrão rascunhos que exigem verificação antes de entrar em discussões de hipóteses ou posições. A próxima lição abordará validação de estratégia: após limpar as entradas, é necessário escrutinar separadamente dados, custos e resultados fora da amostra; curvas de backtest, por si só, não validam uma estratégia.

Isenção de responsabilidade
* O investimento em criptomoedas envolve grandes riscos. Prossiga com cautela. O curso não se destina a servir de orientação para investimentos.
* O curso foi criado pelo autor que entrou para o Gate Learn. As opiniões compartilhadas pelo autor não representam o Gate Learn.