Lição 2

Dados e prompts — estrutura de entrada e disciplina de validação

Este capítulo explica como organizar os materiais introduzidos na IA a partir de três perspetivas — fontes de informação, horizonte temporal e restrições do prompt —, de modo a reduzir a contaminação dos juízos de negociação por alucinações e narrativas de sobrevivência.

1. Ponto de partida: a qualidade do resultado depende da estrutura da entrada

A Lição 1 delineou seis posições onde a IA se insere no fluxo de trabalho de negociação, com a organização da informação na vanguarda. Se os resumos forem imprecisos, as datas estiverem trocadas ou as fontes não puderem ser rastreadas, a subsequente geração de hipóteses, as discussões de backtesting e as listas de verificação de risco apenas amplificam os enviesamentos iniciais. Por conseguinte, a Lição 2 não dá prioridade a técnicas para «fazer perguntas melhores», mas sim discute a disciplina estrutural necessária na fase de entrada, para que os resultados do modelo sejam tratados como sujeitos a verificação por defeito, e não como factos estabelecidos.

Em contextos de negociação, as alucinações geralmente não significam que o modelo está a fabricar deliberadamente, mas sim que gera conteúdo fluente e confiante que não pode ser correspondido a fontes primárias verificáveis. As formas comuns incluem: inventar anúncios ou links, confundir capitalização de mercado com oferta circulante, aplicar dados desatualizados a questões atuais, usar frases como «os dados on-chain mostram» sem fornecer endereços, janelas temporais ou padrões estatísticos. A solução não é rejeitar a IA por completo, mas sim especificar o nível da fonte, o limite temporal e as etapas de validação para cada peça de informação que entra na cadeia de decisão.

2. Classificação de fontes: construção de um quadro de classificação prática

Antes de submeter materiais à IA, é aconselhável classificar as fontes de informação e exigir que o modelo rotule cada ponto-chave por grau no prompt. O objetivo da classificação não é o formalismo, mas sim clarificar que conteúdo pode ser afirmado como facto e que conteúdo pode apenas servir como pistas ou juízos não verificados.

  • Fontes primárias incluem websites oficiais de projetos, registos de lançamentos no GitHub, anúncios de bolsas e reguladores, exploradores de blockchain e dados de transações exportáveis. Estes materiais são relativamente fiáveis, mas ainda exigem vigilância contra páginas falsas e anúncios forjados — os links e domínios devem ser verificados manualmente.

  • Fontes secundárias incluem relatórios de institutos de investigação, documentos de auditoria e páginas de proof-of-reserve; ajudam a compreender mecanismos, mas exigem verificar se a data de publicação e o âmbito da auditoria cobrem a estrutura atual.

  • Media mainstream — as interpretações de políticas podem ser referenciadas, mas as conclusões-chave devem ser verificadas cruzadamente com documentos primários.

  • Redes sociais, KOLs e conteúdo comunitário são adequados apenas como pontos de entrada para a descoberta de problemas e não devem justificar uma negociação de forma independente. Capturas de ecrã anónimas e «informação interna» são, por defeito, excluídas da lógica de negociação.

Os prompts podem exigir: apenas fontes de alto grau podem ser usadas para afirmações factuais; fontes de grau médio ou baixo devem ser rotuladas como «reportado» ou «não verificado»; itens sem fonte ou data devem ser uniformemente marcados para verificação. Mesmo que o modelo ainda cometa erros, este formato de saída facilita a filtragem manual.

3. Marcas temporais e padrões: os dados cripto são propensos a «dados antigos em novos contextos»

O treino do modelo e a recuperação estão atrasados em relação aos desenvolvimentos em tempo real, e os mecanismos dos projetos frequentemente atualizam. Ao questionar, especificar intervalos de tempo — por exemplo, analisar apenas materiais após uma determinada data; sinalizar informações potencialmente desatualizadas como «à data de [data]». Ao comparar preços ou métricas, especificar o intervalo de candlestick, a bolsa, o par de negociação, o spot ou perpétuo, etc. Para estatísticas on-chain, indicar o nome da chain, o endereço do contrato, a janela estatística e se os inflows/outflows das bolsas estão incluídos. A mesma pergunta sob diferentes padrões pode produzir conclusões opostas; os padrões devem ser um campo fixo do prompt, não um pensamento posterior.

4. Narrativas de sobrevivência e evidências contraditórias

As discussões sobre cripto frequentemente mostram apenas casos lucrativos, usam apenas amostras de mercado em alta ou citam backtests de períodos de subida. As narrativas da IA tendem a tornar as histórias completas, ignorando amostras falhadas concorrentes. As contramedidas incluem: exigir evidências tanto a favor como contra; especificar o tamanho da amostra e o período de tempo; responder explicitamente «não é possível determinar» quando a evidência é insuficiente, em vez de forçar uma conclusão. O diálogo orientado para a investigação é mais adequado para apresentar cenários e condições de falha do que para produzir diretamente recomendações de compra/venda.

5. Estrutura do prompt: a restrição da forma, não o floreio retórico

Prompts eficazes geralmente incluem quatro partes:

  • Declaração de âmbito — papel de assistente de investigação, sem recomendações de tokens, sem retornos garantidos

  • Condições de restrição — sem links fabricados, marcar incertezas, regras de classificação de fontes

  • Formato de saída — argumento, base, grau da fonte, data, condições de invalidação

  • Etapas de validação — verificações manuais exigidas — e.g., abrir URLs de anúncios ou verificar hashes de transações on-chain

No final de cada conversa, gerar uma lista de verificação de validação a ser concluída manualmente antes de passar a hipóteses ou etapas de negociação. A extensão do prompt não é o essencial; o que importa é se a fonte, o período de tempo e os padrões estão fixados.

6. Divisão de trabalho dos dados: números fornecidos por humanos, o modelo trata da interpretação

Uma divisão de trabalho mais robusta é: os dados de mercado e on-chain devem ser exportados de APIs, bolsas ou exploradores e colados para a IA em tabelas brutas ou com campos claros; o modelo interpreta significados, identifica inconsistências e ajuda a estruturar hipóteses — mas não gera valores críticos de forma independente. Se o modelo participar em cálculos, exigir que exiba fórmulas e etapas intermédias, com as conclusões centrais recalculadas manualmente. Conversas longas correm o risco de desvio de contexto; tópicos importantes devem iniciar novos tópicos, factos verificados devem ser arquivados separadamente para referência apenas em interações subsequentes, para reduzir a contaminação do contexto.

7. Resumo da lição

Esta lição aborda o passo anterior ao uso da IA: de onde vêm os materiais, se incluem datas e padrões, e se fontes de baixo grau podem ser usadas como racional de negociação. Alucinações e narrativas de sobrevivência geralmente não são o modelo a «falar sem sentido», mas sim o resultado de afirmações não verificáveis, dados desatualizados ou histórias de sucesso selecionadas a dedo na entrada. Ao incorporar classificação de fontes, limites temporais e listas de verificação de validação num processo fixo, os resultados tornam-se por defeito rascunhos que exigem verificação antes de entrar em discussões de hipóteses ou posições. A próxima lição abordará a validação de estratégia: depois de limpar as entradas, é necessário escrutinar separadamente os dados, os custos e os resultados fora da amostra — as curvas de backtest por si só não validam uma estratégia.

Exclusão de responsabilidade
* O investimento em criptomoedas envolve riscos significativos. Prossiga com cuidado. O curso não pretende ser um conselho de investimento.
* O curso é criado pelo autor que se juntou ao Gate Learn. Qualquer opinião partilhada pelo autor não representa o Gate Learn.