Bài học 3

Xác thực chiến lược: Backtesting, thống kê và sự phân công lao động AI

Chương này trình bày các chức năng phụ trợ mà AI có thể thực hiện, cùng với các bước kiểm toán thủ công bắt buộc phải duy trì khi chiến lược chuyển từ ý tưởng thành các con số. Nội dung tập trung vào việc làm sạch dữ liệu, thiên vị nhìn về phía trước, giả định chi phí và kiểm tra ngoài mẫu.

1. Điểm khởi đầu: Mục tiêu của việc xác thực không phải là "Chứng minh khả năng sinh lời"

Hai bài trước đã bàn về phân công lao động trong quy trình làm việc và cấu trúc đầu vào. Bài thứ ba chuyển sang câu hỏi: liệu một ý tưởng có thể hiện tính nhất quán lịch sử hay không. Phần lớn thất bại không đến từ hướng đi sai lầm căn bản, mà đến từ việc xem backtest như kết luận cuối cùng khi chưa kiểm toán đúng cách: dữ liệu bao gồm các tài sản đã bị hủy niêm yết, tín hiệu dùng thông tin tương lai, chi phí bị bỏ qua, tham số được tinh chỉnh liên tục trên các mẫu ngắn. AI có thể tăng tốc viết mã và diễn giải chỉ báo, nhưng không thể đưa ra phán quyết cuối cùng về tính hợp lệ của một chiến lược. Mục tiêu hợp lý hơn của xác thực là: với các giả định rõ ràng, chiến lược chưa bị bác bỏ về mặt thống kê hoặc chi phí, chứ không phải chứng minh được lợi nhuận bất biến qua một câu chuyện suôn sẻ.

2. Phân công lao động hợp lý cho AI trong backtest

AI phù hợp để hỗ trợ các việc sau:

  • Viết mã khung backtest

  • Giải thích ý nghĩa Sharpe ratio, mức giảm tối đa, tỷ lệ thắng

  • Liệt kê các điểm sai lệch nhìn về phía trước tiềm ẩn

  • Sắp xếp bảng kết quả thành tóm tắt văn bản

Các nhiệm vụ bắt buộc con người thực hiện hoặc xem xét độc lập:

  • Vũ trụ tài sản có chứa các token vẫn còn giao dịch không?

  • Giá có tồn tại trước thời điểm niêm yết không?

  • Phí, trượt giá và lãi suất tài trợ đã được tính chưa?

  • Các bài kiểm tra ngoài mẫu hoặc walk-forward đã được thực hiện chưa?

  • Chênh lệch giữa giấy và thực tế có được xem xét không?

Chạy mã chỉ chứng tỏ các bước kỹ thuật đã hoàn tất; không có nghĩa chiến lược đã vượt qua xác thực.

3. Làm sạch dữ liệu: Bước dễ vỡ nhất trong backtest tiền điện tử

Nếu một backtest chỉ dùng các token còn hoạt động đến hiện tại, kết quả thường bị thiên lệch lạc quan một cách hệ thống. Các giai đoạn trước khi token niêm yết không được giả định là có thể giao dịch. Giá, khối lượng và lãi suất tài trợ khác nhau giữa các sàn; backtest nên cố định sàn hoặc chỉ rõ quy tắc tổng hợp. Fork, di chuyển hợp đồng và đổi tên token gây đứt gãy chuỗi giá, đòi hỏi ánh xạ thủ công hoặc loại trừ. Dùng một stablecoin duy nhất để định giá trong giai đoạn de-pegging có thể bóp méo các chỉ số lợi nhuận và rủi ro; các cửa sổ de-peg lớn nên được đánh dấu hoặc giải thích riêng. AI cần liệt kê nguồn dữ liệu, phạm vi thời gian và định nghĩa vũ trụ trong tài liệu, đồng thời kiểm tra từng mục với dữ liệu thô, quan trọng hơn nhiều so với chỉ chạy đường cong backtest.

4. Sai lệch nhìn về phía trước: Căn chỉnh thời gian giữa tín hiệu và thực thi

Các sai lệch phổ biến:

  • Dùng thống kê toàn mẫu để chuẩn hóa rồi backtest trên toàn bộ mẫu

  • Tạo tín hiệu lúc đóng cửa nhưng thực thi lúc mở cửa

  • Gắn nhãn địa chỉ là "smart money" chỉ sau khi sự việc đã xảy ra

  • Dùng dữ liệu vĩ mô đã sửa đổi như thể là giá trị công bố lịch sử

Quy tắc cần chỉ rõ: tín hiệu tạo tại t phải thực thi tại t+1 hoặc muộn hơn, tùy loại chiến lược; nếu không thể lấy dữ liệu vĩ mô như công bố gốc, các kết luận liên quan cần được hạ cấp. AI có thể chú thích thời điểm dữ liệu sẵn sàng cho từng đặc trưng trong code comment; con người nên kiểm tra ngẫu nhiên các đặc trưng chính để đảm bảo chúng có trước thực thi ít nhất một ngày.

5. Chi phí và ma sát: Backtest không có phí là không hợp lệ theo mặc định

Chiến lược tiền điện tử tối thiểu phải bao gồm: phí giao dịch, trượt giá, lãi suất tài trợ vĩnh viễn (nếu vị thế vượt qua điểm thanh toán), lãi suất vay (nếu dùng đòn bẩy) và chi phí rút/cross-chain nếu cần. Các kịch bản phí cơ sở và bi quan (ví dụ: nhân đôi phí) có thể dùng để kiểm tra căng thẳng. Nếu lợi nhuận kỳ vọng suy giảm mạnh hoặc chuyển sang âm trong kịch bản bi quan, chiến lược rất nhạy cảm với chi phí và không nên đánh giá chỉ bằng đường cong trong mẫu. AI thường mặc định phí bằng 0 hoặc một điểm cơ sở duy nhất; con người phải đưa bảng phí vào giả định và báo cáo backtest.

6. Quá khớp và ngoài mẫu: Càng nhiều tham số càng cần thận trọng về tường thuật

Dấu hiệu nhận biết:

  • Chỉ trình bày tổ hợp tốt nhất sau nhiều bộ chỉ báo

  • Tinh chỉnh tham số chỉ trên các mẫu thị trường tăng ngắn

  • Quy tắc rất cụ thể nhưng không có giải thích cơ chế

Biện pháp khắc phục:

  • Dành sẵn các khoảng ngoài mẫu không dùng để tinh chỉnh tham số

  • Áp dụng walk-forward testing với cửa sổ trượt

  • Đơn giản hóa quy tắc tối đa trong khuôn khổ tiền đề có thể giải thích

Báo cáo cần trình bày cả chỉ số trong mẫu và ngoài mẫu; nếu hiệu suất ngoài mẫu yếu hơn đáng kể so với trong mẫu, phải cảnh báo rủi ro quá khớp và tạm dừng triển khai thực tế. AI không được lặp đi lặp lại tối ưu hóa tham số mà không có giám sát cho đến khi đường cong trông đẹp, đó là quá khớp tự động.

7. Từ backtest đến giao dịch thực: Tiến triển dần dần thay vì ra mắt một bước

Khuyến nghị thang ba cấp. Cấp một: backtest vượt qua với vũ trụ, phí và kết quả ngoài mẫu được ghi chép đầy đủ. Cấp hai: giao dịch giấy hoặc mô phỏng ghi nhận chênh lệch giá tín hiệu/thực thi và trượt giá thực tế. Cấp ba: giao dịch thực quy mô nhỏ có giới hạn và stop-loss, liên tục so sánh kết quả giấy và thực. Mỗi cấp tiến đều do con người quyết định, không phải mô hình đề xuất vị thế lớn. AI có thể tạo danh sách kiểm tra cho từng cấp nhưng không thể thay thế quyết định tiến triển.

8. Trường tối thiểu trong báo cáo backtest

Dù không có hệ thống phức tạp, báo cáo vẫn cần:

  • Mô tả chiến lược trong một câu

  • Khoảng dữ liệu và phạm vi tài sản

  • Bảng giả định phí

  • Lợi nhuận trong mẫu và ngoài mẫu, mức giảm tối đa, số lượng giao dịch

  • Mức lỗ liên tiếp tối đa

  • Danh sách vấn đề chưa giải quyết

  • Kết luận: tiếp tục xác thực, tạm dừng hay hủy bỏ

Tránh các phát biểu như "lạc quan một cách thận trọng" vì chúng không hướng dẫn hành động. Backtest và đánh giá chia sẻ cùng một nguyên tắc: có thể thực thi, có thể kiểm toán, có thể lặp lại.

9. Tóm tắt bài học

Bài học này tập trung vào việc liệu các ý tưởng đã được kiểm tra hay chưa. AI phù hợp để viết mã backtest, giải thích chỉ báo, phát hiện sai lệch nhìn về phía trước và phí thiếu; nhưng không thể thay thế con người trong việc xác nhận thiên lệch sống sót trong dữ liệu, căn chỉnh tín hiệu/thực thi, hiệu suất ngoài mẫu hay lợi nhuận dưới chi phí bi quan. Chạy mã và đường cong trong mẫu đẹp chỉ có nghĩa các bước kỹ thuật hoàn tất, không có nghĩa việc triển khai thực là chính đáng. Lộ trình an toàn là ghi chép backtest, theo dõi trên giấy, rồi thử nghiệm và sai sót quy mô nhỏ, mỗi bước tiến do con người quyết định. Bài tiếp theo sẽ trình bày về các sự kiện vĩ mô và on-chain chính: những giai đoạn giàu thông tin nhất nhưng cũng dễ gây hiểu lầm nhất cho các bản tóm tắt khi đưa ra kết luận, đòi hỏi ranh giới rõ ràng về những gì AI có thể giúp chuẩn bị và những gì nó không thể thay thế trong việc xác minh.

Tuyên bố từ chối trách nhiệm
* Đầu tư tiền điện tử liên quan đến rủi ro đáng kể. Hãy tiến hành một cách thận trọng. Khóa học không nhằm mục đích tư vấn đầu tư.
* Khóa học được tạo bởi tác giả đã tham gia Gate Learn. Mọi ý kiến chia sẻ của tác giả không đại diện cho Gate Learn.