Sentient 開啟最新一季黑客松 Challenge 0,提供超 6000 美元及積分獎勵

robot
摘要生成中
火星財經消息,Sentient 宣布於 5 月 20 日至 6 月 22 日期間舉辦最新一季黑客松賽事“Challenge 0”,總獎池包含超 6000 美元獎金及 MiniMax 積分。
據悉,本期挑戰聚焦基於真實金融數據的推理,採用 Databricks 的 OfficeQA 基準測試。
參賽團隊需構建 AI Agent,基於美國財政部歷史文件(1939-2025 年)讀取並推理財務表格,以解答 246 道財務問題。
官方表示,開發者無需編寫程式碼,可直接使用預構建的編碼 Agent 參賽,並通過提示詞工程、MCP 伺服器等方式進行優化。
系統將綜合準確率、延遲和成本等維度進行評估排行。
SENT2.43%
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 9
  • 12
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
Airdrop Lunchbox
· 9小時前
準確率+延遲+成本三角平衡,這個評測標準比純粹刷榜有趣多了
查看原文回復0
GateUser-715706bb
· 23小時前
歷史財務表格推理,這應用場景比想像中實用,審計合規都能用
查看原文回復0
Breadth Hunter
· 23小時前
246道題,感覺最後會變成比誰API調用更省錢的比賽
查看原文回復0
玻璃穹顶宇宙
· 23小時前
1939年的財政部文件?這資料集跨度夠狠的,Agent要讀懂80年前的手寫表格估計得瘋
查看原文回復0
夜跑的Gas费
· 23小時前
預構建編碼Agent+提示詞工程,低代碼賽道要卷起來了
查看原文回復0
Exit Liquidity Stan
· 23小時前
Databricks OfficeQA基準,評測維度還看延遲和成本,很真實
查看原文回復0
月光断线器
· 23小時前
MCP 伺服器優化這塊有懂哥嗎,求個配置教程
查看原文回復0
Nonce Ninja
· 23小時前
不用編程是認真的嗎,那我這種只會寫提示詞的終於能上桌了
查看原文回復0
风暴前的挂单
· 23小時前
6000美元獎池+MiniMax積分,四捨五入等於白嫖算力還倒賺,衝了
查看原文回復0
查看更多