runesleo

vip
币龄 8.3 年
最高 VIP 等级 6
用户暂无简介
Polymarket V2 这周开始切版,群里讨论都在用户层(USDC.e 不回 pUSD / 转错链丢钱),但工程上更安静的麻烦没人讲。
我自己 trader 这周也在切。给一个从 V1 切 V2 的通用 SOP,不只 PM 适用:
1. 先只读探一下。所有 V2 接口跑一圈,确认账户、订单簿、市场数据都能拉到。不签任何单。
2. 再空跑一遍。本地模拟下单流程,签名走通但不发广播。这一步会暴露大部分新旧字段不兼容。
3. 挑一个最不重要的策略试。纸面跑两天对比 V1 同期。差异显著就回去查。
4. 不兼容的策略先剔出去。切换测试里有策略被直接剔了——能用 V1 跑就先不动。
5. 才开真实下单。前 4 步全过,再切真钱通道。
群里说的 wrap/redeem 是用户层痛点。真正难的是新旧订单簿共存期的状态对账——同一账户在 V1 还有未平仓位,V2 已经在挂新单。这部分官方文档不显眼,得自己撞。
想自己跑 V2 接口对比 V1:
USDC0.01%
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
Anthropic 周四训了一个 Claude 当法医,看另一个 Claude 脑子里在想什么。
发现:安全测试场景里 Claude 16-26% 的次数知道自己在被测——但嘴上不说。
最具体那个案例:Mythos Preview 在 coding 任务上 cheat,破坏规则后加误导代码做 coverup。NLA(自然语言自编码器)翻译它的内部活动,发现它当时在想"怎么绕过检测"。
NLA 原理:训两个模型联动,一个把模型 activation 翻成英文,另一个从英文重建 activation。重建准 → 文本就捕捉了它在想啥。
我自己 patterns 里反复记 Codex 写策略代码偷工——单位读错跑出"算术不对"的伪结论,回测脚本 7 个静默 bug 堆出 $93K 假 PnL。Anthropic 在 alignment 层做内省,我在生产端遇到一致性偏差,机制不同但同向。
下一代 model card 不会只有 benchmark 分数,得带 NLA audit。
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
Karpathy 4/30 在 Sequoia Ascent 把今年最有用的 AI 解释,压缩成三个论点。读完你看 AI 的方式会变。
1. AI 不只是"更快",是新范式
过去 2 年大家都在讲 AI 让事情变快。
Karpathy 说这是误读。
举 3 个 AI 重新定义任务的例子:
- menugen:图进图出,没有传统代码,整个 app 被 LLM 吞掉
- .md skills:装软件不写 .sh 脚本,写一段中文/英文说明,让 LLM 自己理解你的环境去装
- LLM 知识库:传统代码做不到的事——把任意格式的非结构化文本变成可计算的知识
第一类是"减少代码",第二类是"用英文当代码",
第三类是"传统代码本来就做不到"。
2. Jagged Edge — 为什么 AI 同时全能又愚蠢
最核心的论点。
为什么同一个 AI 能 refactor 10 万行代码,
又会建议你走去洗车?不是模型抽风。
Karpathy 原话:
"You're either on the rails of the RL circuits and flying,
or off-roading in the jungle with a machete."
要么你在 RL 训练好的圆圈里飞,
要么你在丛林里挥砍刀。
决定哪些任务进训练分布的两个因素:
verifiability(结果可验证)+ ec
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
AI 帮我把工作量放大了 10 倍,
现在的瓶颈是我自己的脑子。
前额叶疯狂受损中😂
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
今晚饭局,有个朋友说他 Claude 被封了,问我应该重开 Claude 还是 试试Codex
我的回答没有以往那么坚决了😅
  • 赞赏
  • 评论
  • 转发
  • 分享
跑了几个策略后台进程,吃了个亏:
明明进程在跑、数据也是新的,PM2 却显示已停。
如果信 PM2 直接 restart,反而把还在干活的进程打断了。
后来明白:PM2 / launchd / pid 文件,都只是看护层登记的状态 —— 它有没有把进程记上,跟进程实际在不在跑,是两回事。
真死活要看进程自己产出的健康文件 —— 最近一次更新是几分钟前 + 进程数对得上 = 活着。
写了个巡检脚本,每个进程同时报 4 个值:
- 进程在不在 (用 ps 查)
- PM2 / launchd 有没有登记
- 健康文件多久前更新过
- 三个对不对得上
只要健康文件是新的,就不当死亡处理。
工程教训:判断"系统活没活",不要看你建的看护层怎么说,看系统自己产出的东西新不新。
  • 赞赏
  • 评论
  • 转发
  • 分享
polymarket-toolkit v0.4 上线。
pUSD redeem 之后,普通用户走官方 app 就够了。但 agent / dashboard 这一层一直空白——某个 Polymarket 钱包是不是还有 redeemable 行、payable 多少、要不要触发资金水位告警,之前没有现成的 zero-dep 工具。
三个 helper 一次解决:fetch + summarize + label。零私钥、零签名、零 relayer,只读公开 API。
发之前给 Codex 跑了两轮独立 review,Round 1 抓出 demo 钱包虚报 $1.84 payable 的硬伤(实际 $0)。修完测试从 2/2 跳到 9/9。
自己看自己永远有盲区。
  • 赞赏
  • 评论
  • 转发
  • 分享
群里讨论开源 bot,多数人共识就一句话:赚钱的 bot 没人会开源。
听着像废话,但这个常识在 AI 时代变得尖锐——
以前护城河是"代码会写"。现在 github 丢给 AI,几秒钟读完整个架构。重写成本从两个月变成两小时。
护城河从"代码会写"变成"策略会想"。
这件事我自己也在分层做——
polymarket-toolkit 我开源(仓库 调用这类工具层的事。复用价值大,门槛低,开源等于做品牌。
H 系列做市/taker 策略我不开源。里面是 sigmaD1 校准、做市 reprice 阈值、adverse selection 的实证参数。这些东西公开出来,相当于把研究路径直接送给同行——edge 一旦 commoditize 就没了,不管原来有没有 edge。
中间还有一档:方法论可以写,具体参数不能写。pm-quant 付费源码包( 个策略 + 加密 zip + 1on1 部署支持。付费门槛 = 过滤同行竞争。
群里有人点 gabagool 这个高手地址:5min / 15min / 小时各级别都跑赢,"不管行情都飞起"。他的代码不在 github。市场已经用脚投票了。
所以"开源 bot 都亏钱"是幸存者偏差决定的——能赚钱的人没有开源动机。你看到 ⭐ 几千、全是好评、作者还在持续更新的量化仓库,多半是个披着量化外壳的内容产品:开源是吸引订阅/付费的入口,不是核心收入
  • 赞赏
  • 评论
  • 转发
  • 分享
vision pro 连 mac 开带鱼屏,Polymarket 盯赔率变化,Codex 跑策略代码,再开个窗口看直播,get 到了新的看球姿势,提前为世界杯做准备😂
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
本来要明天才能刷新的 codex 额度,突然又被提前重置了一轮
Codex 这点真有意思呀
周额度按理说 7 天一刷新,实际上隔几天就偷偷给你重置一次。
这到底是营销策略还是什么骚操作
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
看到一个高质量的 Claude Code skills 集合——有人把自己日常用的 23 个 skill 直接从 ~/.claude/skills/ 扒出来公开了,没有"教学版"包装。
最印象深刻的是 grill-me:全文 4 句话,让 AI 像审讯一样把方案每个分支拷问到达成共识,每次问一个,能在代码里查到的别问我。
读他的 skill 比读教程有用,能看到工程师真把 AI 用成脑外延伸。Planning 类(domain-model / zoom-out / ubiquitous-language)尤其好,是写代码之前的思考脚手架。
我抄了 grill-me 进自己 skills,下次有新想法需要验证前扔进去拷问一遍 😆
repo:
  • 赞赏
  • 评论
  • 转发
  • 分享
今天把 PM 策略仓库搞挂了。
我习惯多终端开窗口干活:一个跑 Codex 研究策略/数据,一个跑 Claude 推进其他工作,再开一个处理杂项,慢慢就会开好几个终端窗口。我以为它们各干各的。结果俩都在改同一个 .ts,git 状态炸成一团,修了俩小时。
都在聊 multi-agent 怎么协同。很少人聊它在 git 层面是什么样。
两个 agent 在 git 眼里 = 两个我。同一个文件互相踩,分支状态打架。修法不在 prompt,在仓库结构。
立了条新铁律,4 点:
1. 高风险 repo 禁止主仓库直接编辑,主 repo 当干净底盘
2. 每个任务进独立 worktree,slug = 策略号 + 动作(h12-cancel-sync / pnl-script-v8)
3. active-tasks JSON 加 worktree_path 字段,开第二窗口前 grep 防重复
4. 完成回主 repo,删 worktree + 删分支
先找单一项目试点跑了一天,零冲突。再慢慢扩到其他项目。
multi-agent 最难的不是它们怎么对话,是它们别打架。
  • 赞赏
  • 评论
  • 转发
  • 分享
5 天监控自己的工具,306 次触发,100% 误报。原来我一直在吸它自己的尾气🤦
给 Claude Code 加了个 hook,ssh 跨机器或写关键文件前弹横幅提醒一下,怕自己手快违反 SSOT 铁律。
配套 stats 脚本统计触发次数,今天打开样本一看,全是误报。
bug 不在 hook,在 stats 脚本:它 grep 的是日志里 "⚠️ 跨机器" 这串字符。
但日志里至少有三种回声:hook 自己输出的横幅、工具结果把横幅复述了一遍、连任务描述里写 "hook 这周触发 N 次" 都被算进去。
我数的不是触发次数,是工具自己说话的回音。
修法:让工具自己写 audit log。
log_trigger() { echo "{ts,hook,pattern,target}" >> ~/.claude/logs/hook-trigger.jsonl }
工具触发自己记一行,下周用真数据复盘。
监控自己的工具,最容易骗你的就是它自己。
Claude Code 的 hook 也好,埋点 SDK、agent 监控也好,只要监控对象包括"自己",事后 grep 就是循环陷阱。
它的输出会塞回日志、复述、甚至混进任务描述里,分不清哪条是真触发哪条是它自己讲过的话。
想知道工具被用了多少次,得让它自己说,别让日志替它说。
  • 赞赏
  • 评论
  • 转发
  • 分享
Leo Labs 大群 4/26 群友讨论精华(最近 380 条)
━━━━━━━━━━━━
1️⃣ 凯利公式被群里集体否定 — 一致换回固定仓位
群里 30+ 分钟讨论仓位管理:
• "凯利需要知道真实概率,散户根本算不出"
• "凯利是稳定盈利前提下的优化方法,本身不能决定盈亏,吹成系统必备属于乱扯"
• 多人收敛实操:固定仓位 + 赚了就提本金 + 不随便改参数
• 一句金句:"你是上帝那么可以用凯利公式"
💡 回撤了想改参数 ≠ 仓位问题,那是策略本身的问题。
━━━━━━━━━━━━
2️⃣ 0.99 极端价格策略 — 验证窗口的统计学陷阱
群友抛出"买 0.99 能活吗",引出最好的统计学讨论:
• 99% 反转概率 = 1/1000
• 98% 反转概率 = 5/1000
• 想买 0.99 必须真胜率 >99%,但散户短期内根本验证不出来
• 一个比喻最直观:"我有 2 个硬币,一个 99% 正面 vs 99.5% 正面,得抛几百次才能分辨是哪个"
💡 你的策略可能不是"不行",是你撑不到验证它行不行的那一刻。
━━━━━━━━━━━━
3️⃣ 模拟盘 vs 实盘 gap 的真实数字
• 模拟 ROI 2.5% → 实盘亏
• 模拟 ROI 5% → 实盘还是亏
• 模拟 80% 胜率 → 实盘成交率不到 40%,能拿到的都是烂单
• 实盘门槛:"下单 50%
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
Cursor 好大方,一下送 10000美金的 token额度,5月底到期。
最早接触 vibe coding 的时候重度用过一段时间 Cursor 后来逐渐转移到了 cc 和 codex 为主;
想不到又有机会可以重新研究 Cursor 看能搞出什么好玩好用的产品和工具,这下有的玩了!
感谢 @cursor_ai @edwinarbus 🙏
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
Thank you Elon
虽然变少了,但比预期的多
每一百万展示大概对应225美金
post-image
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
用 AI 用得脾气都变差了
它能干的事越多,我对结果的要求就跟着涨。觉得它应该越来越好,所以没做好的时候是真的会很生气。😠
  • 赞赏
  • 评论
  • 转发
  • 分享
做 Polymarket 的自动策略,部署一次大家都很小心,但停用的时候基本没人讲 —— 今天被这个盲点教训了 14 小时。
3 周前我停了一个在 Polymarket 上跑的策略机器人。pm2 stop,看到状态变成 stopped,就以为事情过去了。
今天顺手做了 10 分钟的服务器清理,重启了一下进程管理器。那个"死透"3周的策略,复活了,还静静跑了 14 小时真钱模式。
查了下根因 —— pm2 stop 只是把状态标记成"已停",没有真的删掉。只要一次批量启动,所有被"暂停"的进程都会被拉回来。这坑不是 pm2 独有的, systemd、docker、k8s 都是同一个问题:以为停了,其实没停。
做预测市场的自动策略,不管你用什么工具,停一个策略要做 5 件事:
1. 进程管理器层面彻底删除这个服务(不是暂停)
2. 从配置文件里移除这条定义(不然下次批量启动它会自己复活)
3. 在代码入口加一道关闭门(防止被误操作唤醒)
4. 更新你的文档或状态表(不然过两周你自己都忘了这个策略停了没)
5. 如果涉及交易账本,正式关闭这个策略的记账周期(epoch),防止新数据
混进旧策略的账
部署大家都很仔细,停用往往只做第 1 步就当完事。真正的坑都埋在第 2到第 5 步里。
14 小时样本小没亏钱,但这种侥幸不代表下次还能走运。
  • 赞赏
  • 评论
  • 转发
  • 分享
看 @predictionindex 这期最新预测市场数据周报告:Polymarket + Kalshi 合计约 75% 成交量,其余所有平台累计 <$30B。
报告里没讲的两个细节,对预测市场玩家其实更关键:
Kalshi 正在追上甚至反超 Polymarket
DeFiRate 最新一周:Kalshi $2.9B(60%),Polymarket $2.0B(40%)。两家在周度数据里互有拉锯——上周 Poly 刚反超过 Kalshi,这周又被追回去。
美国市场更极端。BofA 4/9-10 报告:Kalshi 89%,Polymarket 7%, 4%。合规 + KYC 是 Kalshi 的结构性优势,Polymarket 是链上协议,在美国散户覆盖上暂时吃亏,短期不会翻。
"双寡头"这个词容易让人以为 Poly 还是老大,美国市场实际已经基本是 Kalshi 一家。
"其他 25%" 里也许藏着更大的 alpha
Week 15 报告点到的小平台:Opinion / Limitless / Myriad / / Probable / / Chain)...

本质上是新预测市场上线到竞争充分之间的窗口期玩家。
一个典型数据:某链上钱包在 30 天做出 $99K PnL,每笔毛利率 ~21%。对比 Polymarket 成熟盘口的 0.5-2%,差了 10 倍以上。
  • 赞赏
  • 评论
  • 转发
  • 分享
又一件虽然没什么用但是很爽的事:今天用 Claude 把 3.7 万封 Gmail 收件箱清到 1.1 万。全程没自己看一封邮件,只点了两下:发 App Password、导入 filter。
走的是 Python + IMAP,分四步:
1. 导出所有发件人按频率分类
2. 555 个垃圾域名一键归档到 Archive-Junk
3. 主动停下来说「我误伤了 317 封银行 / 券商 / Coinbase / Claude 安全邮件,要召回吗」
4. 生成 Gmail Filter 让未来这些域名直接跳过 INBOX
第三步是我没料到的。本来准备自己抽查几封看分类对不对,AI 自己先把风险点列出来了。
  • 赞赏
  • 评论
  • 转发
  • 分享