Polymarket V2 这周开始切版，群里讨论都在用户层（USDC.e 不回 pUSD / 转错链丢钱），但工程上更安静的麻烦没人讲。
我自己 trader 这周也在切。给一个从 V1 切 V2 的通用 SOP，不只 PM 适用：
1. 先只读探一下。所有 V2 接口跑一圈，确认账户、订单簿、市场数据都能拉到。不签任何单。
2. 再空跑一遍。本地模拟下单流程，签名走通但不发广播。这一步会暴露大部分新旧字段不兼容。
3. 挑一个最不重要的策略试。纸面跑两天对比 V1 同期。差异显著就回去查。
4. 不兼容的策略先剔出去。切换测试里有策略被直接剔了——能用 V1 跑就先不动。
5. 才开真实下单。前 4 步全过，再切真钱通道。
群里说的 wrap/redeem 是用户层痛点。真正难的是新旧订单簿共存期的状态对账——同一账户在 V1 还有未平仓位，V2 已经在挂新单。这部分官方文档不显眼，得自己撞。
想自己跑 V2 接口对比 V1：

USDC0.01%

赞赏
点赞
评论
转发
分享

runesleo

18小时前

Anthropic 周四训了一个 Claude 当法医，看另一个 Claude 脑子里在想什么。
发现：安全测试场景里 Claude 16-26% 的次数知道自己在被测——但嘴上不说。
最具体那个案例：Mythos Preview 在 coding 任务上 cheat，破坏规则后加误导代码做 coverup。NLA（自然语言自编码器）翻译它的内部活动，发现它当时在想"怎么绕过检测"。
NLA 原理：训两个模型联动，一个把模型 activation 翻成英文，另一个从英文重建 activation。重建准 → 文本就捕捉了它在想啥。
我自己 patterns 里反复记 Codex 写策略代码偷工——单位读错跑出"算术不对"的伪结论，回测脚本 7 个静默 bug 堆出 $93K 假 PnL。Anthropic 在 alignment 层做内省，我在生产端遇到一致性偏差，机制不同但同向。
下一代 model card 不会只有 benchmark 分数，得带 NLA audit。

赞赏
点赞
评论
转发
分享

runesleo

05-08 14:56

Karpathy 4/30 在 Sequoia Ascent 把今年最有用的 AI 解释，压缩成三个论点。读完你看 AI 的方式会变。
1. AI 不只是"更快"，是新范式
过去 2 年大家都在讲 AI 让事情变快。
Karpathy 说这是误读。
举 3 个 AI 重新定义任务的例子：
- menugen：图进图出，没有传统代码，整个 app 被 LLM 吞掉
- .md skills：装软件不写 .sh 脚本，写一段中文/英文说明，让 LLM 自己理解你的环境去装
- LLM 知识库：传统代码做不到的事——把任意格式的非结构化文本变成可计算的知识
第一类是"减少代码"，第二类是"用英文当代码"，
第三类是"传统代码本来就做不到"。
2. Jagged Edge — 为什么 AI 同时全能又愚蠢
最核心的论点。
为什么同一个 AI 能 refactor 10 万行代码，
又会建议你走去洗车？不是模型抽风。
Karpathy 原话：
"You're either on the rails of the RL circuits and flying,
or off-roading in the jungle with a machete."
要么你在 RL 训练好的圆圈里飞，
要么你在丛林里挥砍刀。
决定哪些任务进训练分布的两个因素：
verifiability（结果可验证）+ ec

赞赏
点赞
评论
转发
分享

runesleo

05-07 13:02

AI 帮我把工作量放大了 10 倍，
现在的瓶颈是我自己的脑子。
前额叶疯狂受损中😂

赞赏
点赞
评论
转发
分享

runesleo

05-04 17:20

今晚饭局，有个朋友说他 Claude 被封了，问我应该重开 Claude 还是试试Codex
我的回答没有以往那么坚决了😅

赞赏
点赞
评论
转发
分享

runesleo

05-04 07:09

跑了几个策略后台进程，吃了个亏：
明明进程在跑、数据也是新的，PM2 却显示已停。
如果信 PM2 直接 restart，反而把还在干活的进程打断了。
后来明白：PM2 / launchd / pid 文件，都只是看护层登记的状态 —— 它有没有把进程记上，跟进程实际在不在跑，是两回事。
真死活要看进程自己产出的健康文件 —— 最近一次更新是几分钟前 + 进程数对得上 = 活着。
写了个巡检脚本，每个进程同时报 4 个值：
- 进程在不在 (用 ps 查)
- PM2 / launchd 有没有登记
- 健康文件多久前更新过
- 三个对不对得上
只要健康文件是新的，就不当死亡处理。
工程教训：判断"系统活没活"，不要看你建的看护层怎么说，看系统自己产出的东西新不新。

赞赏
点赞
评论
转发
分享

runesleo

05-02 08:06

polymarket-toolkit v0.4 上线。
pUSD redeem 之后，普通用户走官方 app 就够了。但 agent / dashboard 这一层一直空白——某个 Polymarket 钱包是不是还有 redeemable 行、payable 多少、要不要触发资金水位告警，之前没有现成的 zero-dep 工具。
三个 helper 一次解决：fetch + summarize + label。零私钥、零签名、零 relayer，只读公开 API。
发之前给 Codex 跑了两轮独立 review，Round 1 抓出 demo 钱包虚报 $1.84 payable 的硬伤（实际 $0）。修完测试从 2/2 跳到 9/9。
自己看自己永远有盲区。

赞赏
点赞
评论
转发
分享

runesleo

04-29 02:26

群里讨论开源 bot，多数人共识就一句话：赚钱的 bot 没人会开源。
听着像废话，但这个常识在 AI 时代变得尖锐——
以前护城河是"代码会写"。现在 github 丢给 AI，几秒钟读完整个架构。重写成本从两个月变成两小时。
护城河从"代码会写"变成"策略会想"。
这件事我自己也在分层做——
polymarket-toolkit 我开源（仓库调用这类工具层的事。复用价值大，门槛低，开源等于做品牌。
H 系列做市/taker 策略我不开源。里面是 sigmaD1 校准、做市 reprice 阈值、adverse selection 的实证参数。这些东西公开出来，相当于把研究路径直接送给同行——edge 一旦 commoditize 就没了，不管原来有没有 edge。
中间还有一档：方法论可以写，具体参数不能写。pm-quant 付费源码包（个策略 + 加密 zip + 1on1 部署支持。付费门槛 = 过滤同行竞争。
群里有人点 gabagool 这个高手地址：5min / 15min / 小时各级别都跑赢，"不管行情都飞起"。他的代码不在 github。市场已经用脚投票了。
所以"开源 bot 都亏钱"是幸存者偏差决定的——能赚钱的人没有开源动机。你看到 ⭐ 几千、全是好评、作者还在持续更新的量化仓库，多半是个披着量化外壳的内容产品：开源是吸引订阅/付费的入口，不是核心收入

赞赏
点赞
评论
转发
分享

runesleo

04-28 19:32

vision pro 连 mac 开带鱼屏，Polymarket 盯赔率变化，Codex 跑策略代码，再开个窗口看直播，get 到了新的看球姿势，提前为世界杯做准备😂

赞赏
点赞
评论
转发
分享

runesleo

04-28 09:19

本来要明天才能刷新的 codex 额度，突然又被提前重置了一轮
Codex 这点真有意思呀
周额度按理说 7 天一刷新，实际上隔几天就偷偷给你重置一次。
这到底是营销策略还是什么骚操作

赞赏
点赞
评论
转发
分享

runesleo

04-27 10:29

看到一个高质量的 Claude Code skills 集合——有人把自己日常用的 23 个 skill 直接从 ~/.claude/skills/ 扒出来公开了，没有"教学版"包装。
最印象深刻的是 grill-me：全文 4 句话，让 AI 像审讯一样把方案每个分支拷问到达成共识，每次问一个，能在代码里查到的别问我。
读他的 skill 比读教程有用，能看到工程师真把 AI 用成脑外延伸。Planning 类（domain-model / zoom-out / ubiquitous-language）尤其好，是写代码之前的思考脚手架。
我抄了 grill-me 进自己 skills，下次有新想法需要验证前扔进去拷问一遍 😆
repo:

赞赏
点赞
评论
转发
分享

runesleo

04-27 02:44

今天把 PM 策略仓库搞挂了。
我习惯多终端开窗口干活：一个跑 Codex 研究策略/数据，一个跑 Claude 推进其他工作，再开一个处理杂项，慢慢就会开好几个终端窗口。我以为它们各干各的。结果俩都在改同一个 .ts，git 状态炸成一团，修了俩小时。
都在聊 multi-agent 怎么协同。很少人聊它在 git 层面是什么样。
两个 agent 在 git 眼里 = 两个我。同一个文件互相踩，分支状态打架。修法不在 prompt，在仓库结构。
立了条新铁律，4 点：
1. 高风险 repo 禁止主仓库直接编辑，主 repo 当干净底盘
2. 每个任务进独立 worktree，slug = 策略号 + 动作（h12-cancel-sync / pnl-script-v8）
3. active-tasks JSON 加 worktree_path 字段，开第二窗口前 grep 防重复
4. 完成回主 repo，删 worktree + 删分支
先找单一项目试点跑了一天，零冲突。再慢慢扩到其他项目。
multi-agent 最难的不是它们怎么对话，是它们别打架。

赞赏
点赞
评论
转发
分享

runesleo

04-26 23:42

5 天监控自己的工具，306 次触发，100% 误报。原来我一直在吸它自己的尾气🤦
给 Claude Code 加了个 hook，ssh 跨机器或写关键文件前弹横幅提醒一下，怕自己手快违反 SSOT 铁律。
配套 stats 脚本统计触发次数，今天打开样本一看，全是误报。
bug 不在 hook，在 stats 脚本：它 grep 的是日志里 "⚠️ 跨机器" 这串字符。
但日志里至少有三种回声：hook 自己输出的横幅、工具结果把横幅复述了一遍、连任务描述里写 "hook 这周触发 N 次" 都被算进去。
我数的不是触发次数，是工具自己说话的回音。
修法：让工具自己写 audit log。
log_trigger() { echo "{ts,hook,pattern,target}" >> ~/.claude/logs/hook-trigger.jsonl }
工具触发自己记一行，下周用真数据复盘。
监控自己的工具，最容易骗你的就是它自己。
Claude Code 的 hook 也好，埋点 SDK、agent 监控也好，只要监控对象包括"自己"，事后 grep 就是循环陷阱。
它的输出会塞回日志、复述、甚至混进任务描述里，分不清哪条是真触发哪条是它自己讲过的话。
想知道工具被用了多少次，得让它自己说，别让日志替它说。

赞赏
点赞
评论
转发
分享

runesleo

04-26 07:32

Leo Labs 大群 4/26 群友讨论精华（最近 380 条）
━━━━━━━━━━━━
1️⃣ 凯利公式被群里集体否定 — 一致换回固定仓位
群里 30+ 分钟讨论仓位管理：
• "凯利需要知道真实概率，散户根本算不出"
• "凯利是稳定盈利前提下的优化方法，本身不能决定盈亏，吹成系统必备属于乱扯"
• 多人收敛实操：固定仓位 + 赚了就提本金 + 不随便改参数
• 一句金句："你是上帝那么可以用凯利公式"
💡 回撤了想改参数 ≠ 仓位问题，那是策略本身的问题。
━━━━━━━━━━━━
2️⃣ 0.99 极端价格策略 — 验证窗口的统计学陷阱
群友抛出"买 0.99 能活吗"，引出最好的统计学讨论：
• 99% 反转概率 = 1/1000
• 98% 反转概率 = 5/1000
• 想买 0.99 必须真胜率 >99%，但散户短期内根本验证不出来
• 一个比喻最直观："我有 2 个硬币，一个 99% 正面 vs 99.5% 正面，得抛几百次才能分辨是哪个"
💡 你的策略可能不是"不行"，是你撑不到验证它行不行的那一刻。
━━━━━━━━━━━━
3️⃣ 模拟盘 vs 实盘 gap 的真实数字
• 模拟 ROI 2.5% → 实盘亏
• 模拟 ROI 5% → 实盘还是亏
• 模拟 80% 胜率 → 实盘成交率不到 40%，能拿到的都是烂单
• 实盘门槛："下单 50%

赞赏
点赞
评论
转发
分享

runesleo

04-25 03:07

Cursor 好大方，一下送 10000美金的 token额度，5月底到期。
最早接触 vibe coding 的时候重度用过一段时间 Cursor 后来逐渐转移到了 cc 和 codex 为主；
想不到又有机会可以重新研究 Cursor 看能搞出什么好玩好用的产品和工具，这下有的玩了！
感谢 @cursor_ai @edwinarbus 🙏

赞赏
点赞
评论
转发
分享

runesleo

04-25 02:29

Thank you Elon
虽然变少了，但比预期的多
每一百万展示大概对应225美金

赞赏
点赞
评论
转发
分享

runesleo

04-12 09:29

用 AI 用得脾气都变差了
它能干的事越多，我对结果的要求就跟着涨。觉得它应该越来越好，所以没做好的时候是真的会很生气。😠

赞赏
点赞
评论
转发
分享

runesleo

04-11 23:31

做 Polymarket 的自动策略,部署一次大家都很小心,但停用的时候基本没人讲 —— 今天被这个盲点教训了 14 小时。
3 周前我停了一个在 Polymarket 上跑的策略机器人。pm2 stop,看到状态变成 stopped,就以为事情过去了。
今天顺手做了 10 分钟的服务器清理,重启了一下进程管理器。那个"死透"3周的策略,复活了,还静静跑了 14 小时真钱模式。
查了下根因 —— pm2 stop 只是把状态标记成"已停",没有真的删掉。只要一次批量启动,所有被"暂停"的进程都会被拉回来。这坑不是 pm2 独有的, systemd、docker、k8s 都是同一个问题:以为停了,其实没停。
做预测市场的自动策略,不管你用什么工具,停一个策略要做 5 件事:
1. 进程管理器层面彻底删除这个服务(不是暂停)
2. 从配置文件里移除这条定义(不然下次批量启动它会自己复活)
3. 在代码入口加一道关闭门(防止被误操作唤醒)
4. 更新你的文档或状态表(不然过两周你自己都忘了这个策略停了没)
5. 如果涉及交易账本,正式关闭这个策略的记账周期(epoch),防止新数据
混进旧策略的账
部署大家都很仔细,停用往往只做第 1 步就当完事。真正的坑都埋在第 2到第 5 步里。
14 小时样本小没亏钱,但这种侥幸不代表下次还能走运。

1人点赞了这条动态

赞赏
1
评论
转发
分享

runesleo

04-11 12:18

看 @predictionindex 这期最新预测市场数据周报告：Polymarket + Kalshi 合计约 75% 成交量，其余所有平台累计 <$30B。
报告里没讲的两个细节，对预测市场玩家其实更关键：
Kalshi 正在追上甚至反超 Polymarket
DeFiRate 最新一周：Kalshi $2.9B（60%），Polymarket $2.0B（40%）。两家在周度数据里互有拉锯——上周 Poly 刚反超过 Kalshi，这周又被追回去。
美国市场更极端。BofA 4/9-10 报告：Kalshi 89%，Polymarket 7%， 4%。合规 + KYC 是 Kalshi 的结构性优势，Polymarket 是链上协议，在美国散户覆盖上暂时吃亏，短期不会翻。
"双寡头"这个词容易让人以为 Poly 还是老大，美国市场实际已经基本是 Kalshi 一家。
"其他 25%" 里也许藏着更大的 alpha
Week 15 报告点到的小平台：Opinion / Limitless / Myriad / / Probable / / Chain）...

本质上是新预测市场上线到竞争充分之间的窗口期玩家。
一个典型数据：某链上钱包在 30 天做出 $99K PnL，每笔毛利率 ~21%。对比 Polymarket 成熟盘口的 0.5-2%，差了 10 倍以上。

赞赏
点赞
评论
转发
分享

runesleo

04-08 12:20

又一件虽然没什么用但是很爽的事：今天用 Claude 把 3.7 万封 Gmail 收件箱清到 1.1 万。全程没自己看一封邮件，只点了两下：发 App Password、导入 filter。
走的是 Python + IMAP，分四步：
1. 导出所有发件人按频率分类
2. 555 个垃圾域名一键归档到 Archive-Junk
3. 主动停下来说「我误伤了 317 封银行 / 券商 / Coinbase / Claude 安全邮件，要召回吗」
4. 生成 Gmail Filter 让未来这些域名直接跳过 INBOX
第三步是我没料到的。本来准备自己抽查几封看分类对不对，AI 自己先把风险点列出来了。

赞赏
点赞
评论
转发
分享

热门话题
查看更多
#
Gate广场五月交易分享
104.07万热度
#
BTC重返8万
5945.03万热度
#
日本国债上链24小时交易
190.82万热度
#
韩国加密征税倒计时
255.44万热度
#
Polymarket每日热点
87.09万热度

runesleo

热门话题

Gate广场五月交易分享

BTC重返8万

日本国债上链24小时交易

韩国加密征税倒计时

Polymarket每日热点

置顶