I'm on my fourth iteration of training the 3B model.
I'm learning a lot, the first model is clearly garbage compared to what I have now, although I doubt it's better than a even a previous generation SOTA model for the same domain.
But I'm now curious about the ceiling.

Just trained a small LLM on the entire IRS tax code using reinforcement learning — fully local on my MacBook.
Base model: Qwen 2.5 3B Instruct
Training data: 2,113 IRC sections + 6,149 Treasury Regulations
Pipeline: SFT → DPO → GRPO
Hardware: Apple M4 Max, 128GB RAM

Dennison

Twitter

我已经进行了四次 3B 模型的训练迭代。

我学到了很多，第一个模型和现在的模型相比简直是垃圾，尽管我怀疑它甚至比不上一代针对同一领域的最先进模型。

但我现在很好奇它的性能极限在哪里。

Block 旗下的比特币项目比特币 at Block（Block 由 Twitter联创杰克·多西创立）刚刚宣布上线免费比特币水龙头，标记比特币分发模式的回归……

杰克·多西宣布了一项价值 100 万镁的项目，旨在免费赠送比特币。

微策略（Strategy）创办人 Michael Saylor 断言比特币已赢得全球叙事战，同时点名 BIP- […]
〈Michael Saylor 警告 BIP-110 是比特币最大威胁；四年周期已死、机构资本才是真主角〉这篇文章最早发布于动区BlockTempo《动区动趋-最具影响力的区块链新闻媒体》。

Michael Saylor 警告 BIP-110 是比特币最大威胁；四年周期已死、机构资本才是真主角

很不幸，在这个时代，你工作越是毫无保留地认真，反而越容易将自己加速蒸馏为可以被 AI 取代的 skill。
这两天，热搜榜、媒体频道都被「同事.skill」刷屏了。当这件事在各大社交平台持续发酵时，公众的焦点几乎毫无意外地被「AI 裁员」、「资本剥削」与「打工人的数字永生」这些宏大的焦虑所裹挟。
这些的确让人焦虑，但让我最焦虑的，是项目 README 文档里写着一行使用建议：
「原材料质量决定 s...