I'm on my fourth iteration of training the 3B model.
I'm learning a lot, the first model is clearly garbage compared to what I have now, although I doubt it's better than a even a previous generation SOTA model for the same domain.
But I'm now curious about the ceiling.

Just trained a small LLM on the entire IRS tax code using reinforcement learning — fully local on my MacBook.
Base model: Qwen 2.5 3B Instruct
Training data: 2,113 IRC sections + 6,149 Treasury Regulations
Pipeline: SFT → DPO → GRPO
Hardware: Apple M4 Max, 128GB RAM

Dennison

Twitter

我已經進行了四次 3B 模型的訓練迭代。

我學到了很多，第一個模型和現在的模型相比簡直是垃圾，儘管我懷疑它甚至比不上一代針對同一領域的最先進模型。

但我現在很好奇它的性能極限在哪裡。

Block 旗下的比特幣項目比特幣 at Block（Block 由 Twitter聯創傑克·多西創立）剛剛宣佈上線免費比特幣水龍頭，標記比特幣分發模式的迴歸……

傑克·多西宣佈了一項價值 100 萬鎂的項目，旨在免費贈送比特幣。

微策略（Strategy）創辦人 Michael Saylor 斷言比特幣已贏得全球敘事戰，同時點名 BIP- […]
〈Michael Saylor 警告 BIP-110 是比特幣最大威脅；四年週期已死、機構資本才是真主角〉這篇文章最早發佈於動區BlockTempo《動區動趨-最具影響力的區塊鏈新聞媒體》。

Michael Saylor 警告 BIP-110 是比特幣最大威脅；四年週期已死、機構資本才是真主角

很不幸，在這個時代，你工作越是毫無保留地認真，反而越容易將自己加速蒸餾為可以被 AI 取代的 skill。
這兩天，熱搜榜、媒體頻道都被「同事.skill」刷屏了。當這件事在各大社交平臺持續發酵時，公眾的焦點幾乎毫無意外地被「AI 裁員」、「資本剝削」與「打工人的數字永生」這些宏大的焦慮所裹挾。
這些的確讓人焦慮，但讓我最焦慮的，是項目 README 文檔裡寫著一行使用建議：
「原材料質量決定 s...