标签：彻底改变语言模型：全新架构TTT超越Transformer，ML模型代替RNN隐藏状态

全新架构TTT超越Transformer，ML模型代替RNN隐藏状态。

从 125m 到 1.3b 的大模型，性能都有提升。难以置信，这件事终于发生了。一种全新的大语言模型（LLM）架构有望代替至今在 AI 领域如日中天的 Transformer，性能也比 Mamba 更好。本周一，有关 Test-Time...