您的位置：首页 >科技 > 内容

姚期智团队开源TPA新型注意力机制：节省90%内存且性能无损，统一MHAMQAGQA框架

2025-01-16 21:40:12来源：网易用户：储俊紫

姚期智院士团队打造了新型注意力机制TPA，通过动态张量分解，节省90%或更多的内存而不牺牲性能。论文证明MHA、MQA、GQA都是TPA的特例，并用一个框架统一了现代注意力设计。新模型T6的代码已在GitHub开源。

此外，TPA还与RoPE位置编码无缝集成，实现低成本旋转分解KV。在实验中，TPA在多个基准测试中表现优异。该论文由清华&上海期智研究员团队、UCLA顾全全团队合作完成，开源代码和论文地址已提供。

免责声明：本文由用户上传，与本网站立场无关。财经信息仅供读者参考，并不构成投资建议。投资者据此操作，风险自担。如有侵权请联系删除！

标签：

猜你喜欢

最新文章