您的位置:首页 >科技 > 内容

姚期智团队开源TPA新型注意力机制:节省90%内存且性能无损,统一MHAMQAGQA框架

2025-01-16 21:40:12来源:网易  用户:储俊紫

姚期智院士团队打造了新型注意力机制TPA,通过动态张量分解,节省90%或更多的内存而不牺牲性能。论文证明MHA、MQA、GQA都是TPA的特例,并用一个框架统一了现代注意力设计。新模型T6的代码已在GitHub开源。

此外,TPA还与RoPE位置编码无缝集成,实现低成本旋转分解KV。在实验中,TPA在多个基准测试中表现优异。该论文由清华&上海期智研究员团队、UCLA顾全全团队合作完成,开源代码和论文地址已提供。

免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!

猜你喜欢

最新文章