HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
Transformer模型中的自适应注意力范围
7 个月前
Transformer
自然语言处理
模型训练
方法/架构
自然语言处理
任务/问题
摘要
论文
基准测试
资源
prajjwal1/adaptive_transformer
43
pytorch
JoeRoussy/adaptive-attention-in-cv
35
pytorch
jerrodparker20/adaptive-transformers-in-rl
136
pytorch
facebookresearch/adaptive-span
610
官方
pytorch
lancopku/Explicit-Sparse-Transformer
61
tf
prajjwal1/fluence
70
pytorch
ofirpress/sandwich_transformer
57
pytorch
pwc-1/Paper-9/tree/main/7/Knowing-When-to-Look-Adaptive-Attention
2
mindspore
https://arxiv.org/abs/1906.04076
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
Transformer模型中的自适应注意力范围
7 个月前
Transformer
自然语言处理
模型训练
方法/架构
自然语言处理
任务/问题
摘要
论文
基准测试
资源
prajjwal1/adaptive_transformer
43
pytorch
JoeRoussy/adaptive-attention-in-cv
35
pytorch
jerrodparker20/adaptive-transformers-in-rl
136
pytorch
facebookresearch/adaptive-span
610
官方
pytorch
lancopku/Explicit-Sparse-Transformer
61
tf
prajjwal1/fluence
70
pytorch
ofirpress/sandwich_transformer
57
pytorch
pwc-1/Paper-9/tree/main/7/Knowing-When-to-Look-Adaptive-Attention
2
mindspore
https://arxiv.org/abs/1906.04076