HyperAI

主区域

GPU

控制台
Studio
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务协议隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
SOTA
常识推理

常识推理

Common Sense Reasoning任务旨在使模型超越模式识别，运用常识或世界知识进行推理。其目标是让模型能够理解复杂情境，做出合理判断与预测，提高在自然语言处理、对话系统等领域的智能化水平与应用效果。

PaLM 540B (0-shot)

ARC (Challenge)

ST-MoE-32B 269B (fine-tuned)

MUPPET Roberta Large

BIG-bench (Disambiguation QA)

BIG-bench (Causal Judgment)

BIG-bench (Date Understanding)

BIG-bench (Sports Understanding)

Event2Mind test

Russian Event2Mind

araneum word2vec (skipgram) + GRU

BIG-bench (Winowhy)

BIG-bench (Known Unknowns)

PaLM-540B (few-shot, k=5)

BIG-bench (Logical Sequence)

Chinchilla-70B (few-shot, k=5)

Visual Dialog v0.9

Visual Dialog v0.9

NMN [kottur2018visual]

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们帮助与支持数据集支持

产品

报道论文教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

HyperAI

主区域

GPU

控制台
Studio
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务协议隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
SOTA
常识推理

常识推理

Common Sense Reasoning任务旨在使模型超越模式识别，运用常识或世界知识进行推理。其目标是让模型能够理解复杂情境，做出合理判断与预测，提高在自然语言处理、对话系统等领域的智能化水平与应用效果。

PaLM 540B (0-shot)

ARC (Challenge)

ST-MoE-32B 269B (fine-tuned)

MUPPET Roberta Large

BIG-bench (Disambiguation QA)

BIG-bench (Causal Judgment)

BIG-bench (Date Understanding)

BIG-bench (Sports Understanding)

Event2Mind test

Russian Event2Mind

araneum word2vec (skipgram) + GRU

BIG-bench (Winowhy)

BIG-bench (Known Unknowns)

PaLM-540B (few-shot, k=5)

BIG-bench (Logical Sequence)

Chinchilla-70B (few-shot, k=5)

Visual Dialog v0.9

Visual Dialog v0.9

NMN [kottur2018visual]

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们帮助与支持数据集支持

产品

报道论文教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili