标签数据下的文章

一文详看大模型长文本如何评估：四大主流评测数据集的任务设计、数据集构建方案

大语言模型（LLM）尽管在各种语言任务中表现抢眼，但通常仅限于处理上下文窗口大小范围内的文本。有越来越多的基准被提出来测试LLM的长文本理解能力。当前具有代表性的长文本评测主要包括Zero-SCROLLS、L-Eval、LongBen...

2023 年 11 月 21 日

简介数据标注，正迎来关键洗牌时刻。大模型时代到来，以数据为中心的AI开发模式加速走向台前，数据的价值从未向今天这样被充分挖掘——大模型从训练到部署应用迭代，AIGC众多垂直场景落地，通用智能、具身智能等前沿领域探索，都与高质量、专业化...

2023 年 11 月 17 日

简介谷歌DeepMind实验室推出的天气预测大模型，已在Science杂志发表。只需要不到1分钟，它就能直接预测出未来10天的天气。准确度上，它在90%的指标上超越了最先进的人类系统，在AI气象模型中属首次！DeepMind的这个气象...

2023 年 11 月 16 日