Loading...
大语言模型(LLM)尽管在各种语言任务中表现抢眼,但通常仅限于处理上下文窗口大小范围内的文本。有越来越多的基准被提出来测试LLM的长文本理解能力。当前具有代表性的长文本评测主要包括Zero-SCROLLS、L-Eval、LongBen...
简介数据标注,正迎来关键洗牌时刻。大模型时代到来,以数据为中心的AI开发模式加速走向台前,数据的价值从未向今天这样被充分挖掘——大模型从训练到部署应用迭代,AIGC众多垂直场景落地,通用智能、具身智能等前沿领域探索,都与高质量、专业化...
简介谷歌DeepMind实验室推出的天气预测大模型,已在Science杂志发表。只需要不到1分钟,它就能直接预测出未来10天的天气。准确度上,它在90%的指标上超越了最先进的人类系统,在AI气象模型中属首次!DeepMind的这个气象...