分类大模型下的文章

chatgpt等大模型相关技术文档和最新资讯

基于智能搜索和大模型知识库 – 实战篇

**在过去的数月中，亚马逊云科技已经推出了多篇 Blog，来介绍如何在亚马逊云科技上构建基于 MVP（LLM+Vector+Prompt）架构打造企业下一代知识库。为了帮助客户快速、安全地在亚马逊云科技上构建、部署和管理应用程序，众多...

admin

2024 年 05 月 10 日

暂无评论

45天落地LLM系列第2天-微调大模型+知识库！

第一部分：为什么要写SOP？在雄哥团队，在一个项目开始之前，或者一个新人加入公司，他要熟悉某个项目的进度，或者安排工作给他！雄哥要做的第一件事就是教他怎样思考，怎样去思考一个项目！写sop——按照sop去执行——反馈工作流程中不足的点...

admin

2024 年 05 月 10 日

暂无评论

傻瓜式！一键部署llama2+chatglm2，集成所有环境和微调功能，本地化界面操作！

只用一个工具，实现一键部署llama2+chatglm2，一键微调训练大模型！牛不牛工具名称：text-generation-webui开发者：oobaboogahttps://github.com/oobabooga/text-ge...

admin

2024 年 05 月 10 日

暂无评论

45天落地LLM系列1-微调大模型+知识库！动手部署在微信前！学会分析项目，写SOP

45天！落地LLM到企微/飞书的实操复现项目，本次分教育+医疗2组，动手实操做复现！全程覆盖五大板块:①微信/飞书接入、②API管理、③数据集预处理、④大模型选择及调优、⑤知识库搭建**1.1 服务内容非常重要！想清楚你提供什么样的服...

admin

2024 年 05 月 10 日

暂无评论

LangChain的Agent使用介绍

LangChain 介绍随着各种开源大模型的发布，越来越多的人开始尝试接触和使用大模型。在感叹大模型带来的惊人表现的同时，也发现一些问题，比如没法查询到最新的信息，有时候问一些数学问题时候，会出现错误答案，还有一些专业领域类问题甚至编...

admin

2024 年 01 月 19 日

暂无评论

docker容器中deepspeed多机多卡集群分布式训练大模型

众所周知，大模型的训练需要大量的显存资源，单卡很容易就爆了，于是就有了单机多卡、多机多卡的训练方案。本文主要是介绍如何使用deepspeed框架做多机多卡的分布式训练。由于PyTorch、NVIDIA、CUDA等运行环境搭建也是很繁琐...

admin

2024 年 01 月 19 日

暂无评论

DeepSpeed 通过系统优化加速大模型推理

一，背景知识1.1，LLM 应用的难点1，模型训练时间过长伴随着 Transformer 结构的提出，后续 LLM 参数开始从亿级到百亿、乃至万亿级增长，与超高速增长到模型参数量相比， GPU 显存的增长实属有限，有数据显示每 18 ...

admin

2024 年 01 月 19 日

暂无评论

看看GPT-4V是怎么开车的，必须围观，大模型真的大有作为 | 万字长文

自动驾驶技术的发展依赖于感知、决策和控制系统的高效集成。传统的数据驱动方法和基于规则的方法在处理复杂驾驶环境和理解其他道路用户的意图时受到限制。这是实现安全和可靠自动驾驶所必需的重要瓶颈，特别是在发展常识推理和细致场景理解方面。视觉语...

admin

2023 年 11 月 21 日

暂无评论

一文详看大模型长文本如何评估：四大主流评测数据集的任务设计、数据集构建方案

大语言模型（LLM）尽管在各种语言任务中表现抢眼，但通常仅限于处理上下文窗口大小范围内的文本。有越来越多的基准被提出来测试LLM的长文本理解能力。当前具有代表性的长文本评测主要包括Zero-SCROLLS、L-Eval、LongBen...

admin

2023 年 11 月 21 日

暂无评论

DeepMind大模型登Science：1分钟预测10天天气数据，90%指标超越人类最强模型

简介谷歌DeepMind实验室推出的天气预测大模型，已在Science杂志发表。只需要不到1分钟，它就能直接预测出未来10天的天气。准确度上，它在90%的指标上超越了最先进的人类系统，在AI气象模型中属首次！DeepMind的这个气象...

admin

2023 年 11 月 16 日

暂无评论

开源大模型部署及推理所需显卡成本必读之一

在人工智能大模型训练的过程中，常常会面临显存资源不足的情况，其中包括但不限于以下两个方面：1.经典错误：CUDA out of memory. Tried to allocate ...；2.明明报错信息表明显存资源充足，仍然发生 O...

admin

2023 年 11 月 16 日

暂无评论

开源大模型部署及推理所需显卡成本必读之二

在前面的文章中，我们介绍了大模型占用显卡空间的一些分析情况，这次我们继续来看看具体量化角度上的结论。因此，本文来来介绍一个偏具体数值量化的工作。随着各厂商相继发布大型模型，排行榜变化频繁，新旧交替，呈现出一片繁荣景象。有些技术爱好者也...

admin

2023 年 11 月 16 日

暂无评论

ChatGPT 指令大全（值得收藏）

简介在人人都用chatgpt的当下，但是要想用好chatgpt也不是那么容易，在使用 ChatGPT 时，当你给的指令越精确，它的回答会越到位，掌握和chatgpt对话的技巧，你将会事半功倍，不但效率提升，并且还能做出令人惊叹的内容。...

admin

2023 年 10 月 26 日

暂无评论

ChatGPT和Midjourney王炸组合，开启AI新时代

一、序言随着人工智能技术的突飞猛进，越来越多的人开始利用AI工具进行绘画创作。本文将向你介绍如何将ChatGPT与Midjourney相结合，以轻松创作出令人惊艳的图画。首先，让我们来了解一下ChatGPT和Midjourney。Ch...

admin

2023 年 10 月 25 日

暂无评论

分类大模型下的文章

基于智能搜索和大模型知识库 – 实战篇

45天落地LLM系列第2天-微调大模型+知识库！

傻瓜式！一键部署llama2+chatglm2，集成所有环境和微调功能，本地化界面操作！

45天落地LLM系列1-微调大模型+知识库！动手部署在微信前！学会分析项目，写SOP

LangChain的Agent使用介绍

docker容器中deepspeed多机多卡集群分布式训练大模型

DeepSpeed 通过系统优化加速大模型推理

看看GPT-4V是怎么开车的，必须围观，大模型真的大有作为 | 万字长文

一文详看大模型长文本如何评估：四大主流评测数据集的任务设计、数据集构建方案

DeepMind大模型登Science：1分钟预测10天天气数据，90%指标超越人类最强模型

开源大模型部署及推理所需显卡成本必读之一

开源大模型部署及推理所需显卡成本必读之二

ChatGPT 指令大全（值得收藏）

ChatGPT和Midjourney王炸组合，开启AI新时代

Ubuntu 20.04 for NVIDIA V100 GPU安装手册

开源 ansible UI semaphore 安装配置记录

docker容器中deepspeed多机多卡集群分布式训练大模型

联想DM5000H日常维护手册

ubuntu 22.10 apt 安装源

typecho SEO站点收录插件推荐

CentOS/RHEL7环境下更改网卡名称为CentOS6的传统命名规则

Centos7.4内核升级操作文档

ChatGPT 指令大全（值得收藏）

WordPress 多域名支持配置教程