[nlp] 大模型gpu机器推理测速踩坑 (llama/gpt类)

news/2024/7/12 2:22:40 标签: 自然语言处理, llama, gpt

cpu没报错,换gpu就报错。

坑1:要指定gpu,可以在import torch之前指定gpu。

model = LlamaForCausalLM.from_pretrained(model_path, trust_remote_code=True).to(device)

报错: RuntimeError('Expected all tensors to be on the same device, but found at least two devices, cuda:6 and cuda:0! (when checking argument for argument index in method wrapper_CUDA__index_select)')

坑2:model和input_ids都需要 .to(device),tokenizer不需要。

坑3:不要用device_map="auto",不然变量不在一张卡上。就算model和输入都to(device)了,也会报错。

报错:You can't move a model that has some modules offloaded to cpu or disk.

可以检查参数都在哪个卡,cpu/gpu。但是这样其实检查不出来啥:

坑4:custom_llama不能用AutoModelForCausalLM,要用LlamaForCausalLM。

<

http://www.niftyadmin.cn/n/5261067.html

相关文章

单词统计(C语言)

题目描述 输入一行字符&#xff0c;统计其中分别有多少个单词和空格。比如输入&#xff1a;"How are you"&#xff0c;有3个单词和2个空格。 输入 每行输入一字符串 输出 输出单词个数及空格个数&#xff0c;用逗号隔开 #include<stdio.h> #include<string.…

什么是DNS解析?DNS解析的过程是什么样的?

IP是网络上计算机的电子方位符具有唯一性&#xff0c;计算机之间通过IP进行地址确认和通信。但IP地址由一串纯数字组成&#xff0c;不方便人们的记忆和输入&#xff0c;人们很难记住太多网站的IP地址。域名的出现在一定程度上解决了这个难题&#xff0c;与IP地址相比&#xff0…

UI卡顿问题

1、 监测卡顿的方式 a、Xcode 层级关系是否有异常 b、 instruments 的Animation Hitch工具检测&#xff1a;碰到问题&#xff0c;录制完了无数据&#xff08;用iphone7录制有数据的&#xff0c;iphne14录制无数据&#xff1f;&#xff09; 2、可能导致的卡顿的原因 a、 直播广…

什么是FPGA原型验证?

EDA工具的使用主要分为设计、验证和制造三大类。验证工作贯穿整个芯片设计流程&#xff0c;可以说芯片的验证阶段占据了整个芯片开发的大部分时间。从芯片需求定义、功能设计开发到物理实现制造&#xff0c;每个环节都需要进行大量的验证。 现如今验证方法也越来越多&#xff…

PHP中如何处理文件上传?

在 PHP 中处理文件上传通常涉及到以下几个步骤&#xff1a; HTML 表单设置&#xff1a; 在 HTML 表单中设置 enctype 属性为 "multipart/form-data"&#xff0c;这是处理文件上传所必须的。 <form action"upload.php" method"post" enctype&q…

如何在 PyQt 中实现异步数据库请求

需求 开发软件的时候不可避免要和数据库发生交互&#xff0c;但是有些 SQL 请求非常耗时&#xff0c;如果在主线程中发送请求&#xff0c;可能会造成界面卡顿。这篇博客将会介绍一种让数据库请求变得和前端的 ajax 请求一样简单&#xff0c;且不会阻塞界面的异步请求方法。 实…

【工具类】Excel 多 Sheet 导入工具类

使用自定义注解 反射 泛型 封装&#xff0c;实现统一读取 自定义注解&#xff0c;Excel 作用于属性-Excel 列名&#xff0c;ExcelTarget 作用于类-ExcelSheet名 import java.lang.annotation.ElementType; import java.lang.annotation.Retention; import java.lang.annota…

052:vue重新发布,软件热更新方面的一点经验示例

第052个 查看专栏目录: VUE ------ element UI 专栏目标 在vue和element UI联合技术栈的操控下&#xff0c;本专栏提供行之有效的源代码示例和信息点介绍&#xff0c;做到灵活运用。 &#xff08;1&#xff09;提供vue2的一些基本操作&#xff1a;安装、引用&#xff0c;模板使…