cuda吧-百度贴吧--欢迎讨论CUDA相关话题，广告勿扰

0

获课 ♥》http://www.bcwit.top/13941/ 底层筑基：通过 CUDA 并行计算模型解析，建立 GPU 架构认知（SIMT/SIMD、显存层次结构、核函数执行模型）；工具精通：深入 TensorRT 全流程优化（FP16/INT8 量化、层融合、动态 shape 支持、插件开发）；实战攻坚：围绕图像分类（ResNet）、目标检测（YOLOv5）、语义分割（U-Net）三大典型任务，完成从模型转换到部署上线的全链路实操；工程拓展：覆盖多卡并行策略（Collective Communication）、端侧部署（Jetson 平台）、服务化封

坏坏的丫... 13:47

0

好课分享-CUDA与TensorRT部署实战课程：课程总结

钟样离朝

4-11

获课♥》789it。top/13843/ CUDA C/C++编程核心概念解析内核函数与线程层次 CUDA编程模型的核心是内核函数(kernel function)，这是一种在GPU上并行执行的函数。与传统C/C++函数不同，内核函数由大量线程并行执行，这些线程被组织成具有层次结构的网格(grid)、块(block)和线程(thread)三个级别。线程层次结构的设计反映了GPU的硬件执行模型：网格(Grid)：最高层次的线程组织，包含多个线程块线程块(Block)：中间层次的线程组，块内的线程可以协作线程(Thread)：最基

钟样离朝 4-11

0

CUDA与TensorRT部署实战课程：课程总结

贴吧用户_... 4-11

下栽课🖤》youkeit.xyz/13854/ 在深度学习和高性能计算领域，CUDA和TensorRT是两个至关重要的工具。CUDA提供了强大的并行计算能力，而TensorRT则专注于深度学习模型的优化和加速推理。掌握这两项技能，不仅能提升模型的性能，还能显著提高开发效率。以下是一些提升CUDA与TensorRT技能的实用建议。一、从基础开始：理解核心概念（一）CUDA基础了解CUDA架构：熟悉CUDA的基本架构，包括线程、线程块、网格等概念，以及它们如何在GPU上并行执行计算任务。掌

贴吧用户_... 4-11

3

求助网站打不开

贴吧用户_... 4-8

我看很多朋友是是下载后有问题，但我这连下载的地方都找不到

贴吧用户_... 4-9

0

CUDA怎么还会隐身啊

众多的确

4-7

为什么我下载路径安装CUDA后，C盘的CUDA的文件夹直接消失了？[lbk]笑哭[rbk]

众多的确 4-7

0

cuda10.2下载不了了

一吧 4-6

官网里10.2的下载按钮没了，有没有大佬有安装包或其他方法的，电脑显卡驱动版本最高就支持10.2

一吧 4-6

0

只有nsight vse下载不了，怎么办？

贴吧用户_...

3-24

rt，用的12.0版本的CUDA，之前下载不了试着自定义先下其他之后再下的nsight VSE，但还是不行，不知道要怎么搞

贴吧用户_... 3-24

0

自己改了一段cuda代码后，返回到pytorch中的值错误

x_m_y0205 3-20

把pytorch的张量放入cuda中加速运算，但是返回后的值是各种地址，pytorch中的张量获取不到具体的数值，是什么原因呢？

x_m_y0205 3-20

2

求助已经很多次了

ppjnnrnkdm 3-15

cuda安装了很多次，但是每次安装完成点击这个关闭之后就找不到了，文件夹也消失了，但是geek却有这个cuda，真的很头大

ppjnnrnkdm 3-15

5

有无大佬知道安装cuda卡在了配置vs studio设置咋解决

你知道我...

2-15

安装cuda卡在了Configuring Visual Studio setting 安装的是12.1版本捣鼓了几个小时也没解决

耽小落3 3-13

1

求助：cuda安装程序启动即失败

贴吧用户_... 3-1

卡是4050，驱动版本556.35，之前曾经成功安装过cuda 12.0，手欠卸载了，现在尝试装cuda12.5和cuda12.0都失败了。具体过程：点击下载好的安装程序提取到临时目录后，安装程序就直接失败了，根本没有同意协议和选项阶段，有没有大佬碰见过类似情况，救一救已经检查过驱动是没问题的，也把电脑防火墙都关了，卸载了原先装过的cudnn和nsight工具，但是仍然是这个问题

Drahairtailgon 3-6

1

求救求救求教

贴吧用户_... 2-27

本人计算机新生，准备配置pytorch环境，在下载CUDA这一步时卡在这里了（之前下载过CUDA，今天重新下载出了问题）😭😭

Drahairtailgon 3-6

3

安装cuda的问题

啊哦呃49 2-21

我的卡是4060，显驱更到最新了，也下了vs，看官网支持也推荐安装cuda12.8。但是我安装的时候进度条一直卡在安装nsight VSE不动，我中断了安装，打算直接先单独装nsight vse，但nsight的安装进度条也卡住不动，这怎么办？

zeroxplus810 2-25

4

cuda安装问题

芽衣uu 2-16

有大佬知道这怎么办吗，求求了

zeroxplus810 2-25

1

cuda跟pytorch不兼容咋整

makoto

2024-12

月子凹 2-15

3

谁能有偿教教我怎么安装CUDA

贴吧用户_... 1-29

我是纯新手，想试着学学那本《动手学深度学习》，但是我发现自己连第一步安装都搞不定……有没有人愿意连麦教教我……50￥够不够……

贴吧用户_... 2-10

0

关于CUDA渲染后软件ui页面图像的采集

自由之风乀 1-21

大佬们，我在做一款软件，要求低延迟采集裁剪后的屏幕画面，目前用dxgi截图，但是dxgi是经历过整个屏幕ui的拷贝的，cuda能不能直接访问渲染后的软件ui画面？我想将截图方式改为指定软件截图，这样来提高截图速度

自由之风乀 1-21

5

求擅长cuda的大佬

你吵到我... 2024-01

线上答疑，英语要好，985/211本科大三以上，研究生更好

你吵到我... 1-20

1

求助CUDA调试工具的问题

永恒x毁灭 2024-06

编写CUDA程序，发现有个例子可以是这么看资源分配的情况，请问这是个什么工具啊

ฅ ̳͒... 12-5

1

求一个用GPU实现的并行的有线体积格式的程序，有偿

贴吧用户_... 2024-11

星空是你 11-4

3

求助！！cuda安装不报错直接失败

叫哥八八八 2024-09

哭泣…安装环境vs2019，gtx1050ti(已安装驱动)。尝试进行cuda10.2版本安装。自定义操作： 1.更改了安装目录(因为C盘实在是没空间了) 2.取消勾选visual studio integration(失败多次看安装教程操作的) 点击下一步后，到安装界面就直接显示安装程序失败。没有任何报错，实在是找不到解决办法。求大佬们答疑解惑吧😭

神乐丶曦... 10-28

0

求助，有办法可以让4080显卡支持11.3版本的cuda吗？

呙一f 2024-10

wsl2可以嘛？

呙一f 10-15

2

想把cuda卸载了，但是不知道有没有卸载完全

贴吧用户_... 2024-06

哪个nvdia是cuda的文件啊？

ಠ_ರೃ、 10-7

0

新人求助，电脑如何使用GPU

1:06:22 2024-10

本人大学生，刚学机器学习相关课程，想问一下，就是只要对应的环境里的库是cuda版本，比如torch cuda的，就可以直接使用吗？需要代码上进行额外设置吗？还是只要检测到环境里的库是cuda版本就会直接用GPU？

1:06:22 10-2

4

有偿，求助！！！我想要验证NVIDIA Jetson Xavier NX的GPU算力。

一只鱼呀... 2024-09

我想验证这个载板上的算力，网上的一些方法都不太行。有大佬帮忙吗？

ChenKxii 9-26

6

cuda和GPU加速不能同时开是吗？

割肉食雪 2024-08

噜噜噜拉

9-7

2

求助一下CUDA版本的argmax实现问题

Kitosu 2024-08

如题，想请教一下如果有一个二维数组data[M][N]，想求它在某个维度上的argmax，有没有什么好的使用CUDA加速的办法?最简单的办法是把某一个维度分配到block上然后用for循环去求，但是感觉这种做法没有充分利用GPU。更进一步的如果源数组是一个有很多维度的tensor，如data[N1][N2][N3][...][Nk]这种，有没有什么高效的办法实现这个函数？

噜噜噜拉

9-7

1

VS 2022编译报错，有没有大佬看看什么原因。

_

Random

_

2024-08

编译的时候静态断言了，原因是Unexpected compiler version, expected CUDA 12.4 or newer. 但是我的CUDA版本明明已经是14.6了。想知道如何解决

_

Random

_ 8-26

7

家人们，这是啥意思啊

万物有声7 2024-05

想要安装个cuda一直显示出错，哪里的问题呢

sin&sinner 8-7

1

小白求助！

jiang1235111 2024-03

下载12.1.1版的时候弹出来的，请问各位大佬怎么解决啊

sin&sinner 8-7

0

inclusive_scan导致cudamemcpy很耗时

哈哈... 2024-08

今天写代码时发现用cudamemcpy把25M个数据点从gpu向cpu中复制时，发现非常耗时，需要50多秒，注释掉前面两句trust::inclusive_scan和trust::copy后发现只需要几十毫秒，请问大佬这个问题怎么解决，inclusive_scan是实现代码功能必须要有的用来计算前缀和的代码，实际应用不能注释掉。问ai说是可能是由于内存碎片化导致的？应该怎么解决？

哈哈... 8-5

0

求助配置python的pytorcch环境，有个跟nvcuda64.dll有关的异常

iris

Eu

2024-08

nvidia驱动556，最高支持cuda12.5，下载的pytorch2.4，用的cuda12.4，cuda.is_available()或者cuda.device_count()调用后程序会卡住后中断，看系统日志有报错nvcuda64.dll异常什么的。请问是怎么回事？计算机是win10，rtx2060.

iris

Eu 8-2

0

新手求助贴

贴吧用户_... 2024-07

求助各位大佬，这个检验安装一直是false怎么办

贴吧用户_... 7-27

3

大佬们，请教我的CUDA安装失败问题

熊师 2024-06

我用的最新的安装包，cuda_12.4.1_551.78_windows 显卡是4090，英伟达控制面板组件里面显示的版本号是我已经把英伟达驱动都升级到最新了。然后自定义安装时显示的是这样安装我把第二张图下面三个都取掉了，后提示报错，显示的是这样大部分是未安装，几个已安装，一个失败，请问下如何解决，谢谢

共 6 张

楽神荼

. 6-30

1

在Linux安装CUDA报错

hfxxfgf 2024-06

在Linux上安装CUDA，前面都很顺利，Ubuntu20.04+CUDA11.7，最后安装的时候如图，说nvidia-芭芭拉-OUbuntu1不是官方软件包，怎么办呀

hfxxfgf 6-27

2

我佛了

可爱的小... 2021-09

新电脑学cuda编程，试了好几天就是出不了结果，软件也装了。最后发现显卡是intel的，不支持cuda

UPUP

6-5

3

求助。。。。

贴吧用户_... 2024-05

有大佬帮忙看下这个是什么问题吗

贴吧用户_... 5-31

1

求助，这个问题太难了

波比的大橘 2024-03

以前遇到过这种问题，试过很多方法也不奏效，后来换了个服务器可以跑了。昨晚运行项目跑起来，今早过去重新跑结果一直报这个错误。求助各位大神

清晨消散... 5-30

4

小白求助，感谢

请叫我雷... 2024-03

各路大神给看看啥情况。

清晨消散... 5-30

16

CUDA9.0安装，显示所有项都未安装，一直失败怎么回事啊。。求助

SaveNoLoad

2018-11

就是在这个的前一步是什么，正常安装，然后处理安装好的包什么的我没选VS的项，因为选上之后连安装那步都进不去，直接就卡掉然后失败。。。大佬们请问这什么问题啊，网上都没找到一样的

泡泡米蒂 5-8

0

请问531.18的驱动能不能搭配cuda_12.1.1_531.14的安装包？

chai1577 2024-05

531.14版本的驱动应该是测试版吧？全网都搜不到这个版本的驱动了。 531.18的驱动能不能搭配531.14的安装包？

chai1577 5-8

2

一个简单的矩阵乘问题bug

FranciscoLYK 2024-05

#define LEFT_ROW 1000 #define LEFT_COL 2400 #define RIGHT_ROW 2400 #define RIGHT_COL 1000 #define RES_ROW 1000 #define RES_COL 1000 #define LENGTH 32 __global__ void multiMatrix(int** left, int** right, int** result) { int x_pos = blockIdx.x * blockDim.x + threadIdx.x; int y_pos = blockIdx.y * blockDim.y + threadIdx.y; if (x_pos < LEFT_COL && y_pos < RIGHT_ROW) { for (int k = 0; k < LEFT_ROW; k++) { result[x_pos][y_pos] += left[x_pos][k] * right[k][y_pos]; } } } int main(void) { int** arr_left; int** arr_right; int** cpu_result; int** gpu_result; cudaMallocManaged((void**)&amp

红野家的... 5-8

1

NsightSystem分析VSC++程序的核函数运行时长提问

Gint0k1 2024-04

开始用的cudaevent计时，现在想尝试用Nsight System分析，目前在cuda api以及kernel下找到了核函数的事件，请问哪个才是准确的运行时间。但两者都和使用cudaevent存在时间差距，这个差距怎么理解，感谢大佬回答！

Gint0k1 4-25

1

大佬们，visual studio编译cuda模板出现下面这种错误咋解决

东船西...

2023-12

环境为vs2022，cuda12.2 打开vs自带的cuda模板会出现E0029和MSB3721两个报错，具体如下图：

哈哈... 4-14

0

求大佬解释一下书中的习题2.1

请风吹过...

2024-04

在文件sumArraysOnGPU-timer.cu中，设置block.x＝1 023，重新编译并运行。与执行配置为block.x＝1 024的运行结果进行比较，试着解释其区别和原因。

请风吹过... 15:27

1

cuda能否使用返回false

贴吧用户_... 2024-03

安装的是gpu版本的cuda，但是仍然返回false，请问怎么办。如下图，分别是pytorch版本和cuda还有toolkit版本，是由官网上命令下载的，因此这三个版本是对上的，然后我的显卡驱动也可以支持11.3的cuda，但是is.available函数就是返回false，求助各位

贴吧用户_... 03:46

2

小白不会安装😵

贴吧用户_... 2024-01

大佬这是什么情况啊

An2023 4-6

2

关于算法的问题

某锦依... 2024-03

各位大佬好，如果我有两段等长数据，想要在device上找到第一段数据中的最大值，记录下索引(有多个相等最大值就记录所有索引)，然后找到第二段数据中符合索引的元素的最大值和它的索引(如果有多个要任意一个就行)。之前每个数据作为寄存器变量遇到了同步的问题。数据段长度在每次循环会变(循环也在device上)而且最大可能会占用4*10^8个字节。请问各位大佬有什么好办法吗？就是数据放在哪一级内存中用什么算法比较好之类的。谢谢。

某锦依... 4-6

1

求助！ cuda11.7+petsc3.20.5 测试runex19_hypre_cuda出现问题

心人生日

2024-03

terminate called after throwing an instance of 'thrust::system::system_error' > what(): after reduction step 1: cudaErrorInvalidDeviceFunction: invalid device function

心人生日 3-17

0

有点绝望nsight compute

安东尼奥... 2024-02

怎么会有人在文件名中加空格！找不到配置文件,这个路径不改就没法用配置文件是否存在都是一个迷

安东尼奥... 2-17

扫二维码下载贴吧客户端

本吧信息查看详情>>

日	一	二	三	四	五	六

扫二维码下载贴吧客户端

本吧信息 查看详情>>

本吧信息查看详情>>