有 2 台 8 卡的 4090 的机器, 384G 一台,怎么让他干活干到死
| NVIDIA-SMI 595.80 Driver Version: 595.80 CUDA Version: 13.2 | +—————————————–+————————+———————-+ | GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |=========================================+========================+======================| | 0 NVIDIA GeForce RTX 4090 Off | 00000000:16:00.0 Off | Off | | 30% 33C P8 12W / 450W | 4MiB / 49140MiB | 0% Default | | | | N/A | +—————————————–+————————+———————-+ | 1 NVIDIA GeForce RTX 4090 Off | 00000000:27:00.0 Off | Off | | 30% 32C P8 13W / 450W | 4MiB / 49140MiB | 0% Default | | | | N/A | +—————————————–+————————+———————-+ | 2 NVIDIA GeForce RTX 4090 Off | 00000000:38:00.0 Off | Off | | 30% 32C P8 16W / 450W | 4MiB / 49140MiB | 0% Default | | | | N/A | +—————————————–+————————+———————-+ | 3 NVIDIA GeForce RTX 4090 Off | 00000000:5A:00.0 Off | Off | | 30% 33C P8 20W / 450W | 4MiB / 49140MiB | 0% Default | | | | N/A | +—————————————–+————————+———————-+ | 4 NVIDIA GeForce RTX 4090 Off | 00000000:98:00.0 Off | Off | | 30% 32C P8 20W / 450W | 4MiB / 49140MiB | 0% Default | | | | N/A | +—————————————–+————————+———————-+ | 5 NVIDIA GeForce RTX 4090 Off | 00000000:A8:00.0 Off | Off | | 30% 33C P8 21W / 450W | 4MiB / 49140MiB | 0% Default | | | | N/A | +—————————————–+————————+———————-+ | 6 NVIDIA GeForce RTX 4090 Off | 00000000:B8:00.0 Off | Off | | 30% 32C P8 27W / 450W | 4MiB / 49140MiB | 0% Default | | | | N/A | +—————————————–+————————+———————-+ | 7 NVIDIA GeForce RTX 4090 Off | 00000000:D8:00.0 Off | Off | | 30% 32C P8 14W / 450W | 4MiB / 49140MiB | 0% Default | | | | N/A | +—————————————–+————————+———————-+
配置如上,能不能跑个 hermes 或者 claude 让他不停的干活,比如用 claude 的 loop ,这个配置部署什么模型编程能力最强呢