因业务需要可能会去 AutoDL 租用服务器用于模型训练,故测试了一下其上消费级显卡(原版2080Ti 11G)多卡互联时的性能表现。 将结果放在这里作为参考。
省流:没有NVLink,虽然运行在PCIe 3.0x16交换机上,且两个CPU NUMA都接入了PCIe switch,但由于驱动原因,P2P通信不可用,导致多卡互联性能较差。
以下为 DeepSeek-R1-0528 的总结
| from PIL import Image | |
| import numpy as np | |
| import matplotlib.pyplot as plt | |
| import time | |
| from colour.plotting import * | |
| def plot_xy_coordinates_with_color(xy_and_rgb_np, output_png_path): | |
| start_time = time.time() | |
| xy = xy_and_rgb_np[:, :2] |
| import ast | |
| import requests | |
| class FunctionExtractor(ast.NodeVisitor): | |
| def __init__(self): | |
| self.functions = [] | |
| self.function_calls = [] | |
| def visit_FunctionDef(self, node): | |
| function_code = ast.unparse(node) |