
清华
看到这个问题,本来想和大家聊聊我了解的那些炼丹实验室到底买了多少显卡,但一看到问题描述里提到感觉国内高校显卡资源比较富裕的是
清华,其他高校在干嘛?……算了,你们继续聊吧,我先撤了。不过认真来说,单从经费角度看,确实有些学校或实验室是能够买更多显卡的。但你有没有想过一个非常实际的问题:这些机器放到哪里?如果你没有从事过网管相关工作,可能不太容易意识到这个问题的重要性,但它确实是摆在很多实验室面前的一大难题。我们实验室近年来就一直面临着这样的困境——
服务器无处安放。目前我们有两三台GPU
服务器,外加十几台CPU
服务器。虽然CPU
服务器功率相对较低,校内还有几个机房可以托管,但GPU
服务器完全不同。每台GPU
服务器动辄上千瓦的峰值功率,如果再加几张显卡,功率叠加起来会非常惊人,这对机房环境提出了更高的要求。然而,据我所知,学校近几年几乎没有新建机房。而几年前修建的机房,设计初衷是为了适应多核CPU的时代需求,并未考虑到如今每个实验室都需要几台甚至更多GPU
服务器的情况。因此,如果所有实验室都提出要购买一批GPU
服务器,显然现有的机房容量根本无法满足需求。即使考虑给旧机器加卡也不可行,因为功率超载的风险太大。实际上,我们实验室在硬件采购方面资金并不算紧张,但每次有人提议买新设备时,总会被一个问题难住:放哪儿?两年前,我需要一台持久内存的机器,最后只能报废掉一台旧机器,腾出位置来安置它。如果是功率更高的GPU机器,那就更没辙了。所以,反过来问一下提问者:即便你们学校真的有上万张A100显卡,又能把它们放在哪里?这或许才是比单纯讨论预算更重要的现实问题。