長期以來,電子垃圾(e-waste)一直是數據中心運營商在環境可持續性和社會責任方面面臨的一項挑戰。然而,圍繞人工智能的持續熱潮可能會使數據中心的電子垃圾問題變得更加嚴重。
因此,現在數據中心運營商以及在數據中心內部署人工智能工作負載的企業應該開始考慮電子垃圾管理策略了。若能未雨綢繆,他們就可以減少人工智能基礎設施造成的電子垃圾數量。
數據中心電子垃圾:基礎知識
電子垃圾是指任何類型的不再使用并可能對環境造成危害的電子產品。數據中心的設備(如服務器、網絡交換機和電源裝置)可能含有鉛和汞等化學物質。這意味著這些設備不再使用后有可能成為電子垃圾。
從環境可持續發展的角度來看,電子垃圾是有害的,因為數據中心設備中的危險化合物會滲入自然環境,對植物、動物和人類造成潛在危害。它還會對發展中國家的人民造成負面影響,因為這些國家往往是廢棄IT設備的最終歸宿。
人工智能會讓電子垃圾問題變得更糟糕嗎?
和很多技術行業一樣,幾十年來,數據中心一直在在助長電子垃圾的產生。但隨著越來越多的企業尋求利用人工智能,尤其是生成式人工智能,這一問題可能會越來越嚴峻。
因為生成式人工智能應用和服務必須經過一個名為訓練的過程,這個過程需要解析大量數據以識別模式。訓練通常使用配備了圖形處理器(GPU)的服務器進行。GPU的訓練速度比傳統CPU快得多,因為GPU具有更高的并行計算能力,這意味著它們可以同時處理更多數據。
在大多數情況下,人工智能訓練是一個臨時或一次性的過程。人工智能模型一旦完成訓練,就不需要再次訓練,除非開發人員想“教”它新的信息。這意味著,要想訓練生成式人工智能模型很可能就要部署配備GPU的服務器,而對這些服務器的需求并不持續。
換句話說,在訓練結束后,企業啟動并運行了人工智能模型,對這些硬件的需求就會減少,因為除了訓練人工智能模型之外,數據中心里GPU的用例并不多,而絕大多數組織都不需要經常重新進行訓練。
從電子垃圾的角度來看,這有可能導致一些GPU或配備GPU的整個服務器的壽命明顯縮短。它們仍能正常工作,但可能會因需求不足而被淘汰。
類似的故事已經在加密貨幣挖礦領域上演過了——GPU和其他專用硬件也很重要,因為它們經常被用于挖礦。由于為加密貨幣挖礦而制造的設備幾乎沒有其他有用的用途,因此很多設備也都成了電子垃圾。
減少人工智能造成的數據中心電子垃圾
好消息是,有一些方法可以避免人工智能訓練造成數據中心電子垃圾的大量增加。
其中一個關鍵步驟就是企業共享人工智能訓練服務器。企業可以選擇“GPU 即服務”(GPU-as-a-Service)產品,這實際上是租用 GPU,而不是自己購買配備 GPU 的服務器進行訓練。當他們完成訓練后,這些GPU就可以被其他需要訓練模型的企業使用。這比擁有無需持續使用的GPU服務器更具可持續性,更不用說成本效益了。
選擇使用預先訓練好的模型,而不是從頭開始構建模型,是幫助降低人工智能電子垃圾風險的另一種方法。越來越多的模型可以從開源項目中獲得,這些模型已經過訓練,無需任何類型的專用數據中心基礎設施。
當然,企業還應該確保在不再需要人工智能服務器時對其進行適當的回收或處理。但在理想情況下,他們首先應該盡量減少部署的服務器數量,因為這些服務器有可能在短時間內成為人工智能電子垃圾。