やっぱGPUが必要そうだ-この機種に刺さるGPUを探す

昔取った杵柄

PRIMERGY TX140 S1に刺さるGPUはあるか?

前回、Gemma4-E2Bを試した際に痛感したことが一つ。

「やっぱりGPUないとつらいわ・・・」

最新のマシンだったらCPUでもある程度の推論が可能ですが、Gemma4を試した際に実はInput文字列を取り込む処理も6Tok/sであることを知ってしまい、「やっぱそうなるよねー」ということでGPUを探索することに。

しかし、今動かせる自宅マシンは、以前ならばいざ知らず、持ってるマシンはPRIMERGY TX140 S1しかありません。こいつにはいくつか弱点があります。

  • PCI-Express 2.0である
  • 電源容量が300Wしかない
  • 追加電源用コネクタがない

    これを乗り越えて実装可能そうなGPUを探しました。

    電源容量が300Wしかない

    はい、このマシン、本体のフレームは立派な分厚いスチール製なのですが、電源容量は標準型電源ですけれども、一応80PLUS-GOLD仕様ではあるものの、電源容量はたったの300W!やばい。

    とりあえずCPUのTDPを調べると80Wであることは確認しました。その他、以下のパーツ容量については一定の確認をしました。

    コンポーネント電力使用量
    メモリ(DDR3 SDRAM)1-3W/枚
    ハードディスク(SATA 3.5インチ)-10W/個

    これで考えると、およそメモリに12W程度、HDDに40Wほど電源を使われてそうです。
    合計すると132Wなので、最大値として、140Wほど既存コンポーネントでメモリを消費してそうです。残り160Wで何とかする必要があります。調べてみると

    • 旧Quadroラインのワークステーション向けGPUを使用する(ただしエントリークラスのSingleSlot版)
    • GeForce GTXのエントリークラス

    前者は昔のPascalやTuringコアでもエントリークラスではおよそ50-75W程度で使用できるGPUがそこそこ転がってましたので、これを当てにしてみています。後者はGTXの中でもエントリークラスの**50-**60あたりを見てみると意外とその程度の消費電力で動くものがありそうです。

    基本、GPUが推論・学習等で動く場合、すべてのコンポーネントがフルパワーで動き得ます。llama.cppを動かすときなんかそうですが、

    追加電源用コネクタがない

    追加電源用コネクタ、何それおいしいの?と言われるような時代の代物な上、その中でも省電力をうたう見掛け倒しサーバなので、当然電源コネクタの取り揃えも貧弱でして・・追加電源用コネクタとかそんな先進的な代物がありません。

    ただ、ペリフェラル4ピンという、古くはIDE時代のディスクから使われてる4ピン電源コネクタは1つありました!これを追加電源用のコネクタとして使う方向でいこうかと。そこで、採用する追加パーツですが、少なくともこれは必要になってきます。

    ペリフェラル4ピン→PCIExpress 8ピン変換コネクタ

    これはもう買い出しに行くのも妻の助けを借りんと駄目な状況なので、ヤフオクでぽちー・・・

    PCI-Express 2.0であること

    PCI-Expressのバージョンはやっぱり古く、なんとバージョン2.0です。
    PRIMERGY TX140 S1に搭載されている拡張スロットは

    • PCI-Express 2.0 x16レーン x1
    • PCI-Express 2.0 x4レーン x1 (スロット形状はx8)
    • PCI-Express 2.0 x1レーン x1 (スロット形状はx4)

    という作りになっており、x16レーンのスロットがあるので何とかなりそうです。
    画面表示は特に想定していないので。

    まさに奇跡の塊のようなサーバですが、必要な何かというのはある程度取り揃えられてます。

    選んでポチー

    上記の中で最もネックなのはやっぱり電源です。消費電力残り160Wってなると、RTX 3060/12GBすら取り付けられません(こやつは170W)。省電力タイプとなると、一番低いものでNVIDIA T600当たりのものが50Wだったりしますけれども、これはこれでメモリが足りない。そんな中でGPUを探索することになりました。

    GTX1660 SuperとTuringコアTU116のご尊顔(Techpowerup.comから引用しました)

    で、結果として選んだGPUは GTX 1660 Super となりました。
    全体で14,000JPYほどですが、ヤフオクでゲットしておりまして、スペックとしては以下のような感じです。

      項目備考
      GRAPHICS PROCESSORTU116Turing世代、2019年ごろの製品
      CUDA Cores(Shader)1,408主な計算ユニット
      Clock Speeds1,530 MHz通常時のクロック最大周波数
      Boost Clock1,785 MHzブースト時のクロック最大周波数
      Performance10.05 TFLOPSfp16計算時
      Tensor Coreなし世代はある時代のものだが、GTXラインナップにはない(RTX以上)
      VRAM6 GBGDDR6 搭載
      TDP120 W追加電源コネクタ8ピンx1有
      Bus InterfacePCIe3.0 x16一応バージョン1.0ずれならつながるはず(という前提・・)

      本当はTensorCore搭載製品を探したいところですが、そうなった瞬間に消費電力がもんにょりする感じになること、本体価格が比較的安価というところでこれを選択しています。近所の中古ショップだとだいたい実売ベース16,000円ぐらいですが、少し安めに手に入れました。

      オークションを使った理由は単純にヤフーポイントがだいぶたまっていたため、実支出が少なかったことも一つの要因です。少なくともSandy Bridgeよりはテンソル計算速かろう・・ということで。
      Quadro P2200とかも候補に入りましたし、同じTuringコアのNVIDIA T600とかも考えたのですが、こちらはこちらでメモリが4GBと少し厳しい。結局メモリ容量を優先する形にしました。

      最大のネックの消費電力も、最大120Wなので、長時間バッチ処理しない限りは何とかなるかな?という具合です。PCI-Expressバスから最大75W供給されるわけですが、残る45Wは4ピンペリフェラルから供給されることになります。5V想定でちょうど45Wが定格上限となります。

      今持ってるTX140 S1では、片系が光学ドライブにしか使われていない系統がありますので、これを用いる方向にしたいと思います。

      ひとまず荷物の着荷を待つことにしますが、果たしてどうなることやら・・

      コメント

      タイトルとURLをコピーしました