PRIMERGY TX140 S1に刺さるGPUはあるか?
前回、Gemma4-E2Bを試した際に痛感したことが一つ。
「やっぱりGPUないとつらいわ・・・」
最新のマシンだったらCPUでもある程度の推論が可能ですが、Gemma4を試した際に実はInput文字列を取り込む処理も6Tok/sであることを知ってしまい、「やっぱそうなるよねー」ということでGPUを探索することに。

しかし、今動かせる自宅マシンは、以前ならばいざ知らず、持ってるマシンはPRIMERGY TX140 S1しかありません。こいつにはいくつか弱点があります。
- PCI-Express 2.0である
- 電源容量が300Wしかない
- 追加電源用コネクタがない
これを乗り越えて実装可能そうなGPUを探しました。
電源容量が300Wしかない
はい、このマシン、本体のフレームは立派な分厚いスチール製なのですが、電源容量は標準型電源ですけれども、一応80PLUS-GOLD仕様ではあるものの、電源容量はたったの300W!やばい。
とりあえずCPUのTDPを調べると80Wであることは確認しました。その他、以下のパーツ容量については一定の確認をしました。
| コンポーネント | 電力使用量 |
|---|---|
| メモリ(DDR3 SDRAM) | 1-3W/枚 |
| ハードディスク(SATA 3.5インチ) | -10W/個 |
これで考えると、およそメモリに12W程度、HDDに40Wほど電源を使われてそうです。
合計すると132Wなので、最大値として、140Wほど既存コンポーネントでメモリを消費してそうです。残り160Wで何とかする必要があります。調べてみると
- 旧Quadroラインのワークステーション向けGPUを使用する(ただしエントリークラスのSingleSlot版)
- GeForce GTXのエントリークラス
前者は昔のPascalやTuringコアでもエントリークラスではおよそ50-75W程度で使用できるGPUがそこそこ転がってましたので、これを当てにしてみています。後者はGTXの中でもエントリークラスの**50-**60あたりを見てみると意外とその程度の消費電力で動くものがありそうです。
基本、GPUが推論・学習等で動く場合、すべてのコンポーネントがフルパワーで動き得ます。llama.cppを動かすときなんかそうですが、
追加電源用コネクタがない
追加電源用コネクタ、何それおいしいの?と言われるような時代の代物な上、その中でも省電力をうたう見掛け倒しサーバなので、当然電源コネクタの取り揃えも貧弱でして・・追加電源用コネクタとかそんな先進的な代物がありません。
ただ、ペリフェラル4ピンという、古くはIDE時代のディスクから使われてる4ピン電源コネクタは1つありました!これを追加電源用のコネクタとして使う方向でいこうかと。そこで、採用する追加パーツですが、少なくともこれは必要になってきます。

これはもう買い出しに行くのも妻の助けを借りんと駄目な状況なので、ヤフオクでぽちー・・・
PCI-Express 2.0であること
PCI-Expressのバージョンはやっぱり古く、なんとバージョン2.0です。
PRIMERGY TX140 S1に搭載されている拡張スロットは
- PCI-Express 2.0 x16レーン x1
- PCI-Express 2.0 x4レーン x1 (スロット形状はx8)
- PCI-Express 2.0 x1レーン x1 (スロット形状はx4)
という作りになっており、x16レーンのスロットがあるので何とかなりそうです。
画面表示は特に想定していないので。
まさに奇跡の塊のようなサーバですが、必要な何かというのはある程度取り揃えられてます。
選んでポチー
上記の中で最もネックなのはやっぱり電源です。消費電力残り160Wってなると、RTX 3060/12GBすら取り付けられません(こやつは170W)。省電力タイプとなると、一番低いものでNVIDIA T600当たりのものが50Wだったりしますけれども、これはこれでメモリが足りない。そんな中でGPUを探索することになりました。

で、結果として選んだGPUは GTX 1660 Super となりました。
全体で14,000JPYほどですが、ヤフオクでゲットしておりまして、スペックとしては以下のような感じです。
| 項目 | 値 | 備考 |
|---|---|---|
| GRAPHICS PROCESSOR | TU116 | Turing世代、2019年ごろの製品 |
| CUDA Cores(Shader) | 1,408 | 主な計算ユニット |
| Clock Speeds | 1,530 MHz | 通常時のクロック最大周波数 |
| Boost Clock | 1,785 MHz | ブースト時のクロック最大周波数 |
| Performance | 10.05 TFLOPS | fp16計算時 |
| Tensor Core | なし | 世代はある時代のものだが、GTXラインナップにはない(RTX以上) |
| VRAM | 6 GB | GDDR6 搭載 |
| TDP | 120 W | 追加電源コネクタ8ピンx1有 |
| Bus Interface | PCIe3.0 x16 | 一応バージョン1.0ずれならつながるはず(という前提・・) |
本当はTensorCore搭載製品を探したいところですが、そうなった瞬間に消費電力がもんにょりする感じになること、本体価格が比較的安価というところでこれを選択しています。近所の中古ショップだとだいたい実売ベース16,000円ぐらいですが、少し安めに手に入れました。
オークションを使った理由は単純にヤフーポイントがだいぶたまっていたため、実支出が少なかったことも一つの要因です。少なくともSandy Bridgeよりはテンソル計算速かろう・・ということで。
Quadro P2200とかも候補に入りましたし、同じTuringコアのNVIDIA T600とかも考えたのですが、こちらはこちらでメモリが4GBと少し厳しい。結局メモリ容量を優先する形にしました。
最大のネックの消費電力も、最大120Wなので、長時間バッチ処理しない限りは何とかなるかな?という具合です。PCI-Expressバスから最大75W供給されるわけですが、残る45Wは4ピンペリフェラルから供給されることになります。5V想定でちょうど45Wが定格上限となります。
今持ってるTX140 S1では、片系が光学ドライブにしか使われていない系統がありますので、これを用いる方向にしたいと思います。
ひとまず荷物の着荷を待つことにしますが、果たしてどうなることやら・・



コメント