Artificial Intelligence

RTX3050で何ができるか?

安価なGPUでできることを模索してみる昨今Xを眺めていると、えらく高価なGPUでローカルLLMをぶん回してる話題がたくさん飛び交ってます。やれ、DGX-Spark(当初60万→現在100万ぐらい?)だの、RTX5080(20万円前後)だの、...
Artificial Intelligence

環境構築:CUDA入れていきましょ

とりあえずはCUDA導入に必要なことGPUはそろえたんで、次はそれを認識するための導入手順を抑えときましょということで書いています。必要な手順、実はここにだいたい書かれています。ほかのプラットフォーム・OSに関する情報もありますので、参考に...
Artificial Intelligence

環境構築:古いワークステーション仕入れました

PRIMERGY TX140S1には荷が重すぎたため、ひとまずつなぎとしてワークステーションを一台追加することにしました。今回追加したのは往年の名機(?)HP Z440です。本体メモリは8GBのECC Registered DDR4メモリを...
日々徒然

FILCOのキーボード

老舗FILCOが閉業してしまったとのことで、巷をにぎわせていますが、先日ハードオフに行ったら売ってあったのでついつい手が出ました。保守系がどうなっていくか不安な声がささやかれてますが、非常に品質の良いキーボードが作られてきたということで、何...
日々徒然

近況+ポータルサイトを生成する

4/27に退院しました。現在引き続きのんびり過ごしております。今後の予定としては引き続き体調の立て直しイベントが盛りだくさんでございまして、耳のケロイド手術があったり、精神科のカウンセリングが再開したり、開業申請があったり、環境構築があった...
Artificial Intelligence

アーキテクチャの違いで何が変わるのか?

アーキテクチャの違いで言語モデルの動きに差が出るのか?というところがなかなかピンとこないことがあります。特にDeepLearningモデルの領域では、ことあるごとに新しい仕組みが生まれては世代が変わり、それが学習の差によって出るものなのか、...
Artificial Intelligence

llama.cppにおけるKVキャッシュ量子化について

KVキャッシュ量子化を軽々しく使うとつらい目に遭ったというタイトルで始めたんですけど、気づきは本当に偶然です。GPUSOROBANのインスタンスでllama.cppとLiteLLM連携の検証をしたときに気づいた話です。KVキャッシュというも...
昔取った杵柄

コンテナ内部でsystemctlみたいなことをしたい

以前紹介した GPUSOROBAN ですが、コンテナを払い出すサービスとして紹介をしました。それ故に通常のVMではできることができないポイントなんかあったりします。例えば systemctl が使えません。これを使うためにホスト側でいじる内...
Artificial Intelligence

メモリの帯域は馬鹿にならない

ローカルLLMを動かすときの重要なカギ:メモリ帯域ローカルLLMやSLMを使用するとき、皆さんはどういうグラフィックボードを使用されるのでしょう?大体は安価な製品なちょい古めの・・そう、例えばRTX3060-12GBみたいなものを使って動か...
Artificial Intelligence

GPUSOROBANというサービスを使う

皆さんはGPUSOROBANというサービスをご存じだろうか。3年ぐらい前に、格安のGPUサービスってないものか・・・と探してみた当時から、格安GPUサービスとして提供が行われていたが、確かに格安だったのは覚えている。ただ、当時の用途が3Dツ...