LLM

Artificial Intelligence

論文翻訳品質確認をしてみたよ。

Hy-MT2-1.8Bの実力を測ってみたTencentが公開した中で、軽量モデルであるHy-MT2-1.8Bについて評価をしてみました。Tencentは中国企業の中でもかなり初期段階からDeepLearningの画像系処理でもろもろ取り組ん...
Artificial Intelligence

AIとの向き合い方は人それぞれ+ご挨拶

時々X.comを見てみると初めまして。ゆういと申します。今や気づけばいろんな人がAIと向き合ってああでもない、こうでもないとか、中にはAPI型こそ至高!いやいや、ローカルLLMこそ究極!なんぞおいしんぼならぬAIんぼみたいな展開になってると...
Artificial Intelligence

LFM2.5-8B-A1Bというモデルを見てみる

超高速に答えを返すモデルLFM2.5-8B-1Aはそのモデル名を見てわかるように、総パラメータ数は8B(実際は8.5B)、アクティブパラメータは1B(実際は1.5B)のMoE(Mixture of Experts)モデルです。実はこの前身と...
Artificial Intelligence

Hermes AgentでMCPサーバが使いたいよ

続いて今度は、このエージェントツールでMCPサーバを使うための方法について。やっぱりMCPサーバの存在って非常にありがたいもので、いろんな意味で情報探索であったり、最新情報の適用であったりと様々な局面で活躍してくれます。その登録方法は非常に...
Artificial Intelligence

Hermes Agentでターミナルバックエンドの環境を変更したいよ

ターミナルバックエンドとは?Hermes Agentを動かす際、ターミナルバックエンドを指定する必要があったりします。ターミナルバックエンドとは、例えばエージェントが実際にコーディングを行ったりそのアプリケーションをリリースしたりする際、実...
Artificial Intelligence

Hermes Agentでモデルを変更したいよ

今回は、Customモデルしか登録してない環境上でGemini APIの環境設定を追加しますです。環境設定まず、環境設定から修正します。$ vi ~/.hermes/.env$ vi ~/.hermes/.env以下の箇所、GOOGLE_A...
Artificial Intelligence

Hermes Agentなるものに触れてみたよ

最近いろいろささやかれてる中で、Hermes Agentというツールがあり、要はここ最近登場してるClaudeCodeだったり、Codexだったりーなものに似たようなものってざっくり理解してるのだけど、これを投入してみたなど。冒頭文を日本語...
Hardware

ZABBIXでNVIDIA-GPUを監視する際の注意事項

ZABBIXでは、NVIDIA-GPUを監視することが可能なのは会社員時代からよく理解しているんですが、そのプラグインの設定がUbuntu側の仕様に沿ってないらしいので備忘録として掲示します。参考URLは以下の通りです。本記事で記述している...
Artificial Intelligence

ガチでスクラッチから作ってみたいそんなあなたに

今、X.com上でこんなリポジトリが盛り上がってます。これ、何が入ってるかと言いますと、スクラッチでTransformerを使用したLLMを事前学習から始めるためのキットが詰まっています。全体構成全体構成は以下のようになっています。trai...
Hardware

CPUを交換したよ

本日CPUを交換しました。左は既存であったIntel Xeon E5-1630v3、右は新しく載せ替えたIntel Xeon E5-2690v4です。ヤフオク!さんにて、なんと5,000円でXeon E5-2690v4を購入しました。新品当...