cloud

Google Cloud

VertexAI Searchを使うために(2)

まさかMCPサーバを作ることになるとは・・更新:2026/04/01 10:15改修箇所が増えたので、そのソースを追加しています。(src/vais_mcp/vais.py)認証トークンの寿命は1時間しかないVertexAI Searchの...
Google Cloud

VertexAI Searchを使うために

意外とめんどくさいっす。VertexAI Search使うの。そういう意味だと、SerpAIで行けるのであれば、それを使ったほうが幸せ・・・・かも・・・しれぬ(がくっ)まず、VertexAIを構成するこれ自体の構築手順は至極全うで、以下のよ...
Artificial Intelligence

KVキャッシュとは

先の投稿でKVキャッシュの容量について話題を出したので、これを掘り下げて解説することにしました。トランスフォーマー型LLM/SLMにおける基本的な動き基本的にこの手のLLM/SLMはこんな動きをしてる。AIモデルは、特にBi-Directi...
Artificial Intelligence

延々と「ちょまてよ!」を繰り返すQwen3.5

今日、半分試運転の意味でllama.cppを自宅マシンに突っ込みまして。そしてQwen3.5-2Bモデルをぶち込んでみました。ざっくり速度評価:正直奇跡だと思った今回の場合、大体トークン処理速度は 6 toks/s なので決して遅くはないで...
Google Cloud

Google Custom Search EngineもVertex AI Searchもわからないんで。

こんなしょーもないワークロードツールを作りました。タイトルのあれはいったい何?って話なんですが、そもそも新しく作るGoogle Custom Search Engineって一般Web検索がもうできなくなってるんですね。そういう風にCSE側の...
Artificial Intelligence

Dify-ナレッジ投入で早速躓く

タイムアウトは大きめに設定をさて、起動したDifyにとりあえずArxivで拾ったナレッジを取り込みたく操作してみれば「ああ、やっぱあの頃の環境は相当贅沢やったな」ということに気づく。DB処理がことごとくタイムアウトしておる。なので、まずは....