昔取った杵柄

モデルの構造をも少し細かく覗く

再掲:Qwen3.5-Denseモデルを例に以下は、Qwen3.5モデルの1例をとってその構造を描いてみたのですが、実際のところどういう風にソースなどでは表現されているのでしょうか?Qwen3.5-2Bのニューラルネットワークソースで見たい...
昔取った杵柄

Qwen3.5-2Bについて

せっかく調査の際に構成図を書いたので、それを貼っておきます。Qwen3.5-2BのニューラルネットワークQwen3.5の特徴は、それ以前に出てたQwen3-Nextの構成を踏襲しているところです。一般的に、上図のGDN/GAは全く同じ仕組み...
昔取った杵柄

VertexAIによる外部サイト検索(制限付き)の構築

さて、先に書いた以下の記事の通り、フルWeb検索ダメじゃん・・って落ち込んだ私ですが、Gemini仕様が教えてくれました!いくつか制限はあるけど、Web検索できるようにするものが可能だ!ということを。なので、今回はそれに倣って検索エンジンを...
昔取った杵柄

VertexAI Search だめぢゃん(´・ω・`)

VertexAIはまだ苦戦してるけど、ちょっと使ってみて、少し違和感を感じ、どーしても気になるからGemini師匠に相談したんだ。そしたらこんな答えが返ってきたんだよ・・・・だめぢゃん・・(´・ω・`)Vertex AI Search(En...
昔取った杵柄

VertexAI Searchを使うために(2)

まさかMCPサーバを作ることになるとは・・更新:2026/04/01 10:15改修箇所が増えたので、そのソースを追加しています。(src/vais_mcp/vais.py)認証トークンの寿命は1時間しかないVertexAI Searchの...
昔取った杵柄

VertexAI Searchを使うために

意外とめんどくさいっす。VertexAI Search使うの。そういう意味だと、SerpAIで行けるのであれば、それを使ったほうが幸せ・・・・かも・・・しれぬ(がくっ)まず、VertexAIを構成するこれ自体の構築手順は至極全うで、以下のよ...
昔取った杵柄

KVキャッシュとは

先の投稿でKVキャッシュの容量について話題を出したので、これを掘り下げて解説することにしました。トランスフォーマー型LLM/SLMにおける基本的な動き基本的にこの手のLLM/SLMはこんな動きをしてる。AIモデルは、特にBi-Directi...
昔取った杵柄

延々と「ちょまてよ!」を繰り返すQwen3.5

今日、半分試運転の意味でllama.cppを自宅マシンに突っ込みまして。そしてQwen3.5-2Bモデルをぶち込んでみました。ざっくり速度評価:正直奇跡だと思った今回の場合、大体トークン処理速度は 6 toks/s なので決して遅くはないで...
昔取った杵柄

Google Custom Search EngineもVertex AI Searchもわからないんで。

こんなしょーもないワークロードツールを作りました。タイトルのあれはいったい何?って話なんですが、そもそも新しく作るGoogle Custom Search Engineって一般Web検索がもうできなくなってるんですね。そういう風にCSE側の...
日々徒然

割と勘違いされていること

私自身、話を聞いてびっくりすることなんだけど、以下のような印象を持たれていたりする。リモートワークを望んでやってそう会話は苦手そう人と触れ合うことも苦手そういいえ、実際には私はこれです。人と会話するのは大好きですリモートワークよりオンサイト...