Dify-ナレッジ投入で早速躓く

タイムアウトは大きめに設定を

さて、起動したDifyにとりあえずArxivで拾ったナレッジを取り込みたく操作してみれば「ああ、やっぱあの頃の環境は相当贅沢やったな」ということに気づく。DB処理がことごとくタイムアウトしておる。なので、まずは.envの修正から手掛ける。

SQLALCHEMY_POOL_TIMEOUT=300

デフォルトの設定では30なんだけど、とてもじゃないけどこのマシンが30秒以内にSQL ALCHEMYの処理を完結できるとは思えない。特に遅延があまり考慮されていない印象を受けるので、これに対して遅延時間を少々長めに設定。あとデフォルト4MBのPGSQL向けWORKING_MEMが異様に低い(4MB)なので、少し大きめに設定(64MB)、共有バッファは元から修正していて128MBから1GBにしており、いったんこれで試したところうまく処理が開始できた。

なぜかいきなりクォーターに達するEmbeddingモデルたち

加えて、なぜかAOAI経由でtext-embedding-3-smallを動かすとエラー429が出てレートリミットを超えたため、これまたいろいろプロバイダ試したところ、VertexAIならいけることが分かり、この中のmultilingual-text-embeddingモデルを使用することに。
このマシン、llama.cpp動かすにもたぶん息切れするので、あまり無理はさせられない・・

そしたらやっとこさプロセッシング可能に。

チャンキング→Embedding→PGSQLにストア→Weaviateへ

基本的にまずEmbeddingされる情報は先にPostgreSQLにストアされるのか、チャンキングとEmbeddingをしてる最中は実はそれほどweaviateには負荷がかからない。ただひたすらPlugin_daemonがinvoke処理一筋で頑張り、次々とdb_postgresqlへ送り込んでるようだ。