時々X.comを見てみると
初めまして。ゆういと申します。
今や気づけばいろんな人がAIと向き合ってああでもない、こうでもないとか、中にはAPI型こそ至高!いやいや、ローカルLLMこそ究極!なんぞおいしんぼならぬAIんぼみたいな展開になってるところもちらほら見えたりして、私もそんなところにいろんな考えを見かけては一喜一憂することも少なくないです。
私のAIに対する向き合い方はどちらかというとITインフラストラクチャ的な観点から向き合うことが多いです。理由は簡単、「もともとITインフラエンジニアだったから」です。20年ぐらいITインフラエンジニアを続けていて、その後新技術の探求をする部門に異動して、その過程でDeepLearningというものに関わりました。
ITインフラストラクチャの観点でDeepLearningモデルとどう向き合うのか?というと、どんなハードにどんなGPUが組み込めるか、どのような設定が必要かというのはかなり手探りで今日まで4年ほどかけて整理し続けてきましたし、運用・監視の在り方とかZABBIXを通じて調べて実装とかしてますし、そんなところですかね。
llama.cppにわざわざ手を出してるのはより最適化したコード、厳密な意味でバイナリ化して動かす特性からそれを気に入って使用していますけれど、ログを通じていろいろ指標をとりやすかったというところも一つ大きなポイントになってるんじゃないかという気がします。
それ故にどういう使い方をしてるかというと
- llama.cppを使って推論エンジンを構築し、それをサービス化する
- Embedding, Rerank, Translateは大体そう
- より少ないリソースで動かす、しかしながら品質的なところは経験上4bit quantizeがボーダーライン
- Difyを使ってWebフロントエンド及びエージェントロジックを構築して、簡単に触れる簡易アプリを作って使う
- Hermes Agentはそれこそ会社辞めてから触り始めました。あれのSkillsは「うわすごいな」と思いながら見てますが、まだ全然使いこなせてはいません
- Difyはソース含めて追いかけています
- 会社員時代に比べるとあまり追いかけられてないけど、0.10.x~1.13.0ぐらいまではかなりディープに見てた。ただしPython部分に限る
という感じで、私自身の習熟度・志向というかは以下の通りです。
- 使い方についてはかなりへたくそ
- 計測等はまだまだ手作業に頼るところが多くて、効率化できてない
- Instructionの与え方はあまり上手ではない(つまり、Prompting系は苦手)
- モデルの構造に関して特に好奇心が強くて、このあたりはGemma-1が登場したあたりからずっと主要なものは追いかけている
- ただし、個人的には32B以下のモデルにしかあまり興味はなくて、SLMばかり追いかけてると思う
- こてこてのローカルLLM派
- なんでそれが文章を出力できてるの?というのをきちんと知りたいのが発端で、API型はAPI型で優れてるのは認めている。
- ただ、昨今あんだけ世界がいろんな事象で振り回される中、昔よりは今のほうが海外製品はより不安定になるけど大丈夫?って割と心配してる派
- ユーザ規約を書き換えていきなり金回収しようとするのは過去では某神がかったDB作ってる会社があれこれやってたぐらいだけど、某大統領があんな強気になってるのを縦にして色んな企業が某大統領みたいな振る舞いするようになってるんだけど大丈夫?
- とある某社、いざというときはインターネット上からデータ消去して「そんな情報はない!」とか言い張るけど、そこらへん分かってる?
- ある日信頼性某製品に日本全国頼りまくってたら、とある某社が買収なんかしちゃったりして、そのころから気づいてた人はすぐに対応策見出して解決に走ったけど、その製品にいろんな縛りが加えられていろいろ身動き取れなくなり、以下略・・・・みたいなこと起きたけど大丈夫?
そういう意味で私は今どきの開発者さんたちみたいな使いこなし方は出来ませんし、API型LLMの扱いについてはそちらの方々のほうがより詳しいかと思います。逆に、モデル構造だったり、なぜモデルがああして言葉を紡げるかというメカニズムについては私の方がチョッピリだけ分かってる方かもしれないです。(いや、昨今みんなもっと詳しい人たちがいますので今や劣ってる側かも・・)
なので基本的にはどれが上、どれが下とかは考えませんで、ただ私に近しい人たちがDisられてるような現状には若干イラっとすることがあったりします。
十人十色、いろんな触れ方があるのだなと最近痛感しており、上記の通り現在地を記録してみたのと、ついでに私の即席について少し書いてみようと思ったのがこの記事です。単なるお気持ち投稿でごめんなさい。
AIとのお付き合いはブレイクするちょっぴりだけ前から
私のAIとのお付き合いは2022年の前半頃からです。まだGPT-3の存在すら知らん状況下で、DeepFake系ツールの存在を知ったあたりから取り組みを始めています。当時はまだLLMはそんなに発展してなくて、どちらかというと画像系のモデルがいろいろ動いていた時期でした。そのころからすでに会話では「AIがどうのこうの・・」というのが言われ始めており、ただ私は学生時代に人工知能の授業を受けていながら、そのころから盛り上がるAIの実態については全く理解が出来てませんでした。
そこで突如登場したのがStable Diffusionであり、Whisperでした。
DeepFakeやLSTMに触れてもさっぱり理解に至れなかった私が、これらのモデルに触れていろいろ試してやっとDeepLearningに対して微かに手ごたえを感じ、そこではじめて知ったのがHuggingfaceでしたし、そこからリリースされるさまざまなライブラリ群であり、簡単にAIって手元に引き寄せられるんだ!ってことを知ったわけなんですけど。そっからもうどっぷりDeepLearningの世界に頭から突っ込んでおりまして、すっかり抜け出せなくなりました。
残念ながらそこからさらに深く理解するのにさらに1年半ぐらいを要したり、そっからの応用例をなかなか思いつかずに無駄な時間を過ごしたり、時にはそこに一条の光明が差すような企画が盛り上がったりとか、いろんな意味で面白い時期もありましたけど、総じて会社員時代はそれなりにAIと向き合うことができてました。
が、これがビジネスがものすごく難しい問題があったりするんですよね。私はそのあたりを乗り越えられずに会社で居場所を失った組に属しています。
現在地はこちら
ちょうど先月末をもって正式に退職となりまして。退職に至る中で実にいろんなことがいろいろあっていろいろな思いをしました。別途自己紹介的なページにも書いてますが、体にいろんな障害を抱えてしまったうえ、オカマさんにもなってしまった(正しくはMtFなんだけど)こともあり、転職ということ自体そうそう気軽に行えない状況だったりします。
とりあえずはこんな私でも目をつけてくれた人が幸い居まして、マイペースにできる仕事くれるということで、いったんはフリーという形態でやってみよう~としております。
社会人再復帰を目指して動き出してる状況という感じですかね。前みたいな働きができるかどうかは分かりませんで、でもまだまだAIと向き合うと面白いポイントも見つかりますし、あれやりたいこれやりたいみたいなのはありますし。今後も何かしら参考になるネタが展開できればなぁと思っています<(_ _)>
どうぞよろしくお願いしますでございます。



コメント