通院しとるあいだに

こんな技術が爆誕していた。

TurboQuant: Redefining AI efficiency with extreme compression

KVキャッシュのメモリ節約技術みたい。これはもろに処理速度に影響する話だから、慎重にみていかなければと思うが、しかしどんな技術やろかね?

コメント

タイトルとURLをコピーしました