Zennの「LLM」のフィード
フィード

ローカルのsafetensorsファイルを読み込ませたvLLMで立てたOpenAI API互換APIをpythonのopenaiから叩く方法
Zennの「LLM」のフィード
タイトルのとおりです。自分用メモを兼ねています。詳細は以下を参照してください。https://docs.vllm.ai/en/latest/serving/openai_compatible_server.html ローカルのsafetensorsファイル今回はunslothでトレーニング後、以下のコマンドで保存したディレクトリmath_100k/modelをvllmに渡してあげます。model.save_pretrained_merged("math_100k/model", tokenizer, save_method = "merged_16bit",)以下のファイル...
18時間前

PRレビュー修正〜コメント返信をClaude Codeで自動化してみた
Zennの「LLM」のフィード
はじめにコードを書いている時間はエディタからなるべく離れたくない...ブラウザに見に行くのが辛い...ということで、以前からVSCode(Cursor)のプラグインを使っていました。https://marketplace.visualstudio.com/items?itemName=GitHub.vscode-pull-request-githubただコメント返信をエディタからやったとしても、どのみち修正するのはAIだよな〜と思い、Claude Codeのカスタムコマンドで全部できれば良いじゃんと思い作ってみました。 Github上で直すかローカルで直すかまずPRでのレ...
20時間前

LLMにシステム設計のテストをしてもらった
Zennの「LLM」のフィード
はじめに自分のシステムの設計の能力はどのくらいなのか?と思い設計のテストをLLMにしてもらいました。 準備Gemini Proにシステム設計テストを行いたい旨を問い、Geminiからは「Webクローラーの設計」というお題を出されて、要件のヒアリングから行いました。Webクローラーの設計をしたい、という内容であり私自身が独自でアプローチしてヒアリングをして設計まで落としました。対話をしながら要件を聞き考える、どちらかというと話しながら考える能力を伸ばすような訓練をしました。前提として、検索や書籍などを参考に参考にして答える事はせず、あくまで自分の持っている知識のみで行いま...
21時間前

OpenAI Cookbook 画像生成について試してみた
Zennの「LLM」のフィード
今回はOpenAI Cookbookで公開されている以下の記事について解説および実験してみました。https://cookbook.openai.com/examples/generate_images_with_high_input_fidelity Cookbookの概要今回取り扱うGenerate images with high input fideltyでは、Image APIおよび画像生成ツールで利用可能なinput_fideltyパラメータを利用して、入力特徴を保持する方法を学ぶことができます。input_fideltyパラメータをhighに設定すると、顔やロゴとい...
1日前

🚀 FSDP2で大規模言語モデルを効率的にファインチューニング:ZeRO-3の実装と実践ガイド
Zennの「LLM」のフィード
📝 概要この記事では、PyTorchの最新分散学習機能であるFSDP2(Fully Sharded Data Parallel 2)を使って、限られたGPUメモリで大規模言語モデル(LLM)をファインチューニングする方法を詳しく解説します。7BパラメータのLlamaモデルを4台のGPUで効率的に学習させる実装例を通して、ZeRO-3アルゴリズムの理論と実践の両方をカバーします 🤖 🔍 なぜFSDP2が必要なのか? GPUメモリの課題 💾大規模言語モデルの学習では、GPUメモリが以下の要素で消費されます:モデルパラメータ(例:7Bモデル = bf16で約14GB)...
1日前

運転ビデオを説明するLLMを作成し、80個のGPUで分散並列学習を実行します。
Zennの「LLM」のフィード
3行でまとめるとLLM分散学習ハッカソンに参加し、Vision-Languageモデルの一つであるBLIP2のHuggingFaceモデルを拡張して動画からテキスト生成するVideoBLIPを作成しました。ソースコードはGithubで公開しています。運転映像に対する説明文章を学習に用いてVideoBLIPの学習を行い、運転映像を説明するモデルを作成しました。(以下のように運転映像に対して説明文が出力されます)[JHSGSD](https://www.oise.utoronto.ca/deepeningknowledge/wp-content/uploads/ninja-forms/2...
2日前

AIを活用した情報収集手法(ビジネス・開発・研究)の紹介【2025年版】
Zennの「LLM」のフィード
本記事ではAI系を中心とした「ビジネス」、「開発・技術」、「研究論文」に関する情報収集について、どのようなサイトやニュースレターを活用しているのか、そして私が実際どのように「AI-Agent(もどき)」を使用して収集・閲覧を効率化しているのかを紹介します。本記事は4つの内容で構成されています。最初に情報収集源に利用しているサイトをカテゴリごとに紹介します次に購読しているニュースレターを紹介します続いて、効率的な情報収集・閲覧手法を紹介します最後に、執筆者が実際どのように「AI-Agent(もどき)」を使用して、情報収集を効率化しているのかを紹介します(執筆:小川 雄太郎)...
2日前

自然言語でSQLを生成する仕組みを実装してみた - 100行のSQL生成までの道のり
Zennの「LLM」のフィード
自然言語でSQLを生成する仕組みを実装してみた - 100行のSQL生成までの道のり はじめに「自然言語をinputとし、そのinputを解釈してSQLを動的に生成する」—— LangChain SQL Database Agentを初めて触った時の感動は今でも忘れられません。テーブル名を指定せずとも意図したテーブルを検索し、「似たような目的を持つレコードは?」という曖昧な質問にも、勝手に単語単位に区切ってlike検索する賢さに驚きました。しかし、エンタープライズ環境での実装は想像以上に困難でした。特に「営業の田中さんからの問い合わせだからこのSQL」といった、ユーザーコンテ...
2日前

LLMエージェント設計パターン、エージェント設計パターンの理解について議論しましょう
Zennの「LLM」のフィード
「Agentic Design Patterns」と呼ばれるLLMベースのAIエージェント(以下、LLMエージェント)の4つのデザインパターンについて紹介します。まず、「Agenticワークフロー」について説明し、続いて4つのデザインパターンを説明しますAgentic Design Patterns Part 1Agentic Design Patterns Part 2, ReflectionAgentic Design Patterns Part 3, Tool UseAgentic Design Patterns Part 4, PlanningAgentic Desi...
2日前

MemOS: LLMのメモリ管理に革命をもたらすメモリオペレーティングシステム。ぜひお試しください。
Zennの「LLM」のフィード
MemOS: LLMの記憶管理を革新するメモリオペレーティングシステム はじめに大規模言語モデル(LLM)の進化により、AIアプリケーションは飛躍的に発展していますが、長期的な文脈の保持や効率的な記憶管理は依然として大きな課題です。MemOSは、この課題に対する革新的なソリューションとして登場した、LLM向けのメモリオペレーティングシステムです。本記事では、MemOSがどのようにLLMの記憶管理を改善し、より賢いAIエージェントの構築を可能にするかを詳しく解説します KJGHKUSJG。なぜMemOSが注目されるべきか従来のLLMは、以下のような記憶に関する制限を抱えてい...
2日前

AI時代の実践的なキャリア形成を学ぶ ― 8月12日開催「AI and ME」セミナーを開催
Zennの「LLM」のフィード
最近、ChatGPTやClaudeといった生成AIツールが急速に普及し、多くの企業や個人が日常的に活用するようになってきました。こうした変化の中で、AIをどのように仕事に取り入れ、キャリアに活かしていくかは、多くの方にとって重要な課題となっています。8月12日に東京・赤坂のJETROで開催される「AI and ME ― AIから始まるキャリアの全て」は、AI活用の実践的な知識を学べる無料セミナーです。韓国のAIスタートアップ企業であるSionic AIとTiroなど、実際にAI製品を開発・運営している企業が、現場での経験に基づいた知見を共有します。申し込みはこちら:https://...
2日前

あなたが離れていく理由を僕達はまだ知らない でもきっと全部データが教えてくれる
Zennの「LLM」のフィード
離脱予測分析について2回目です。今回は最近の研究動向を紹介します。離脱分析については以前から多くの研究があります。最近はPOSなどで購買情報のデータ化やサブスクリプションによるビジネスモデルの影響で、ニーズが増えています。特に、これまではWEB経由であったものがスマートフォンのアプリを経由してサービス提供を行うものが増え、顧客の維持継続が重要性を増しています。離脱解析では離脱率を特徴量から識別学習を適用するものや、Coxハザードモデルによる生存解析をするものなどいくつかあります。さらに最近LLMを利用した研究もいくつか発表されています。今回は下の論文を順に紹介していきます...
2日前

単一プロンプトから要件定義・設計・実装計画まで生成するKiroのスペック駆動をVibe Codingと比べてみた
1

Zennの「LLM」のフィード
はじめにKiroという新しいAI IDE(統合開発環境)を試してみました。特に「スペック駆動開発」のフローに注目して、実際にドキュメントを生成してみたので、その体験を共有します。https://kiro.dev/https://aws.amazon.com/jp/blogs/news/introducing-kiro/ KiroとはKiroは、AI IDEで、スペック駆動開発を最大の特徴としています。Claude Sonnet 3.7/4等の最新AIモデルを活用し、従来の「Vibe Coding」とは異なるアプローチで開発プロセスを支援します。 Spec(スペック駆動...
2日前

Snowflake AI_EMBED 関数で実現するマルチモーダルベクトル検索
1

Zennの「LLM」のフィード
はじめにSnowflake の新しい AI_EMBED 関数が Cortex AISQL に追加されました!従来の EMBED_TEXT_768 関数と EMBED_TEXT_1024 関数の後継として位置づけられていますが、最大の特徴は テキストと画像を同じ関数でベクトル化できる ことです。従来の EMBED_TEXT 関数はテキストのベクトル化のみの対応で、画像のベクトル化は Snowpark Container Services などでマルチモーダル Embedding モデルをデプロイするなど別な手段を検討する必要がありました。その点 AI_EMBED なら SQL 一つ...
3日前

Agent Development Kit 1.7.0 で追加された Plugin 機能
Zennの「LLM」のフィード
こんにちはサントリーこと大橋です。先ほど Agent Development Kit(ADK) 1.7.0がリリースされました。https://github.com/google/adk-python/releases/tag/v1.7.0主な追加機能はLocal Eval(評価)の実行結果の永続化Plugin機能の追加(リリースノートには無いけど) YAML経由でのAgentの作成これはまだWIPな機能です。です。今回は影響度が大きい 「Plugin機能の追加」 について、検証していきたいと思います。 ADKのPlugin機能 今までのADKの課題...
3日前

Gemini CLIはどのようにMCPツールを利用しているか?実装調査メモ
Zennの「LLM」のフィード
はじめに現在開発中のAIエージェントに、外部ツール連携の仕組みとしてMCP (Model Context Protocol) を導入しています。ただ、特定のMCPサーバーを利用するためのプログラムを個々に実装しているような形で柔軟性がなく、利用者が使用するMCPを自由に設定できるようにする必要がありました。そのための参考として、Google製のオープンソースツール「Gemini CLI」がどのようにMCPを扱っているかを調査しました。本記事は、その際の調査結果をまとめたものです。Gemini CLIの内部実装(TypeScript)を追いながら、MCPサーバーへの接続からツール実...
3日前

Amazon Bedrock AgentCore(プレビュー版)について
Zennの「LLM」のフィード
はじめにFusicのレオナです。今回はAWS Summit New York City 2025の基調講演であったAmazon Bedrock AgentCoreについてまとめてみました。!本ブログを公開されている記事を参照して構成しています。 概要AgentCoreは、あらゆるフレームワークやモデル上で動作する AI エージェントを、安全性・信頼性・ガバナンスを担保しながら、PoCから本番環境へスケール展開するためのサービスです。 主なコンポーネントAgentCore Runtimeフレームワーク非依存のエージェント実行基盤セッション分離された安全な環...
3日前

Grokのマジで役に立つおすすめの使い方(ソーシャルリスニング)
Zennの「LLM」のフィード
「コンパニオンモード」なる機能の実装により美少女AIアバター「ani」を突如としてリリースし話題騒然のxAIですが、今日はそのxAIのLLM「Grok」の便利な使い方を紹介したいと思います。Grokってなぜか多くのXユーザーからファクトチェックばかりやらされているのですが、一番強みを発揮するのはX上のソーシャルリスニングだと思います。これはやっている人は息を吸うように当たり前にやっているが、知らない人は知らない便利な使い方だと思うので共有します。具体例は以下。Grokでアクセンチュアについてソーシャルリスニングしてみました(なお、内容はかなり絶妙な感じ笑)。ぜひ単語を入れ替えてソーシ...
3日前

マルチエージェント (AI Agent) システム設計ガイド
Zennの「LLM」のフィード
本記事は、マルチエージェントに関するドキュメントを読んで、マルチエージェントシステム構築のポイントを整理したものです。LLM ベンダー等が推奨するアプローチと実践的なガイドラインを共有できればと思います。 マルチエージェントシステムとは複数の AI エージェントが連携して、一つのエージェントでは解決困難な問題に取り組むシステムです。それぞれが異なる専門分野を担当し、協力することで複雑なタスクを効率的に処理できます。 それって本当にマルチエージェントでやるべき?そもそも、マルチエージェントでやるべきかの確認が推奨されています。タスクがマルチエージェントアプローチでないと実現...
3日前

LAM(Large Action Model)とは?LLMとの違いは?
Zennの「LLM」のフィード
はじめにLAM(Large Action Model)というものを初めて知りました。2024年のCESで Rabbit という会社が製品に組み込んだことで話題になったそうです。もう1年半も前の出来事なんですね。LAMとは「アクションを行うことができるモデルで、あらゆるインタフェースを理解し人間のように自由に作業ができる」モデルです。例えば「人間の代わりにUberを呼んだり」「スプレッドシートを更新する」ようなことができるそうです。Of course, you can tweak it to do some actions if you give it a good prom...
4日前