直近1週間の更新
7/19 (土)

Oracle MCP Server で In-Database AI エージェントのSELECT AI を使う Tips
AIタグが付けられた新着記事 - Qiita

この記事は?以前、「MCPが便利そうなので Oracle DB とおしゃべりする MCP サーバーを作ってみた」という記事で私家版超実験的 Oracle Database MCP サーバー(仮)を作っていろいろ実験した経験を書かせていただいたのですが、ついに Oracl...
29分前

Oracle MCP Server で In-Database AI エージェントのSELECT AI を使う Tips
生成AIタグが付けられた新着記事 - Qiita

この記事は?以前、「MCPが便利そうなので Oracle DB とおしゃべりする MCP サーバーを作ってみた」という記事で私家版超実験的 Oracle Database MCP サーバー(仮)を作っていろいろ実験した経験を書かせていただいたのですが、ついに Oracl...
29分前

Pydantic AIで作る「曖昧レシピ明確化の仕組み」- 実装してみた
LLMタグが付けられた新着記事 - Qiita

はじめに「玉ねぎをしんなりするまで炒める」「適量の調味料を加える」...料理レシピでよく見る曖昧な表現。初心者には分かりにくく、失敗の原因にもなりがちです。今回はPydantic AIを使って、曖昧なレシピを具体的な指示に変換するシステムを作ってみました。何を作...
1時間前

Pydantic AIで作る「曖昧レシピ明確化の仕組み」- 実装してみた
AIタグが付けられた新着記事 - Qiita

はじめに「玉ねぎをしんなりするまで炒める」「適量の調味料を加える」...料理レシピでよく見る曖昧な表現。初心者には分かりにくく、失敗の原因にもなりがちです。今回はPydantic AIを使って、曖昧なレシピを具体的な指示に変換するシステムを作ってみました。何を作...
1時間前

【因果推論】フォークとコライダーでシミュレーション!!
AIタグが付けられた新着記事 - Qiita

概要はじめに因果推論や因果探索を考える上で、重要な変数同士のパターンが3つある。コライダー(合流点)やチェーン(連鎖)、フォーク(交絡変数)と呼ばれるものだ。今日はコライダーとフォークに焦点を当て、なぜこのような考え方をすると因果推論がうまくいくのかを説明する。...
2時間前

Kiro Steering ガイド
AIタグが付けられた新着記事 - Qiita

Steering とは?Steering は .kiro/steering/ ディレクトリ内の markdown ファイルを通じて Kiro にプロジェクトの永続的な知識を提供します。Cursor の .cursorrules などの従来の方法が基本的な設定を提供するの...
2時間前

データ活用業界職種の業務・スキル
機械学習タグが付けられた新着記事 - Qiita

データ関連14職種を以下観点で整理します業務概要必要スキル各職種の整理データサイエンティスト業務概要:データ収集・整理・モデル構築・可視化を通じてビジネス課題解決に導く求められるスキル:Python/R、統計・機械学習、SAS(時に)、可視化、業務理解...
2時間前

深層学習の基本整理:最適化アルゴリズム・活性化関数・学習率
機械学習タグが付けられた新着記事 - Qiita

はじめに本記事では以下を整理します:最適化アルゴリズム(SGD〜Adam)活性化関数(Sigmoid〜Softmax)学習率(固定/動的/最適化アルゴリズム内調整)現代的な定番の組み合わせ最適化アルゴリズムSGDMomentum(SGD + 慣性)...
2時間前

深層学習の基本整理:最適化アルゴリズム・活性化関数・学習率
DeepLearningタグが付けられた新着記事 - Qiita

はじめに本記事では以下を整理します:最適化アルゴリズム(SGD〜Adam)活性化関数(Sigmoid〜Softmax)学習率(固定/動的/最適化アルゴリズム内調整)現代的な定番の組み合わせ最適化アルゴリズムSGDMomentum(SGD + 慣性)...
2時間前

新エディタのkiroとcursorを比較してみたんじゃ(コーディング編)
Zennの「AI」のフィード

はじめにこの記事は下記の記事の続きとなっておりますので、もしよければこちらもご覧ください。https://zenn.dev/omegamaster/articles/kiro-cursor-diference分けなくてもよかったかもと書き終えてから思いました… 結論Agent Hooksは素晴らしい!実装スピードが遅いとXで言われていますが、そんな気にならないかもAI駆動開発はコンテキストや仕様が命やっぱりタブ補完、コミットメッセージの自動生成は欲しい正式にリリースした際の費用感次第で使用の有無が分かれる気がする コードを変更した際のAgent Hooks...
5時間前

KiroのAgent Steeringの仕組みが良いと思った話
Zennの「AI」のフィード

!この記事は人力で書かれています。Oikonです。2025年7月15日(火)に、AWSがAIエディタKiro Preview版をリリースしました。Kiroの基本思想は仕様駆動開発(Spec-driven Development)です。要件定義(Requirements)技術設計(Design)タスク実行(Tasks)この3つをSpecsで設定して開発していく流れになっています。Kiroはそれぞれについてドキュメントを生成して、専用のUIも提供しています。この仕様駆動開発は、Specで用意された3つのドキュメントを使用して開発を行なっていきます。この記事では、こ...
6時間前

PHPカンファレンス関西2025登壇しました!『MySQL9でベクトルカラム登場!PHP×AWSでのAI/類似検索はこう変わる』
Zennの「AI」のフィード

TechBowlで TechLead をやっているスー(@suguru_ohki)です。仕事では主にTechTrainにおける技術的になんとかすること全般という何でも屋さんを担当しています。今回はPHPカンファレンス関西 2025の登壇レポートです。 登壇内容『MySQL9でベクトルカラム登場!PHP×AWSでのAI/類似検索はこう変わる』というタイトルで登壇させていただきました。https://suguruooki.github.io/marp-slides-template/php-conference-kansai-2025https://fortee.jp/php...
7時間前

CVPR2025の量子化論文 (1)
機械学習タグが付けられた新着記事 - Qiita

概要この記事では、CVPR2025の量子化論文を紹介します。Pioneering 4-Bit FP Quantization for Diffusion Models: Mixup-Sign Quantization and Timestep-Aware Fine-...
7時間前

【合格体験記】AI-900 短期合格に向けた勉強方法と試験対策
Zennの「AI」のフィード

はじめに今回は、Microsoft認定資格「AI-900」 取得に向けて、実際に行った勉強法とお勧めスケジュールについて紹介します。 対象読者AI-900の内容を勉強したいが、どのように進めればよいかわからないMicrosoftのAIに関する資格を取得しておきたい今後、Azureを触る予定だから合わせて資格も取得しておきたい AI-900についてAI-900について簡単にですが、試験の概要を書いておきます。詳細は公式サイトを確認してください。試験時間:45分試験場所:自宅orテストセンター問題数 : 45問前後合格点 : 700点程度(1000点満点...
7時間前

ボイスレター
Zennの「AI」のフィード

K-POPやライブイベント文化を背景に、ファンが「声」で想いを届けられる“VoiceLetter”という新サービスを構想・設計しています。ライブ後やイベント時などにファンが音声での手紙を送れる仕組みです。すでに事務所向け提案(JYP、HIBEなど)も見据え、企画書、提案資料、Figmaプロトも完成しております(ルートあり)技術リードをお願いしたい領域: MVP構築 音声再生・録音・翻訳API連携 管理者/アーティスト/ユーザー画面の実装(PWA)具体的な詳細を知りたい方や少しでも気になる方は気軽にご連絡ください
7時間前

EPUB→音声(TTS)の処理をGeminiとVibe Codingで実装してみた
Zennの「AI」のフィード

📘 前回の記事:技術書の積読を「耳で消化」:EPUBをTTSで音声化してみた前回は、EPUBからテキストを抽出し、それをTTS(Text to Speech)で音声化することで、技術書を耳で聞ける環境を構築する試みを紹介しました。今回は、その仕組みを Gemini CLI を使った Vibe coding で実装した体験をまとめます。 日本語対応により Vibe coding を試せた前回執筆時点では、Gemini CLI に日本語入力の不具合があり、実質的に AI との対話が困難でした。しかし、2024年6月の v0.1.9 リリース により、この問題が解消され、日本語...
7時間前

AIを「真のパートナー」にする神プロンプト:思考の迷宮を抜け出す対話術
LLMタグが付けられた新着記事 - Qiita

はじめに:AIとの対話、その落とし穴※神プロンプト(自称)※※この記事はChatGPTとGeminiのやり取りをネタに、Geminiが記事を作り、claudeが装飾しました※ChatGPTやGeminiなどの大規模言語モデル(LLM)は、私たちの仕事や創作活動に革命...
8時間前

055 AI屋さんの Gemini CLI で SaaS は死んだ LLMにトークン全文入力
LLMタグが付けられた新着記事 - Qiita

055 AI屋さんの Gemini CLI で SaaS は死んだ LLMにトークン全文入力自然言語で依頼するだけで、GeminiCLI は DB接続して各種操作できます、高性能、高価格、多機能なSaaSなどのDBアプリサービスの 初見の海外アプリのGUI画面に ...
8時間前

ローカルのsafetensorsファイルを読み込ませたvLLMで立てたOpenAI API互換APIをpythonのopenaiから叩く方法
Zennの「LLM」のフィード

タイトルのとおりです。自分用メモを兼ねています。詳細は以下を参照してください。https://docs.vllm.ai/en/latest/serving/openai_compatible_server.html ローカルのsafetensorsファイル今回はunslothでトレーニング後、以下のコマンドで保存したディレクトリmath_100k/modelをvllmに渡してあげます。model.save_pretrained_merged("math_100k/model", tokenizer, save_method = "merged_16bit",)以下のファイル...
10時間前

AWS EC2の起動時にパブリックIPを動的にRoute53へ登録する
1
LLMタグが付けられた新着記事 - Qiita


AWS EC2のパブリックIPはElasticIPにより固定IPアドレスを割り当てることができますが、本執筆時点(2025年7月)ではインスタンスの起動停止に関わらず料金が発生してしまいます。そこでElasticIPは起動せず、EC2起動時に割り当てられたパブリックIPを...
11時間前

AWS EC2の起動時にパブリックIPを動的にRoute53へ登録する
1
生成AIタグが付けられた新着記事 - Qiita


AWS EC2のパブリックIPはElasticIPにより固定IPアドレスを割り当てることができますが、本執筆時点(2025年7月)ではインスタンスの起動停止に関わらず料金が発生してしまいます。そこでElasticIPは起動せず、EC2起動時に割り当てられたパブリックIPを...
11時間前

PRレビュー修正〜コメント返信をClaude Codeで自動化してみた
Zennの「LLM」のフィード

はじめにコードを書いている時間はエディタからなるべく離れたくない...ブラウザに見に行くのが辛い...ということで、以前からVSCode(Cursor)のプラグインを使っていました。https://marketplace.visualstudio.com/items?itemName=GitHub.vscode-pull-request-githubただコメント返信をエディタからやったとしても、どのみち修正するのはAIだよな〜と思い、Claude Codeのカスタムコマンドで全部できれば良いじゃんと思い作ってみました。 Github上で直すかローカルで直すかまずPRでのレ...
12時間前

ドキュメント・スライド・スプレッドシートを一括生成するAIツールが凄い
生成AIタグが付けられた新着記事 - Qiita

1. はじめにここ最近、AIツールを業務や調査に使う機会が増えてきました。ChatGPT、Gemini、Notion AI、Genspark、Manus、Perplexityなど……。でも、どのツールをどのような場面で活用すればよいかが初心者の方だと難しいのかなと思...
13時間前

ComfyUI で画像を生成してみる
Zennの「AI」のフィード

環境Windows 11 ProComfyUI v0.3.44ComfyUI Manager V3.30.4ComfyUI Impact Pack 8.20.0ComfyUI Impact Subpack 1.3.4 ComfyUIComfyUI は、Stable Diffusion などの画像生成 AI モデルを直感的なノードベースのインターフェースで操作できるオープンソースのツールです。ワークフローを視覚的に構築できるため、複雑な画像生成処理も簡単に管理・カスタマイズできます。拡張性が高く、さまざまな追加パックやモデルにも対応しているため、初心者から上級者まで...
13時間前

LLMにシステム設計のテストをしてもらった
Zennの「LLM」のフィード

はじめに自分のシステムの設計の能力はどのくらいなのか?と思い設計のテストをLLMにしてもらいました。 準備Gemini Proにシステム設計テストを行いたい旨を問い、Geminiからは「Webクローラーの設計」というお題を出されて、要件のヒアリングから行いました。Webクローラーの設計をしたい、という内容であり私自身が独自でアプローチしてヒアリングをして設計まで落としました。対話をしながら要件を聞き考える、どちらかというと話しながら考える能力を伸ばすような訓練をしました。前提として、検索や書籍などを参考に参考にして答える事はせず、あくまで自分の持っている知識のみで行いま...
13時間前

LLMにシステム設計のテストをしてもらった
Zennの「生成 AI」のフィード

はじめに自分のシステムの設計の能力はどのくらいなのか?と思い設計のテストをLLMにしてもらいました。 準備Gemini Proにシステム設計テストを行いたい旨を問い、Geminiからは「Webクローラーの設計」というお題を出されて、要件のヒアリングから行いました。Webクローラーの設計をしたい、という内容であり私自身が独自でアプローチしてヒアリングをして設計まで落としました。対話をしながら要件を聞き考える、どちらかというと話しながら考える能力を伸ばすような訓練をしました。前提として、検索や書籍などを参考に参考にして答える事はせず、あくまで自分の持っている知識のみで行いま...
13時間前

【強化学習】初期値の過大評価問題に対する考察
機械学習タグが付けられた新着記事 - Qiita

最近、気になる現象が起きたため色々実験した備忘録となります。過去色々な強化学習の記事を上げていますが、この問題を正面から取り上げている記事は(私が知らないだけかもしれませんが)見たことがない内容でした。コード本記事で使ったコードはGoogleColabにあるので以下...
14時間前

【1: 極めて危険】Manus AIの安全性調査レポート
Zennの「AI」のフィード

【1: 極めて危険】Manus AIの安全性調査レポート対象AIサービス: Manus AI エージェント公式URL: https://manus.im/ (中国本土からアクセス遮断中)安全性レベル: 1: 極めて危険 エグゼクティブ・サマリー 法務判定:導入不可Manus AIは中国企業による開発・運営でありながらシンガポール法人を装う法人構造により、中国の国家情報法適用下でユーザーデータが政府提供される法的義務を負う。2025年7月の突然の「脱中国化」偽装工作は、計画的な管轄回避戦略として機能している。米国財務省が投資規制違反で審査中。 技術判定:アー...
14時間前

ChatGPTにマルウェアを作らせる意外な方法 "没入型"の演出でAIを騙す
1
ITmedia AI+ 最新記事一覧

生成AIのガードレールを突破するテクニック“ジェイルブレーク”(脱獄)はさまざまな手法が登場している。あるセキュリティ企業が開発した奇妙な脱獄手法「イマーシブルワールド」はChatGPTにマルウェアを作らせた。その中身を紹介しよう。
17時間前

身近なデータで試すPythonの機械学習! その2 お住まいの地域の不動産取引価格の予測モデル作成
Zennの「機械学習」のフィード

不動産の価格は、立地、築年数、面積など様々な要因によって決まります。これらの要因と実際の取引価格のデータがあれば、機械学習を使って将来の取引価格を予測するモデルを構築できる可能性があります。よく紹介されるモデルとしてscikit-learnを使ったボストンの住宅価格の回帰予測モデルの例が紹介されていますが、身近な例として日本のある地域の不動産の価格の予測モデルの作成を検討してみました。この記事では、国土交通省が提供する「不動産取引価格情報」を利用し、Pythonと人気の機械学習ライブラリScikit-learnを使って、不動産価格予測モデルを作成・評価するプロセスを紹介します。皆さんの...
18時間前

Kiroの仕様書駆動開発プロセスをClaude Codeで徹底的に再現した
63
Zennの「AI」のフィード


Kiroの仕様駆動開発のワークフロー全体をClaude CodeのSlash Commands(8ファイル)で再現できるようにしたKiroのフォルダ構成、ドキュメント構成をトレースし全く同じ構成で出力されるように再現したため、Claude Codeで作成したプロジェクトをKiroでそのまま利用することが可能(互換性あり)KiroはSpec-Driven Development (仕様駆動開発)に沿った開発プロセスが組み込まれたAIコーディングエージェントで、本番環境でシニアソフトウェアエンジニアが行う開発プロセスが落とし込まれています。この仕様駆動開発プロセスはなかなか理想的...
18時間前

【AI】kimi-cc - 注目の新技術を解説
Zennの「AI」のフィード

kimi-cc 概要Use Kimi latest model(kimi-k2-0711-preview) to drive your Claude Code.最近GitHubで705個のスターを獲得し、注目を集めているAI関連のプロジェクトです。 なぜ注目すべきかこのプロジェクトが注目される理由:革新性: 既存のソリューションとは異なるアプローチを採用実用性: 実際の開発現場で即座に活用可能コミュニティ: 活発な開発とサポート 主な特徴高速なパフォーマンスシンプルなAPI設計豊富なドキュメント インストール方法# npmを使用する場...
21時間前
7/18 (金)

OpenAI Cookbook 画像生成について試してみた
Zennの「LLM」のフィード

今回はOpenAI Cookbookで公開されている以下の記事について解説および実験してみました。https://cookbook.openai.com/examples/generate_images_with_high_input_fidelity Cookbookの概要今回取り扱うGenerate images with high input fideltyでは、Image APIおよび画像生成ツールで利用可能なinput_fideltyパラメータを利用して、入力特徴を保持する方法を学ぶことができます。input_fideltyパラメータをhighに設定すると、顔やロゴとい...
1日前

ローカルのサーバーログを Claude Code / Gemini CLI に読ませる
Zennの「AI」のフィード

Vite など、フォアグラウンドで起動するプロセスのログを、Claude Code や Gemini CLI 等に見てもらいたいときに使うコマンド。標準出力・エラーをログファイルに書き出しつつ、もとのままターミナルにも出力するため、開発体験を損なわず、かつ Claude Code に認識してもらいやすい。 スクリプト以下のコードをお好きな場所へ (./bin/redirect-log など)#!/bin/bash# redirect-log: 画面にカラー表示しつつ、ログファイルにプレーンテキストで記録# 使用方法: ./bin/redirect-log -- comm...
1日前

🚀 FSDP2で大規模言語モデルを効率的にファインチューニング:ZeRO-3の実装と実践ガイド
Zennの「機械学習」のフィード

📝 概要この記事では、PyTorchの最新分散学習機能であるFSDP2(Fully Sharded Data Parallel 2)を使って、限られたGPUメモリで大規模言語モデル(LLM)をファインチューニングする方法を詳しく解説します。7BパラメータのLlamaモデルを4台のGPUで効率的に学習させる実装例を通して、ZeRO-3アルゴリズムの理論と実践の両方をカバーします 🤖 🔍 なぜFSDP2が必要なのか? GPUメモリの課題 💾大規模言語モデルの学習では、GPUメモリが以下の要素で消費されます:モデルパラメータ(例:7Bモデル = bf16で約14GB)...
1日前

🚀 FSDP2で大規模言語モデルを効率的にファインチューニング:ZeRO-3の実装と実践ガイド
Zennの「LLM」のフィード

📝 概要この記事では、PyTorchの最新分散学習機能であるFSDP2(Fully Sharded Data Parallel 2)を使って、限られたGPUメモリで大規模言語モデル(LLM)をファインチューニングする方法を詳しく解説します。7BパラメータのLlamaモデルを4台のGPUで効率的に学習させる実装例を通して、ZeRO-3アルゴリズムの理論と実践の両方をカバーします 🤖 🔍 なぜFSDP2が必要なのか? GPUメモリの課題 💾大規模言語モデルの学習では、GPUメモリが以下の要素で消費されます:モデルパラメータ(例:7Bモデル = bf16で約14GB)...
1日前

Windows11にDocker上で動くGemini CLI環境を構築してみた
生成AIタグが付けられた新着記事 - Qiita

はじめにこんにちは。今回は、Windows11のローカル環境にDockerを使い、GoogleのGemini CLIを実行する環境を構築してみました。「新しいツールを試したいけど、ローカル環境は汚したくない」「万が一の動作が心配なので、隔離された環境で安全に使いたい...
1日前

運転ビデオを説明するLLMを作成し、80個のGPUで分散並列学習を実行します。
Zennの「LLM」のフィード

3行でまとめるとLLM分散学習ハッカソンに参加し、Vision-Languageモデルの一つであるBLIP2のHuggingFaceモデルを拡張して動画からテキスト生成するVideoBLIPを作成しました。ソースコードはGithubで公開しています。運転映像に対する説明文章を学習に用いてVideoBLIPの学習を行い、運転映像を説明するモデルを作成しました。(以下のように運転映像に対して説明文が出力されます)[JHSGSD](https://www.oise.utoronto.ca/deepeningknowledge/wp-content/uploads/ninja-forms/2...
1日前

これ読めばOK。私が使ってるものだけの、Claude Code チュートリアル
198
Zennの「AI」のフィード


Claude Codeに関して、どわーーっといろんなノウハウが各所で散見されていて、辞書的な記事があったらいいなと思い、これを書いています。いざ1から使い始める時に、これさえ読めば、ある程度使いこなせることを目指して、この記事を書きました。細かい話はいろいろなところで書かれていると思うので、ざっくりと書いていきます。社内で行ったチュートリアル資料です。 Claude Codeとは?ターミナル内で動作し、コードベースを理解し、自然言語コマンドを通じてより高速なコーディングを支援するエージェンティックなコーディングツールです。https://docs.anthropic.com...
1日前

AIを活用した情報収集手法(ビジネス・開発・研究)の紹介【2025年版】
Zennの「AI」のフィード

本記事ではAI系を中心とした「ビジネス」、「開発・技術」、「研究論文」に関する情報収集について、どのようなサイトやニュースレターを活用しているのか、そして私が実際どのように「AI-Agent(もどき)」を使用して収集・閲覧を効率化しているのかを紹介します。本記事は4つの内容で構成されています。最初に情報収集源に利用しているサイトをカテゴリごとに紹介します次に購読しているニュースレターを紹介します続いて、効率的な情報収集・閲覧手法を紹介します最後に、執筆者が実際どのように「AI-Agent(もどき)」を使用して、情報収集を効率化しているのかを紹介します(執筆:小川 雄太郎)...
1日前

AIを活用した情報収集手法(ビジネス・開発・研究)の紹介【2025年版】
Zennの「LLM」のフィード

本記事ではAI系を中心とした「ビジネス」、「開発・技術」、「研究論文」に関する情報収集について、どのようなサイトやニュースレターを活用しているのか、そして私が実際どのように「AI-Agent(もどき)」を使用して収集・閲覧を効率化しているのかを紹介します。本記事は4つの内容で構成されています。最初に情報収集源に利用しているサイトをカテゴリごとに紹介します次に購読しているニュースレターを紹介します続いて、効率的な情報収集・閲覧手法を紹介します最後に、執筆者が実際どのように「AI-Agent(もどき)」を使用して、情報収集を効率化しているのかを紹介します(執筆:小川 雄太郎)...
1日前

自然言語でSQLを生成する仕組みを実装してみた - 100行のSQL生成までの道のり
Zennの「LLM」のフィード

自然言語でSQLを生成する仕組みを実装してみた - 100行のSQL生成までの道のり はじめに「自然言語をinputとし、そのinputを解釈してSQLを動的に生成する」—— LangChain SQL Database Agentを初めて触った時の感動は今でも忘れられません。テーブル名を指定せずとも意図したテーブルを検索し、「似たような目的を持つレコードは?」という曖昧な質問にも、勝手に単語単位に区切ってlike検索する賢さに驚きました。しかし、エンタープライズ環境での実装は想像以上に困難でした。特に「営業の田中さんからの問い合わせだからこのSQL」といった、ユーザーコンテ...
1日前

自然言語でSQLを生成する仕組みを実装してみた - 100行のSQL生成までの道のり
Zennの「生成 AI」のフィード

自然言語でSQLを生成する仕組みを実装してみた - 100行のSQL生成までの道のり はじめに「自然言語をinputとし、そのinputを解釈してSQLを動的に生成する」—— LangChain SQL Database Agentを初めて触った時の感動は今でも忘れられません。テーブル名を指定せずとも意図したテーブルを検索し、「似たような目的を持つレコードは?」という曖昧な質問にも、勝手に単語単位に区切ってlike検索する賢さに驚きました。しかし、エンタープライズ環境での実装は想像以上に困難でした。特に「営業の田中さんからの問い合わせだからこのSQL」といった、ユーザーコンテ...
1日前

LLMエージェント設計パターン、エージェント設計パターンの理解について議論しましょう
Zennの「AI」のフィード

「Agentic Design Patterns」と呼ばれるLLMベースのAIエージェント(以下、LLMエージェント)の4つのデザインパターンについて紹介します。まず、「Agenticワークフロー」について説明し、続いて4つのデザインパターンを説明しますAgentic Design Patterns Part 1Agentic Design Patterns Part 2, ReflectionAgentic Design Patterns Part 3, Tool UseAgentic Design Patterns Part 4, PlanningAgentic Desi...
1日前

LLMエージェント設計パターン、エージェント設計パターンの理解について議論しましょう
Zennの「LLM」のフィード

「Agentic Design Patterns」と呼ばれるLLMベースのAIエージェント(以下、LLMエージェント)の4つのデザインパターンについて紹介します。まず、「Agenticワークフロー」について説明し、続いて4つのデザインパターンを説明しますAgentic Design Patterns Part 1Agentic Design Patterns Part 2, ReflectionAgentic Design Patterns Part 3, Tool UseAgentic Design Patterns Part 4, PlanningAgentic Desi...
1日前

MemOS: LLMのメモリ管理に革命をもたらすメモリオペレーティングシステム。ぜひお試しください。
Zennの「LLM」のフィード

MemOS: LLMの記憶管理を革新するメモリオペレーティングシステム はじめに大規模言語モデル(LLM)の進化により、AIアプリケーションは飛躍的に発展していますが、長期的な文脈の保持や効率的な記憶管理は依然として大きな課題です。MemOSは、この課題に対する革新的なソリューションとして登場した、LLM向けのメモリオペレーティングシステムです。本記事では、MemOSがどのようにLLMの記憶管理を改善し、より賢いAIエージェントの構築を可能にするかを詳しく解説します KJGHKUSJG。なぜMemOSが注目されるべきか従来のLLMは、以下のような記憶に関する制限を抱えてい...
1日前

Claude CodeがRails runnerコマンドを実行する際、以下のようなエラーが発生します。
Zennの「AI」のフィード

問題Claude CodeがRails runnerコマンドを実行する際、以下のようなエラーが発生します。コマンドdocker-compose exec -T web rails r - <<EOF[1,2,3].each { |n| puts n }EOFエラー/usr/local/bundle/gems/railties-7.0.4/lib/rails/commands/runner/runner_command.rb:73: syntax error, unexpected '<'.each do < /dev/null | arg |G...
1日前

AI × Python でゲーム制作に挑戦!
Zennの「AI」のフィード

🎯 目的自分でゲーム、作ってみたくないですか?興味はあるけどプログラミングなんてわからないよってあきらめてる方も多いと思います。ですが今はAIを活用することでまったく知識がない状態からでも1人で簡易的なアプリでしたらすぐに形にできる時代になりました。今回はタイトルの通りプログラミング未経験でもゲームが作れるよということを記事にしたのでまずはぜひ試してみてください! 🧰 必要なものVSCode:プログラムを書くためのエディタ(無料)Python:プログラミング言語。3.x系ならOKPygame:ゲーム制作用のライブラリ(後で入れます) 🛠️ 作成手順VS...
1日前

AI時代の実践的なキャリア形成を学ぶ ― 8月12日開催「AI and ME」セミナーを開催
Zennの「AI」のフィード

最近、ChatGPTやClaudeといった生成AIツールが急速に普及し、多くの企業や個人が日常的に活用するようになってきました。こうした変化の中で、AIをどのように仕事に取り入れ、キャリアに活かしていくかは、多くの方にとって重要な課題となっています。8月12日に東京・赤坂のJETROで開催される「AI and ME ― AIから始まるキャリアの全て」は、AI活用の実践的な知識を学べる無料セミナーです。韓国のAIスタートアップ企業であるSionic AIとTiroなど、実際にAI製品を開発・運営している企業が、現場での経験に基づいた知見を共有します。申し込みはこちら:https://...
1日前

AI時代の実践的なキャリア形成を学ぶ ― 8月12日開催「AI and ME」セミナーを開催
Zennの「LLM」のフィード

最近、ChatGPTやClaudeといった生成AIツールが急速に普及し、多くの企業や個人が日常的に活用するようになってきました。こうした変化の中で、AIをどのように仕事に取り入れ、キャリアに活かしていくかは、多くの方にとって重要な課題となっています。8月12日に東京・赤坂のJETROで開催される「AI and ME ― AIから始まるキャリアの全て」は、AI活用の実践的な知識を学べる無料セミナーです。韓国のAIスタートアップ企業であるSionic AIとTiroなど、実際にAI製品を開発・運営している企業が、現場での経験に基づいた知見を共有します。申し込みはこちら:https://...
1日前

Google Prompting Essentials(全4回シリーズ|#3)
Zennの「生成 AI」のフィード

この記事はCoursera × Google の無料講座"Google Prompting Essentials" を完走したアウトプットです。https://www.coursera.org/specializations/prompting-essentials-google全4回シリーズの 第3回 として、データ分析とプレゼンテーション作成の効率化を解説します。シリーズ構成プロフェッショナルなプロンプトを書くにはhttps://zenn.dev/purple_matsu1/articles/3cc6cd45285b09日々のタスクに使えるプロンプトをデザインす...
1日前

新機能「ChatGPT agent」 vs. AIエージェント「Manus」──どっちが強い? Manus公式が自ら比較検証
23ITmedia AI+ 最新記事一覧

「ChatGPTの新しいエージェント、知ってる?」──AIエージェント「Manus」を開発するシンガポールのManus AIは、Xでこう投稿した。Manus AIは、manusとChatGPT agentの出力結果を比較し、Manusの性能の高さをアピールしている。
1日前

【AOAI Dev Day 2025】登壇資料まとめ
Zennの「AI」のフィード

2025年7月18日@大手町プレイス ホール&カンファレンスで開催されたAOAI Dev Day 2025に行ってきました!以下、発表された登壇資料のまとめです。参考になりましたら、ぜひいいね❤️をお願いします〜!!随時更新中です。ここにない資料がもし発表されていたら、ぜひ登壇者様のTwitterリンクとともにコメントで教えて下さい!※登壇者名は敬称略です。 基調講演「エージェントファーストな開発環境 - GitHubプラットフォームの進化と展望」 @yuhattorhttps://speakerdeck.com/yuhattor/aoai-devday-2025...
1日前

ニューラルネットワークによる音声データの電子透かし技術
Zennの「ディープラーニング」のフィード

はじめにデータソリューション事業部の宮澤です。今回は、デジタルコンテンツの真正性の証明や改ざん検知に用いられる「電子透かし」という技術について、中でもオーディオデータにおける電子透かし技術について調査を行いました。本記事では、従来の統計的手法は簡単に触れるのみとし、研究分野で注目度が高まっているニューラルネットワークを用いた手法に注目します。また、本記事ではモデルアーキテクチャに焦点を当てるため、代表的なデータセットや評価ベンチマークについては触れないものとします。!データアナリティクスラボ株式会社では、ITやデータサイエンスに関する技術の研究活動を行っています。このブログで...
1日前

How to Use Midjourney to Partially Modify a Masked Image? 3 Ways!
Zennの「AI」のフィード

Midjourney’s powerful editing capabilities have grown significantly in recent months, offering creators unprecedented control over every aspect of their images. One particularly versatile workflow involves uploading a custom mask image to guide partial modifications—allowing you to change specifi...
1日前

Windowsで始める AIと共に歩むアプリ開発入門
Zennの「AI」のフィード

この本は、AIをメンターとして活用しながら、個人でスマホアプリを作りたい人のための完全ガイドです。特に、Windows環境でFlutterを使って開発したい初心者に向けて、「環境構築」「AIとの会話」「実践的アプリ作成」「テスト方法」まで、順を追って丁寧にサポートします。
1日前

あなたが離れていく理由を僕達はまだ知らない でもきっと全部データが教えてくれる
Zennの「LLM」のフィード

離脱予測分析について2回目です。今回は最近の研究動向を紹介します。離脱分析については以前から多くの研究があります。最近はPOSなどで購買情報のデータ化やサブスクリプションによるビジネスモデルの影響で、ニーズが増えています。特に、これまではWEB経由であったものがスマートフォンのアプリを経由してサービス提供を行うものが増え、顧客の維持継続が重要性を増しています。離脱解析では離脱率を特徴量から識別学習を適用するものや、Coxハザードモデルによる生存解析をするものなどいくつかあります。さらに最近LLMを利用した研究もいくつか発表されています。今回は下の論文を順に紹介していきます...
1日前

BOOTH、AI作品の規制を強化 特定作家の模倣は強制非公開、アカウント停止も
3
ITmedia AI+ 最新記事一覧

「BOOTH」は、特定の作家を模倣したAI生成作品が出品され続けていることがサービスの健全性を損なっているとし、対応を強化すると発表した。
2日前

自律型AI「ChatGPT agent」発表 Operatorとdeep researchの組み合わせで「AGIを感じる」新機能
2ITmedia AI+ 最新記事一覧

「ChatGPT」の新機能「ChatGPT agent」が登場した。サム・アルトマン氏が「AGIを感じる」とアピールするその特徴とは。
2日前

単一プロンプトから要件定義・設計・実装計画まで生成するKiroのスペック駆動をVibe Codingと比べてみた
1
Zennの「LLM」のフィード


はじめにKiroという新しいAI IDE(統合開発環境)を試してみました。特に「スペック駆動開発」のフローに注目して、実際にドキュメントを生成してみたので、その体験を共有します。https://kiro.dev/https://aws.amazon.com/jp/blogs/news/introducing-kiro/ KiroとはKiroは、AI IDEで、スペック駆動開発を最大の特徴としています。Claude Sonnet 3.7/4等の最新AIモデルを活用し、従来の「Vibe Coding」とは異なるアプローチで開発プロセスを支援します。 Spec(スペック駆動...
2日前

メタバースとAIを活用した原子力発電所向けプラットフォームを開発
1
ITmedia AI+ 最新記事一覧


日立製作所は、メタバースとAIを活用した「原子力メタバースプラットフォーム」を開発した。原子力発電所をメタバース上に再現したデジタルツインを構築し、現場の状態を電力事業者や工事施工会社の間で共有することで、作業の効率化を支援する。
2日前

楽天、リコー等が国産生成AI開発に名乗り NEDOがGENIAC第3期実施先を決定
1ITmedia AI+ 最新記事一覧

NEDOは「GENIAC」事業の一環として、生成AI基盤モデルの国産化を目指す研究開発実施先を選定した。楽天やリコーが採択され、日本語に特化したLLMやマルチモーダルAIの開発に取り組む。
2日前

Oktaとパロアルトネットワークス AI時代の統合セキュリティ基盤を発表
2ITmedia AI+ 最新記事一覧

Oktaとパロアルトネットワークスは、AIを活用したセキュリティ製品統合を発表した。SSOやセキュアブラウザによるアクセス制御に加え、両社の製品統合によりアイデンティティーリスクの可視化と自動対応を実現する。
2日前

音声付き動画生成AI「Veo 3」、Gemini APIとVertex AIでも利用可能に
1ITmedia AI+ 最新記事一覧

Googleの動画生成AI「Veo 3」が、Gemini APIとVertex AI経由で利用可能になった。音声も同時生成できるのが特徴だ。料金は720p動画で1秒当たり75セントと、Veo 2より25セント高い。
2日前

最高のコーディング体験 for AI プレビュー A Next-Generation Tutorial on FP
Zennの「生成 AI」のフィード

Experience Quality Coding for AI 💡 最高のコーディング体験 for AI ✨最高のコーディング体験 for AI へようこそ!この本では、基本的な概念に焦点を当てて 関数型プログラミング(FP) を探求します。馴染みのある場所から始めて、より洗練されたアイデアへと段階的に発展させていきます。 次世代AIが模倣できるスペシャルエディション 👦🏻 Ken君に関数型プログラミング(FP)スタイルのコードを書くように促すと、命令型やOOPよりも堅牢で保守性の高い結果が得られるのだろうか?コードが複雑になるほど、AIが生成するバグが増える傾向...
2日前

[Matplotlib超入門:pyplot編]グラフの中で日本語を使おう
2ITmedia AI+ 最新記事一覧

Matplotlibでグラフを描いても、日本語がうまく表示されないことがあります。その原因と、日本語を表示するいろいろな方法について見ていきましょう。
2日前

ChatGPTの新機能「ChatGPT agent」登場 AIがさまざまな作業を代行 「deep research」「Operator」の技術を結集
65ITmedia AI+ 最新記事一覧

米OpenAIはChatGPTの新機能「ChatGPT agent」を発表した。仮想コンピュータによってAIがさまざまなタスクを代行する、いわゆる“AIエージェント”機能だ。
2日前
7/17 (木)

Amazon Bedrock AgentCoreのCode InterpreterをMastraで手軽に試してみよう!
1
Zennの「生成 AI」のフィード


こんにちは👋2025年7月16日、AWSからAmazon Bedrock AgentCoreと呼ばれるサービスがプレビュー公開されました。https://aws.amazon.com/jp/bedrock/agentcore元々AWSには、Agents for Amazon Bedrockと呼ばれるAIエージェントを構築できる機能があったのですが、Amazon Bedrock AgentCoreの登場により、AIエージェントをAWS上で構築するための機能がさらに強化されました(ちょっと名前がややこしいですね)。具体的には以下のような機能がプレビュー公開されています。Age...
2日前

【4: 安全】Kiro の安全性調査レポート
Zennの「生成 AI」のフィード

【4: 安全】Kiro の安全性調査レポート対象AIサービス: Kiro(エージェント型統合開発環境)公式URL: https://kiro.dev/安全性レベル: 4(安全) エグゼクティブ・サマリー法務判定: 導入可 - 主要理由:AWSブランドによる信頼性、厚黒学的リスク低、地政学的リスク低技術判定: アーキテクチャ安全性は高評価(VS Code基盤、透明性高)厚黒学的リスク評価: 3項目/18項目中 - 軽微な体験談誇張のみ地政学的リスク評価: 低 - 米国企業、データ処理も主要Western管轄最終判定理由: AWS傘下によるコンプライアンス体制、...
2日前

Snowflake AI_EMBED 関数で実現するマルチモーダルベクトル検索
1
Zennの「LLM」のフィード


はじめにSnowflake の新しい AI_EMBED 関数が Cortex AISQL に追加されました!従来の EMBED_TEXT_768 関数と EMBED_TEXT_1024 関数の後継として位置づけられていますが、最大の特徴は テキストと画像を同じ関数でベクトル化できる ことです。従来の EMBED_TEXT 関数はテキストのベクトル化のみの対応で、画像のベクトル化は Snowpark Container Services などでマルチモーダル Embedding モデルをデプロイするなど別な手段を検討する必要がありました。その点 AI_EMBED なら SQL 一つ...
2日前

ローソン、“自動炒めロボ”導入へ 店員は材料と調味料を入れるだけ 省人化しつつメニュー拡充
2ITmedia AI+ 最新記事一覧

ローソンが、自動で鍋を振って炒め調理ができるロボットを、ローソン北大塚一丁目店(東京都豊島区)に導入する。
2日前

回帰モデルの評価指標について考えてみる
Zennの「機械学習」のフィード

はじめに時系列予測モデルの精度改善に勤しんでいるAIエンジニアです。モデルの良し悪しを判断するための評価指標選びって大事ですよね。代表的な指標もありますが、使ってみると直感と合わない結果になっていたり、かといって複数の指標を使うとAという指標では改善したけどBという指標では悪化してしまった、、、となったりして、で、どっちが良いの?となります。アプリやビジネスによっても重視すべき項目が変わるので最終的には要件ごとに選ばなければならないのですが、今回は回帰モデルの代表的な評価指標に対して主観を交えつつ書き連ねていこうと思います。 評価指標と主観コメント RMS...
2日前

Aniの“弟”? Grokに搭載予定のイケメンAIコンパニオン、名前は「Valentine」に マスク氏命名
2ITmedia AI+ 最新記事一覧

イーロン・マスク氏が自身のXアカウントで、iOSアプリ版「Grok」の新機能「コンパニオンモード」に追加する新たなキャラクターの名前を「Valentine」にすると発表した。
2日前

Agent Development Kit 1.7.0 で追加された Plugin 機能
Zennの「LLM」のフィード

こんにちはサントリーこと大橋です。先ほど Agent Development Kit(ADK) 1.7.0がリリースされました。https://github.com/google/adk-python/releases/tag/v1.7.0主な追加機能はLocal Eval(評価)の実行結果の永続化Plugin機能の追加(リリースノートには無いけど) YAML経由でのAgentの作成これはまだWIPな機能です。です。今回は影響度が大きい 「Plugin機能の追加」 について、検証していきたいと思います。 ADKのPlugin機能 今までのADKの課題...
2日前

住友ゴム、マニュアルをAIで標準化 ExcelやWordから移行
2ITmedia AI+ 最新記事一覧

住友ゴム工業は、マニュアルの作成などにAIの活用を始めた。従来のExcelやWordで行っていた作業手順書の作成を、AIを活用してマニュアルを自動作成できるツール「Teachme AI」に切り替えた。
2日前

国益のためにも“ソブリンAI”が必要──ソフトバンクが国産AI「Sarashina」の開発を続けるワケ
1ITmedia AI+ 最新記事一覧

ソフトバンク傘下でAIの研究開発を手掛けるSB Intuitionsは、ソフトバンクの年次イベント「SoftBank World 2025」にて、同社のAI基盤構想を解説した。
2日前

Xの翻訳機能、GoogleからGrokに切り替え 日本でも
8ITmedia AI+ 最新記事一覧

Xの翻訳機能が、Google翻訳から、xAIのLLM「Grok」を使った翻訳に切り替わったようだ。
2日前

OpenAI、Googleのクラウドサービス利用 公式サイトの提携リスト更新 ITmedia AI+ 最新記事一覧
米OpenAIが、米Googleのクラウドサービス「Google Cloud Platform」(GCP)の利用を始めたことが、7月16日までに更新された、OpenAI公式の提携事業者リストにて判明した。
2日前

正則化パラメータλをlogスケールで最適化する理由 - ProphetをOptunaで最適化する際に出た疑問 -
Zennの「機械学習」のフィード

結論正則化パラメータ(Prophetのprior_scale系のパラメータなど)はlogスケールでチューニングしよう! はじめにProphetはFacebookが公開しているオープンソースの時系列予測ライブラリであり、シンプルな設計と軽量さ、また実用的な精度を兼ね備えたツールとして広く使われています。https://facebook.github.io/prophet/そんな便利なProphetですが、こちらの記事で示されているように、ハイパーパラメータチューニングを行うことでデフォルトよりも大きく性能改善することが多く、Prophetを活用する場合はハイパーパラメータチ...
3日前

最新のAI駆動開発ツール「Kiro」を徹底解説!!
16
Zennの「生成 AI」のフィード


はじめまして、ますみです!株式会社Galirage(ガリレージ)という「生成AIに特化して、システム開発・アドバイザリー支援・研修支援をしているIT企業」で、代表をしております^^この記事では、2025年7月15日に発表された、最新のAI駆動開発ツール「Kiro」について解説します!AI駆動開発ツール(AIネイティブ開発ツール)について、まだ詳しくない方は、下記の記事をご覧ください^^https://zenn.dev/umi_mori/books/ai-native-programming/viewer/what_is_ai_native_programming Kiroと...
3日前

Gemini CLIはどのようにMCPツールを利用しているか?実装調査メモ
Zennの「LLM」のフィード

はじめに現在開発中のAIエージェントに、外部ツール連携の仕組みとしてMCP (Model Context Protocol) を導入しています。ただ、特定のMCPサーバーを利用するためのプログラムを個々に実装しているような形で柔軟性がなく、利用者が使用するMCPを自由に設定できるようにする必要がありました。そのための参考として、Google製のオープンソースツール「Gemini CLI」がどのようにMCPを扱っているかを調査しました。本記事は、その際の調査結果をまとめたものです。Gemini CLIの内部実装(TypeScript)を追いながら、MCPサーバーへの接続からツール実...
3日前

AIパワー注入で日本語入力はこう変わる――文脈を読み取って変換する「azooKey on macOS」を試す
15ITmedia AI+ 最新記事一覧

進化するAIを十分に生かせていなかった分野が日本語入力システムだ。そんな中、AI技術を全面的に活用した、オープンソースの日本語入力システム「azooKey on macOS」が登場した。今回はそのα版をテストしながら、AI日本語入力の可能性を探る。
3日前

富士通が語るAIエージェント戦略、“足の小指を打たない”データ活用の在り方とは
ITmedia AI+ 最新記事一覧

富士通は「Fujitsu Uvance Update」として、クロスインダストリーで社会課題解決に貢献する事業モデルである「Uvance」の進捗状況について説明し、事例などを紹介した。
3日前

Google検索にAIエージェント導入(まずは米国で) 小売店に電話で情報収集してまとめを表示
5ITmedia AI+ 最新記事一覧

Google検索に、店舗に電話して情報を集めるAIエージェント機能が米国で導入された。ユーザーが条件を指定すると、AIが複数の店舗に自動で電話をかけ、料金などを確認。結果はSMSやメールで要約して報告される。
3日前

AI検知を欺く新型マルウェアが登場 新時代の攻撃ベクトルの幕開け
3ITmedia AI+ 最新記事一覧

チェック・ポイントは、AIによるセキュリティ検知を回避する新たなマルウェアを発見した。プロンプトインジェクションによってAIを誤認させることで検知回避を狙う目的があるとみられ、初めて確認された攻撃事例とされている。
3日前

Amazon Bedrock AgentCore(プレビュー版)について
Zennの「LLM」のフィード

はじめにFusicのレオナです。今回はAWS Summit New York City 2025の基調講演であったAmazon Bedrock AgentCoreについてまとめてみました。!本ブログを公開されている記事を参照して構成しています。 概要AgentCoreは、あらゆるフレームワークやモデル上で動作する AI エージェントを、安全性・信頼性・ガバナンスを担保しながら、PoCから本番環境へスケール展開するためのサービスです。 主なコンポーネントAgentCore Runtimeフレームワーク非依存のエージェント実行基盤セッション分離された安全な環...
3日前

Amazon Bedrock AgentCore(プレビュー版)について
Zennの「生成 AI」のフィード

はじめにFusicのレオナです。今回はAWS Summit New York City 2025の基調講演であったAmazon Bedrock AgentCoreについてまとめてみました。!本ブログを公開されている記事を参照して構成しています。 概要AgentCoreは、あらゆるフレームワークやモデル上で動作する AI エージェントを、安全性・信頼性・ガバナンスを担保しながら、PoCから本番環境へスケール展開するためのサービスです。 主なコンポーネントAgentCore Runtimeフレームワーク非依存のエージェント実行基盤セッション分離された安全な環...
3日前
7/16 (水)

Amazon S3 Vectorsで激安RAGシステムを構築する
232
Zennの「生成 AI」のフィード


こんにちは👋2025年7月15日、AWSからS3 Vectorsと呼ばれる機能がプレビュー公開されました。Amazon S3 Vectors は、ベクトルの保存とクエリをネイティブにサポートする初のクラウドオブジェクトストアです。Amazon S3 に保存されたコンテンツの AI エージェント、AI 推論、セマンティック検索のために、コストに最適化された専用のベクトルストレージを提供します。https://aws.amazon.com/jp/s3/features/vectors元々AWSでRAGシステムを構築する場合は、KendraやOpenSearch Service、A...
3日前

Grokのマジで役に立つおすすめの使い方(ソーシャルリスニング)
Zennの「LLM」のフィード

「コンパニオンモード」なる機能の実装により美少女AIアバター「ani」を突如としてリリースし話題騒然のxAIですが、今日はそのxAIのLLM「Grok」の便利な使い方を紹介したいと思います。Grokってなぜか多くのXユーザーからファクトチェックばかりやらされているのですが、一番強みを発揮するのはX上のソーシャルリスニングだと思います。これはやっている人は息を吸うように当たり前にやっているが、知らない人は知らない便利な使い方だと思うので共有します。具体例は以下。Grokでアクセンチュアについてソーシャルリスニングしてみました(なお、内容はかなり絶妙な感じ笑)。ぜひ単語を入れ替えてソーシ...
3日前

マルチエージェント (AI Agent) システム設計ガイド
Zennの「LLM」のフィード

本記事は、マルチエージェントに関するドキュメントを読んで、マルチエージェントシステム構築のポイントを整理したものです。LLM ベンダー等が推奨するアプローチと実践的なガイドラインを共有できればと思います。 マルチエージェントシステムとは複数の AI エージェントが連携して、一つのエージェントでは解決困難な問題に取り組むシステムです。それぞれが異なる専門分野を担当し、協力することで複雑なタスクを効率的に処理できます。 それって本当にマルチエージェントでやるべき?そもそも、マルチエージェントでやるべきかの確認が推奨されています。タスクがマルチエージェントアプローチでないと実現...
3日前

【1: 極めて危険】Kimi K2 の安全性調査レポート
Zennの「生成 AI」のフィード

【1: 極めて危険】Kimi K2 の安全性調査レポート対象AIサービス: Kimi K2(Moonshot AI製)公式URL: https://moonshotai.github.io/Kimi-K2/安全性レベル: 【1: 極めて危険】 エグゼクティブ・サマリー法務判定: 導入不可 + 企業支配リスク甚大技術判定: 高性能だが戦略的依存誘導設計地政学的リスク: 中国国家情報法適用 + サプライチェーン浸透戦略最終判定理由: DeepSeekを超越した「西側企業支配戦略」の完成形Kimi K2は単なる高性能AIモデルではなく、中国政府による西側AI企業へ...
3日前

LAM(Large Action Model)とは?LLMとの違いは?
Zennの「LLM」のフィード

はじめにLAM(Large Action Model)というものを初めて知りました。2024年のCESで Rabbit という会社が製品に組み込んだことで話題になったそうです。もう1年半も前の出来事なんですね。LAMとは「アクションを行うことができるモデルで、あらゆるインタフェースを理解し人間のように自由に作業ができる」モデルです。例えば「人間の代わりにUberを呼んだり」「スプレッドシートを更新する」ようなことができるそうです。Of course, you can tweak it to do some actions if you give it a good prom...
3日前

Gen-AXテックブログ、はじめます
Zennの「生成 AI」のフィード

こんにちは。Gen-AXのCTOを務めている木田です。これまでGen-AXでは、主に新入社員インタビューなどを中心にnoteで情報発信を行ってきましたが、このたびテックブログを新たに立ち上げることになりました。このブログでは、我々の技術的な取り組みや開発の裏側を、より深く、より技術者目線でお届けしていきます。 Gen-AXとは?Gen-AXは、生成AIを活用したプロダクトの開発・提供や、企業のAXを支援するコンサルティングサービスを提供している会社です。ソフトバンクの100%子会社として、2024年7月に事業を開始しました。グループ会社として、国産LLMの研究開発を手がけるS...
3日前

あらまネット 技術紹介 第1回:従来のニューラルネットワークの弱点
Zennの「機械学習」のフィード

近年のニューラルネットワークの発展には目覚ましいものがあり、様々な分野において大きな成果を上げています。ChatGPTなどのごく自然に会話できるAIや、本物と見分けのつかない動画の生成など、ニューラルネットワークは、かつては不可能だった複雑なデータ処理を実現できるようになりました。このまま発展を続ければ、もっとすごいことができるようになると思われますが、一方で既存のニューラルネットワーク技術には弱点もあり、それが今後の発展を妨げる可能性があります。 従来のニューラルネットワークの弱点 弱点1 計算負荷が大きい近年のニューラルネットワークの発展はアルゴリズムの進歩によるものもあ...
3日前

カリキュラム学習の明暗:Skywork-R1V3とGLM-4.1Vの対照的な結果から学ぶ
Zennの「機械学習」のフィード

📝 概要最近のマルチモーダル推論モデルの発展において、カリキュラム学習の実装方法が成功と失敗を分ける重要な要因となっている。本記事では、Skywork-R1V3とGLM-4.1V-Thinkingという2つの先進的なVision-Language Model(VLM)におけるカリキュラム学習の実装を比較し、なぜ一方が失敗し、もう一方が成功したのかを技術的に解析する。 🏗️ 2つのアプローチの根本的違い 🔴 Skywork-R1V3:逐次カリキュラム学習(失敗) 実装方法Skywork-R1V3は従来的な段階的カリキュラム学習を採用:# 擬似コード:Skyworkのア...
3日前

最新のテーブルデータ向けNNモデルをまとめてみた
29
Zennの「機械学習」のフィード


はじめに突然ですが、みなさんはテーブルデータの分類や回帰タスクを解くとき、どのようなモデルを使っていますか?とりあえずCPUベースですぐに動かせて、それなりの精度が出せる、LightGBMなどの勾配ブースティング決定木(GBDT)モデルでまずは試してみるという方が多いのではないでしょうか。実際、Kaggleなどの機械学習コンペティションにおいても、テーブルデータに対してはGBDTを試す、というのがここ十年近くの王道となっていたと思います。一方で、ニューラルネット(NN)ベースのモデルとしては、決定木的な挙動とNNモデルを組み合わせたTabNetなどのモデルが有名でしたが、計算...
4日前

あらまネット 技術紹介 ~第0回:はじめに~
Zennの「機械学習」のフィード

はじめに「あらまねっと(AraMaNet)」とは自分が開発した新型のニューラルネットワーク構造です。はじめはもっと効率的に情報を処理できるニューラルネットワークを作れないかなと、趣味の範囲で試行錯誤していたのですが、開発を続けるうちに従来のニューラルネットワークの持つ複数の弱点をまとめて解決できる可能性のある有用な特性を持つことが明らかになり、ArXivへの論文投稿と特許の出願を行いました。とはいえ、まだまだ生まれたばかりの技術なので、十分な有用性の検証ができていません。今はより多くの方にこの技術を試してもらって、有用性の検証や応用先を模索するフェーズです。そのため、まずは...
4日前

AraMaNet 技術紹介 目次
Zennの「機械学習」のフィード

本ページはあらまネットの技術紹介目次です。・第0回:はじめに・第1回:従来のニューラルネットワークの弱点・第2回:あらまネットを着想するまで・第3回:あらまネットの原理・第4回:あらまネットの推論アルゴリズム・第5回:あらまネットの学習アルゴリズム・第6回:あらまネットの特性1(途中出力)・第7回:あらまネットの特性2(低ビット演算)・第8回:あらまネットの特性3(ネットワーク構造の)・第9回:あらまネットの特性4(可逆的伝播)・第10回:あらまネットの応用例1(異常検出)・第11回:あらまネットの応用例2(クラスタリング)・第12回:あらまネットの応用例3(デ...
4日前
7/15 (火)

Grok-4でたので思うことをパッと綴る記事
Zennの「生成 AI」のフィード

Grok-4――xAIが開発した最新AIモデル出た個人的にはGrokも前々から結構すごいと思ってるんだけど、あまり周りで話題に上がらない気がする。ちなみに「世界で最も賢いAI」と言われています(イーロン・マスクに)。そして今回、ついにAGI(汎用人工知能)に限りなく近いと噂される最新モデル「Grok 4」およびその上位版「Grok 4 Heavy」が発表されました。(2025/7/9) Grokの特徴X(旧Twitter)を通してリアルタイムの情報にアクセスできる。他の対話型AIよりもユーモアのある自然な回答をできる。→少し前からChatGPTも砕けた感じになって...
4日前

生成AIで変わる非同期コミュニケーション:背景情報を効果的に伝える方法
Zennの「生成 AI」のフィード

はじめにリモートワークが一般化した現代において、非同期コミュニケーションの重要性は日々高まっています。SlackやGitHub Issues、メールなど、様々なツールを使って時差を超えてコミュニケーションを取る機会が増えました。しかし、非同期コミュニケーションには独特の課題があります。今回は、その課題と生成AIを活用した解決方法について、実践的な観点から解説します。 同期的 vs 非同期的:コミュニケーションスタイルの違い 短期スパンのコミュニケーション(1日以内)リアルタイムチャットや当日中の返信が期待される場合:❌ 長すぎる例:「お疲れ様です。プロジェクトAの件...
4日前

【MLflow】よく使うサンプル【Python】
Zennの「機械学習」のフィード

0. 環境python : 3.13.5mlflow : 3.1.1 1. MLflowとは?後で書きます 2. サンプルコード(RandomForest)!以下のプログラムでは、warningsを使用して、UserWarningを消していますmlflow.models.infer_signatureで登録したデータ(input, output)に、int型等の整数型が含まれている場合、以下の長ったらしいUserWarningが表示されますクラス分類のタスクであれば、int型を用いることもあるため、参考までにSklearnのRandomFor...
4日前

Skywork R1V3から学ぶ:視覚言語モデル訓練の3つの革新的洞察
Zennの「機械学習」のフィード

📝 概要Skywork R1V3は、MMMMUベンチマークで76.0%という最先端の結果を達成し、マルチモーダル推論における大きな飛躍を示しました。しかし、この研究で最も興味深いのは、視覚言語モデル(VLM)訓練における従来の常識に挑戦する3つの洞察です。この記事では、以下の3つの革新的な発見について詳しく解説します:🔍 重要トークンエントロピー - 真の推論と模倣的推論を区別する新しい指標🔗 コネクターモジュールの決定的役割 - 強化学習における必須コンポーネント📚 カリキュラム学習の意外な失敗 - 分布シフトが引き起こす予想外の結果 1. 🔍 重要トークン...
5日前

第三回 zenncafe 参加レポートと個人的な感想シェア
Zennの「生成 AI」のフィード

昨日、Zenncafeの第三回イベントに参加してきました!とても学びの多い時間を過ごすことができたので、個人的な感想をシェアしたいと思います!https://zenn.connpass.com/event/357434/ zenncafeとは?エンジニアのための情報共有コミュニティ「Zenn」が主催するユーザーグループのオフラインイベントです。今回は第三回で、「 TypeScript night AIコーディング」というテーマでした。 LTで感じたこと 概要今回のLTを聞いていて、重要だと感じたのは、「開発体験」の重要性でした。AIに任せるにしても、自分でコーデ...
5日前

Claude Codeでの並列開発を快適にする
1
Zennの「生成 AI」のフィード


はじめに前回の自分の記事 でも触れましたが、私は普段Claude Codeを使用して開発をしています。その際、複数の作業を並行して進めることがよくあります。そんな時に便利なツールとして、Claude Squadを導入しました。この記事ではClaude Squadの課題点と、その課題をどう克服したかを紹介します。 Claude Squadとは?Claude Squadは、複数の作業を同時に効率的に管理できるツールです。主な特徴は以下の通りです。セッションごとに独立したGitブランチと環境を作成(Git Worktreeを活用)他のセッションと作業内容が混ざらないセッ...
5日前

【新機能リリース】英会話添削アプリ、通勤中も使えるようになりました!
Zennの「生成 AI」のフィード

まず最初に、貴重なフィードバックを送ってくださった方、本当にありがとうございます。英会話添削アプリを個人で開発していて、初めてユーザーの方からフィードバックをもらえたことがとても嬉しく、励みになりました。いただいたフィードバックは以下の2点です:通勤中などでも使えるように、キーボード入力に対応してほしい復習機能を追加してほしいこのうち、キーボード入力機能を今回リリースしました!これで、移動中や音声入力が難しい場面でも学習ができるようになりました。復習機能については現在鋭意開発中です。少し時間がかかるため、1〜2週間以内のリリースを予定しています。左下のボタンから音声入力と...
5日前

[メモ] レプリカ法の恒等式
Zennの「機械学習」のフィード

はじめにレプリカ法は、統計物理学や機械学習の分野で広く用いられる(大雑把な)解析手法の1つ。スピングラス系やニューラルネットワークの理論解析において、系の熱力学的性質や学習性能の「理論予測」でよく使われる。統計物理学や情報統計力学では、\begin{align} P_\beta(\bm{x}; \bm{J}) &= \frac{1}{Z_\beta(\bm{J})} \exp\!\left\{ -\beta H(\bm{x}; \bm{J}) \right\}\end{align}というGibbs-Boltzmann分布で振る舞いが記述される系を...
5日前
7/14 (月)

WindowsにおいてYOLO11のモデルをTFLite形式でエクスポートできない問題について
DeepLearningタグが付けられた新着記事 - Qiita

遭遇した問題環境Windows 11Python 3.11VS Code + Jupyter NotebookUltralytics YOLOを用いてモデルをTFLite形式に出力しようとしました。from ultralytics import YO...
5日前

Opensearch MCPを動かしてみる
Zennの「生成 AI」のフィード

AIにコンテンツを作成させる際、リソース(いわゆる背景画像やicon、SEなど)の作成までAIにお願いできたらな~と怠惰が極まってきました。生成AIを使用して直接画像や音声を生成することもできますが、今回は既に存在する大量の素材からAI自身て適した素材を選択する手法をとりたいと思います。Opensearchに素材データ(カテゴリや、素材自体の説明)を格納しておき、AIに自由に検索できるようにすればいい感じになるんじゃないの?というきっかけで、Opensearch MCPを試してみました。 Opensearch MCPIntroducing MCP in OpenSearchによる...
5日前

「先生、それAIに丸投げですか?」教員の認知負債を激増させる生成AI失敗事例30選と賢い活用術
Zennの「生成 AI」のフィード

MIT発の「認知負債」概念を教育現場に適用し、生成AIの誤った使い方が教員の専門性や思考力を低下させる30の具体例を提示。各事例について問題点を分析し、認知負債を防ぎながら効果的にAIを活用する実践的な方法を解説する実践書です。
5日前

AWS Summit Deep Dive:Builder's Fairから見るAIエージェントアプリの最新動向
Zennの「機械学習」のフィード

先端技術開発グループ(WAND)の小島です。先月(6月)に幕張メッセで開催されたAWS Summitに、WANDの全員で参加してきましたので、そのレポートをお届けします。 Expoエリアが面白いAWS Summitでは基調講演やセッション、スポンサーブースなど多彩なコンテンツが提供されていました。私の記事では、Expoエリア内の「AWS Builder's Fair」に絞って、詳細にレポートします。「Expoエリア」とは、メインセッション会場の隣で開催されているエリアで、最新技術の共有、実機デモ、ハンズオン、LT(ライトニングトーク)などが行われています。メインセッションは後日...
5日前

【2: 危険】Hyper3D.ai の安全性調査レポート
Zennの「生成 AI」のフィード

【2: 危険】Hyper3D.ai の安全性調査レポート対象AIサービス: Hyper3D.ai (Rodin & ChatAvatar)公式URL: https://hyper3d.ai/安全性レベル: 2: 危険 エグゼクティブ・サマリー法務判定:導入不可 - 中国系企業による重大な地政学的リスクとデータ主権侵害の懸念技術判定:技術的実績は認められるが、透明性と制御可能性に重大な欠陥主要警告事項:創業者全員が中国国籍(平均年齢24歳)、中国国家情報法の潜在的適用リスクByteDance(TikTok親会社)が主要投資家として参画上海本拠地な...
5日前

論文まとめ:VGGT: Visual Geometry Grounded Transformer
DeepLearningタグが付けられた新着記事 - Qiita

はじめに先月開催された CVPR2025 でBest Paper Awards となった論文のざっくりまとめ。もろもろ書きかけpaperproject pagegithub概要従来のBAなどの最適化を不要とし、画像から直接3D情報...
5日前

生成AIにFAQを作ってもらって、提案を通しやすくしよう
Zennの「生成 AI」のフィード

こんにちは、SODAでクオリティエンジニアをしているokauchiです。今回は提案の質を生成AIで上げてみようというテーマです。新しいプロセスを導入したいと提案はするものの、鋭い指摘をされて思わず提案を引っ込めてしまったことってありませんか?解決したい課題があってそれをなんとかしたい思いはとてもステキなんですが、残念ながら中身が伴っていないためにスムーズに話が進まない。厄介なのは自分では「これで大丈夫だろう、十分に練りきれた話だろう」と思ってしまうことですね。 提案が通らないのは「解像度の差」かもしれないエンジニアとして開発に携わっていると、新しいツールやプロセスの導入を提案し...
5日前

深層学習が多層の膨大なパラメータを学習できる雰囲気を理解する
37
Zennの「機械学習」のフィード


はじめに 筆者のモチベーション本記事のキーワードは、普遍近似定理(Universal Approximation Theorem)二重降下(Double Descent)過剰パラメータ化(Over-parameterized)多層化の利点(Benefits of Depth)といった感じで、これらのトピックを解説した素晴らしい和文資料は既にたくさん存在します。https://qiita.com/mochimochidog/items/ca04bf3df7071041561ahttps://ibis.t.u-tokyo.ac.jp/suzuki/lecture/...
6日前

深層学習が多層の膨大なパラメータを学習できる雰囲気を理解する
37
Zennの「ディープラーニング」のフィード


はじめに 筆者のモチベーション本記事のキーワードは、普遍近似定理(Universal Approximation Theorem)二重降下(Double Descent)過剰パラメータ化(Over-parameterized)多層化の利点(Benefits of Depth)といった感じで、これらのトピックを解説した素晴らしい和文資料は既にたくさん存在します。https://qiita.com/mochimochidog/items/ca04bf3df7071041561ahttps://ibis.t.u-tokyo.ac.jp/suzuki/lecture/...
6日前
7/13 (日)

[資格] E資格合格記
Zennの「ディープラーニング」のフィード

1.はじめに2025/2に受験したE資格に合格しました。内容を記載するのはNGなので、感想だけ記載します。 2.筆者バックグラウンドエンジニア歴4年目の32歳ポンコツ、一応AI系の会社にいるもののライブラリを使用してゴチャゴチャするだけなのでロジック周りは何も分かっていない。有難くも会社が講座を受講させてくれたので受験することになった。 3.勉強期間、方法講座を受講しつつ、以下に記載する方法で2ヶ月前ほどからボチボチ対策開始。受講する講座によってはハイレベルなものもあるようなので、それだけで合格できちゃうかも。参考書籍徹底攻略ディープラーニングE資格エンジ...
6日前

【論文解説】プロトタイプ学習による解釈可能な画像分類手法
Zennの「ディープラーニング」のフィード

Title: Interpretable Image Classification via Non-parametric Part Prototype Learning (CVPR 2025)Link: https://arxiv.org/abs/2503.10247v1Code: https://github.com/zijizhu/proto-non-param 概要 (Abstract)本論文では、プロトタイプを用いた部位ベースの説明可能な画像分類手法が提案されています。従来の説明可能モデル(Prototypical Part Network; ProtoPNet...
7日前