Zennの「AI」のフィード
フィード

AIエージェントのコンテキスト消費を80%削減するCLIツール「ctxpack」を作った
Zennの「AI」のフィード
はじめにClaude Code などの AI エージェントに URL を読ませると、ページのナビゲーション・広告・フッター・スクリプトタグといった「読んでも意味のないノイズ」がコンテキストを大量に消費します。Python の公式ドキュメントを 1 ページ読ませるだけで 80,000 トークンを超えることもあります。この体験が続いたため、AIエージェントが URL を読む前に呼ぶ前処理 CLI「ctxpack」 を作りました。!この記事でわかること。ctxpack が何をするツールか(機能・デモ・インストール方法)ノイズ除去の仕組み(コンテンツフィルタリング・クエリマッ...
1時間前

grepを毎回起動するの、もうやめたい。FFFでAIの検索体験を速くする
Zennの「AI」のフィード
AIエージェントでコードベースを触っていると、地味に気になるのが「検索の回数」です。rg や grep 自体は優秀なのですが、Claude Code や Codex、OpenCode のように同じリポジトリに対して何度も検索を繰り返す使い方だと、毎回プロセスを起動して、毎回 .gitignore を読んで、毎回ファイルツリーをなめるコストが積み上がります。1回の検索なら誤差でも、1セッションで数十回、数百回と繰り返すと、無視しにくくなってきます。そんなときに見つけたのが FFF です。https://github.com/dmtrKovalenko/fffFFF は Neovi...
1時間前

弱いAIで強いAIと戦う方法 — Semgrepの検証パイプラインに学ぶ、低資本時代の個人開発設計論
Zennの「AI」のフィード
はじめに:AIが「資本力の差」になり始めているClaude Mythos のようなフロンティア基盤モデルは目覚ましく高度化していますが、それに比例して利用コストも高騰し続けています。最先端のモデルを潤沢に回せるのは資本力のある組織だけ——「AIを使えるかどうか」ではなく「どのレベルのAIを、どれだけ使えるか」が格差になる時代が、すぐそこまで来ていると感じます。この懸念を裏付けるデータがあります。Anthropic が2025年12月に社内で実施した実験「Project Deal」です。69人の社員にそれぞれ AI エージェントを割り当て、実際のお金と実際の商品を使った社内マーケッ...
1時間前

Claude Code のコスト削減を実測に落とす — 1施策ずつ段階投入して前週比を測る運用設計
Zennの「AI」のフィード
試算は「段階投入」で実測に変わる前作「Claude Code のコストを 30% 削る試算」では、モデル選択・プロンプトキャッシュ・出力削減の3軸で月額30%の削減ポテンシャルを見積もった。だが試算は試算でしかない。30%は前提(実行回数・キャッシュヒット率・出力短縮率)の上に乗った数字で、本番でそのまま出るとは限らない。結論を先に置く。試算を実測に変える方法は、施策を1つずつ投入して前週比を測ることに尽きる。これはSREのカナリアリリースと同じ考え方になる。1施策を1カナリアとみなし、変更前後の差分だけを観測する。本記事は、その「測り方」の運用設計を扱う。試算の中...
1時間前

Claude Fable 5 — Opus の上に来た新ティアを実装者目線で整理する
Zennの「AI」のフィード
2026年6月9日、Anthropic が Claude Fable 5(claude-fable-5)を GA にした。Opus の上に新設された最上位ティアで、入出力単価は Opus 4.8 のちょうど2倍。そして従来モデルと違い、安全分類器による拒否(refusal)と別モデルへのフォールバックが API 設計に組み込まれている。この記事は、Claude API を本番で使っている開発者向けに「何が変わり、コードのどこを直すべきか」を公式ドキュメントベースで整理する。位置づけ・価格・API差分・refusal/fallback の実装・プロンプティング・移行チェックリストまでを1...
1時間前

AIとはハードスキルではなくソフトスキルを写す鏡である
Zennの「AI」のフィード
!このポエムは私個人の考えを言語化するトレーニングです全てを実践できているかといえば、まだ道の途中でもあります私の先を生きている人にとっては「何を今更」感があると思います!この記事に「フルスタック」という単語が出てきますが、平易な表現として利用しています自分で「フルスタック」を名乗ったり、「フルスタック」を語ることはおこがましいとすら思っていますが、他に適切な表現が思い浮かばなかったのでこうしていますこんにちは、私はJINSのITデジタル部に2021年に入社しました内田と申します古い記事ですが、私はこんな人です↓https://jins-co.recruitment...
1時間前

【前編】Claude Opus 4.8で考え、Sonnet 4.6に書かせる ── CLAUDE.mdに「AIへのルール」を置いてClaud
Zennの「AI」のフィード
地方で独立系システムアーキテクトとして活動している、だいこん(H.I. MET Architect)です。本業では病院の院内SEとして医療DXを進めつつ、副業で業務統合基盤「Weaver」の事業展開やモバイルアプリの開発をしています。最近、Claude Codeを完全に使い倒しています。どのくらい使い倒しているかというと、私の主な仕事が「AIに渡すルールを考えること」と「YESと答えること」の2つに集約されつつあるくらいです。手は、コーヒーカップを支えるために温存しています。…とはいえ、ただ丸投げして上手くいっているわけではありません。AIに気持ちよく働いてもらうために、人間側でやっ...
2時間前

board の請求・見積を AI から操作する MCP サーバを作った(非公式OSS / TypeScript)
Zennの「AI」のフィード
3行まとめクラウド請求管理 SaaS board を、Claude などの AI に話しかけて操作できる MCP サーバにしました「今月の未入金を一覧して」みたいな一言で、ブラウザを開かずに済みます非公式 OSS(MIT)。npx @breakedge/the-board-mcp-server ですぐ試せます 先に大事な免責このプロジェクトは board を提供するヴェルク株式会社とは提携・承認関係にない、完全な非公式 OSS です。board® は同社の商標です。請求書・見積書などの財務データを扱うツールなので、後述のとおりデフォルトは読み取り専用にしていますが、利...
2時間前

競馬AI開発記録 #17 LightGBM rank_xendcg との死闘:勾配爆発を防ぐためのターゲット設計
Zennの「AI」のフィード
1. 概要前回(第16話)では、データリークを排除した環境において、動的特徴量を導入することで穴馬の識別能力(KS統計量 0.50)を確保することに成功しました。しかし、穴馬検知(二値分類)だけでは、レース全体の期待値を最大化するような「適切な順位付け」を行うには不十分です。第17話では、モデルの目的関数を分類からランキング学習(Learning to Rank: LTR)へと転換し、レース内の全出走馬の相対的な序列を予測する試みについて記述します。その過程で直面した、LightGBMの rank_xendcg における「勾配爆発」という数学的課題と、その解決策としてのターゲット...
2時間前

Skill.mdのdescriptionを書き間違えると、スキルが一切起動しない話
Zennの「AI」のフィード
「スキルを作ったのに使われない」という体験Codex や Claude Code でスキルを作り始めると、最初はこういう状況によくぶつかる。SKILL.md を書いてディレクトリに置いた「デプロイして」と指示したのに、なぜかスキルが起動しないdescription を書いたのに、エージェントがスキルを認識していないように見える原因を調べると、ほぼ毎回 description の書き方に行き着く。この記事では、description がなぜスキル起動を左右するのか、どう書けば確実に動くのかを、判断理由ごと解説する。 descriptionはLevel 1メタデー...
3時間前

Mythos級モデル「Claude Fable 5」の一般提供開始
Zennの「AI」のフィード
2026年6月9日(米国時間)、Anthropicが新モデル Claude Fable 5 を発表しました。4月に限定公開された「Mythos」クラスのモデルが、ついに一般ユーザーにも開放された形です。本記事では公式発表をベースに、何が新しいのか・どう使えるのかを整理します。!本記事は2026年6月10日時点の情報です。特にサブスクプランでの提供条件は段階的に変わる予定なので、最新情報は公式発表を確認してください。 Fable 5とはClaude Fable 5は、Anthropicの第5世代モデルファミリーの第1弾であり、従来の最上位だったOpusクラスのさらに上に位置...
3時間前

Agentforce Self-Serviceの設定|Help AgentをSummer '26で立ち上げるまでの流れと注意点
Zennの「AI」のフィード
はじめに「セルフサービスポータル、ちゃんと機能してますか?」と聞かれると、少し答えに詰まる現場も多いのではないかと思う。静的なFAQページに、どこに問い合わせればいいかわからないフォーム、そして「結局、電話した」という顧客、そんな状況を打開しようとSalesforceが打ち出してきたのが、Agentforce Self-Serviceです。Summer '26(2026年6月15日提供開始)でAgentforce Self-Serviceが正式リリースされました。目玉はHelp Agentで、「6クリック以下でセットアップできる」とSalesforce自身が公式に発表していま...
3時間前

個人で作ったMCPサーバーを公式レジストリに公開するまで — npm publish と mcp-publisher の2段階
Zennの「AI」のフィード
TL;DR個人で TypeScript の MCP サーバーを作り、npm と MCP 公式レジストリ(Model Context Protocol Registry) の両方に公開した。公開は 2段階。npm publish(パッケージ本体)→ mcp-publisher(レジストリへのメタデータ登録)。ハマりどころは「package.json.mcpName と server.json.name の完全一致」「server.json は手動同期」「description 100文字以下」「npx のキャッシュ」あたり。そして 正直な話: レジストリに載っても、それだけで...
4時間前

AI OCRの出力を、そのまま信じてはいけない — 「要確認UI」を作るための設計
Zennの「AI」のフィード
はじめに個人開発で、画像からシリアルナンバーを読み取るWebツール「シリトル」を作って本番リリースしました。CDなどに封入された英数字のコードを、スマホで撮った画像からAIでまとめて読み取る、というツールです。画像をアップロードするとAIが読み取る。画像はGemini APIで処理し、読み取り後に破棄するこの記事は、その中核である AI OCRのパイプライン設計 について書きます。具体的には「マルチモーダルAIにOCRをやらせたとき、その出力をどうUIに落とすか」という話です。結論を先に言うと、AIの読み取り結果は、ユーザーに見せる前に必ず「疑う」工程を挟む べきだ、という...
7時間前

AIでツール作成(自分の欲しいもの)C# で
Zennの「AI」のフィード
どんなものを作成した?エビデンス作成ツール:EbiEbihttps://www.totosasa.jp/profile/freeware/EbiEbi.html なぜ作った?システム開発の現場では、エビデンス(証跡)取得が地味に面倒くさくてウザい・・テスト、手順書、不具合の説明、不具合再現方法、等々。。なにか良いものはないものか・・、ないわ・・、じゃあ作るかって感じで作ってみました なぜ公開?技術ブログは書いてみたいとは思ってました。私は普段、業務システムをメインに活動しています、当然ながら公開なんぞ絶ーっ対出来ないわけで・・、自分用のツール(フリーソフト)...
8時間前

何故、Skillが必要なのか
Zennの「AI」のフィード
はじめに最初に Skill の存在を知ったとき、システムプロンプトや Agents as Tools 等のマルチエージェントと比べて「本当に必要なの?」と思ってしまいました。ですが調べてみると、LLM の性質を非常に上手に利用しており、コンテキスト効率・保守性・テスト容易性の全てを改善する仕組みであることに気づきました。この記事では、Skill がどのように優れているのかを体系的にまとめていきます。 この記事で得られることSkill がどのように動作し、LLM の推論にどう影響するかが分かるコンテキスト効率・保守性・テスト容易性がどう改善されるか理解できる単一プロン...
9時間前

# コンテキスト管理とコスト最適化——Claudeを長く快適に使うコツ【中級Ch6】
Zennの「AI」のフィード
!このシリーズはClaude Code初心者〜中級者向けの教科書です。【初心者編】Ch1: Claude Codeって何者?Ch2: インストールと最初の5分Ch3: 話しかけ方のコツCh4: Claude Codeが話しかけてくる英語、全部訳してみたCh5: よく出るBashコマンド20選Ch6: やってはいけないこと7選【中級編】中級Ch1: MCPって何?中級Ch2: MCP接続ガイド(ケース別)中級Ch3: Skillsの呼び方と選び方中級Ch4: Hooksで自動化する中級Ch5: 並列Agentで寝てる間に仕事させる中級Ch6: コンテキスト...
9時間前

GitHub Copilotの従量課金、上限を上げても全社停止は防げない:企業が取れる対応策
Zennの「AI」のフィード
はじめに:前回記事の答え合わせをします以前、課金変更が発表された直後にこちらの記事を書きました。https://zenn.dev/headwaters/articles/github-copilot-ai-credits-billing-2026この記事では「AI credits」「プーリング」「4段階の予算制限」といった発表時点の仕様を整理しました。あれから2026年6月1日に従量課金が正式に施行され、実運用が始まったことで、発表時には見えていなかった重要な事実がいくつも明らかになっています。結論を先に言うと、前回記事の助言のうち一部は施行後の仕様に照らすと修正が必要でし...
9時間前

AIを使う側と、載せる側。個人開発者から見たトークン経済
Zennの「AI」のフィード
AIチャットボットのプラグインを作って公開したとき、いちばん多かった離脱が、どこで起きていたか分かりますか。機能の説明でも、設定画面でもありませんでした。「APIキーを取得して、プロバイダに課金を設定してください」という、その一文の前でした。インストールはしてくれる。有効化もする。そこから先で、止まる。考えてみれば当たり前で、利用者からすれば、入れてみただけのプラグインのために、知らない会社にクレジットカードを登録して、いくらかかるかも分からない蛇口を自分側に開ける、という話なんです。機能が良いか悪いか以前の壁でした。インストール数と、実際にチャットが動いた数の差を見て、その谷の深さに...
11時間前

AIエージェント検証用PCを作るメモ【設計補遺】:ブラウザAIのために端末とアカウントを分けた理由
Zennの「AI」のフィード
はじめにこれまで「AIエージェント検証用PCを作るメモ」として、設計思想の整理からDocker、WSL、Git、Node.js、Codex CLIの導入までを記録してきた。しかしシリーズを振り返ると、そもそも「なぜ検証専用のPCを用意したのか」という出発点を、十分に書けていなかった。この検証用PCを作った本来の目的は、Codex CLIを動かすことだけではない。試してみたかったのは、ブラウザ上の情報を読み取り、複数のタブを扱い、場合によってはWeb上で操作まで行うAIエージェントだった。しかし、普段使いのPCやブラウザには、ログイン情報、Cookie、閲覧履歴、クラウドサー...
11時間前