Zennの「機械学習」のフィードのフィード

Zennの「機械学習」のフィード

フィード

Raspberry Pi顔認識の次のステップ：face_recognitionライブラリで「顔認証」を実装する

Zennの「機械学習」のフィード

はじめに前回の記事「Raspberry PiとOpenCVではじめるリアルタイム顔認識入門」では、カメラ映像から顔を「検出」する方法を解説しました。今回はその次のステップとして、検出した顔が事前に登録した「誰」の顔なのかを「認証」する、本格的な顔認証システムの構築に挑戦します。このプロジェクトの主役は、dlibという強力な機械学習ライブラリをラップした、face_recognitionというPythonライブラリです。これを使うことで、驚くほど少ないコードで高精度な顔認証を実装できます。 Step 1: 「顔検出」と「顔認証」の違いまず、言葉の整理をしておきましょう。...

1日前

Raspberry PiとOpenCVではじめるリアルタイム顔認識入門（パフォーマンス改善Tips付き）

Zennの「機械学習」のフィード

はじめに手のひらサイズのコンピューター「Raspberry Pi」は、IoTや電子工作の分野で無限の可能性を秘めています。今回は、その中でも特に人気の高い**「カメラを使ったリアルタイム顔認識」**に挑戦します。この記事は、Web上にあるいくつかの優れた先人たちの記事を参考に、自身の知識と合わせて「これ一本で基本がわかる」を目指して再構成したものです。準備するものRaspberry Pi本体 (Pi 3, 4, 5など)USBカメラまたは Raspberry Pi カメラモジュールMicroSDカード (Raspberry Pi OSをインストール済み) S...

2日前

誤差逆伝播チートシート

Zennの「機械学習」のフィード

誤差逆伝播チートシート誤差逆伝播（Backpropagation）は、計算グラフにチェインルールを適用することで各パラメータの勾配を求める仕組みである。ここでは、ニューラルネットワークで頻出するパターンを計算グラフと数式で整理する。基本原則：チェインルール\frac{dL}{da} = \frac{dL}{dy} \cdot \frac{dy}{da}誤差は中間変数を経由して伝わる。すべての逆伝播はこの形に帰着する。足し算（加算ノード）y = a + b逆伝播:\frac{dL}{da} = \frac{dL}{dy}, \quad \frac...

2日前

Rayシリーズ：Ray Coreを利用したバッチ予測例の検証

Zennの「機械学習」のフィード

今回はRay Coreの例として提供されているバッチ予測のサンプルを通して、バッチ予測の実装方法をみていきたいと思います。Rayに関するシリーズは以下でまとめていますのでぜひご覧ください。https://zenn.dev/akasan/scraps/73a90764c065d1 早速例を試してみる今回は以下の例を試してみます。この例では、バッチで取得したデータを対象として、どのように推論を行うかを試す例となっております。https://docs.ray.io/en/latest/ray-core/examples/batch_prediction.html 環境構築uvを...

2日前

Stable Diffusionからの概念消去㉕：Minimalist Concept Erasure（論文）

Zennの「機械学習」のフィード

Minimalist Concept Erasure in Generative Models (ICML2025)ICMLでまだ読んでいなかった論文を発見したので扱います. この手の論文にしては珍しく日本人と思しき方の名前が確認できます. 書籍情報断りがない限りは以下の論文から図表を引用します.Yang Zhang, Er Jin, Yanfei Dong, Yixuan Wu, Philip Torr, Ashkan Khakzar, Johannes Stegmaier, and Kenji Kawaguchi. Minimalist concept erasure...

3日前

Google Cloud 認定資格奮闘記 ~Professional Machine Learning Engineer編~

Zennの「機械学習」のフィード

今回はGoogle Cloud認定資格の一つであるProfessional Machine Learning Engineer(以下、PMLE)を受験したのでその体験記になります。前回取得した資格についても記事にしているのでぜひご覧ください。https://zenn.dev/akasan/articles/c0d347a37065bc Professional Machine Learning EngineerについてPMLEはGoogle Cloudの認定資格の一つであり、特に機械学習に関するサービスおよびその取り扱い、実務への応用などについて問われる資格となります。PMLEで...

4日前

なぜ ChatGPT は「賢い」のか？AI の歴史を 70 年遡って見えた真実

Zennの「機械学習」のフィード

ChatGPT に質問を投げ、一瞬で返ってくる自然で精緻な答え。その背後には、70 年以上にわたる研究者たちの試行錯誤と積み重ねが存在します。本記事では、AI 研究史における 7 つの重要なマイルストーンを辿りながら、現代の LLM（大規模言語モデル）がどのように誕生したのかを解説します。過去を知ることは、未来を見通すための最も確かな鍵です。 AI の夜明け：シンボリック AI 🧠 (1950〜1980 年代)この時代は「シンボリック AI」と呼ばれ、記号とルールによって知識を表現しようとする試みが主流でした。背景：「人工知能」という言葉の誕生1956 年のダートマ...

4日前

身近なデータで試すPythonの機械学習！　その２　お住まいの地域の不動産取引価格　続編 2　-ハイパーパラメータ自動最適化！

Zennの「機械学習」のフィード

こんにちは！これまでの記事では、不動産取引価格のデータを用いて、1. 複数の機械学習モデルを試し、性能を比較する基本フロー2. 特定のモデル（LightGBM）に焦点を当て、学習・評価・保存する詳細手順をご紹介しました。前回の記事の最後では、モデル性能をさらに向上させるための一手として「ハイパーパラメータチューニング」の重要性に触れました。モデルの性能は、その内部設定であるハイパーパラメータに大きく左右されます。しかし、これらのパラメータを手動で調整するのは非常に手間がかかり、最適な組み合わせを見つけるのは至難の業です。そこで今回は、自動ハイパーパラメータ最適化フレームワー...

5日前

画像モデルのバックボーンとして最初に何を選ぶべきか？

Zennの「機械学習」のフィード

はじめに画像分類や物体検出などの画像認識タスクでは、バックボーンと呼ばれる画像特徴抽出を担うモデルの部分が最終的な精度に大きく影響します。世界中の研究者たちが高性能なモデルを次々と発表する中で、「どのバックボーンを選べばよいのか」という課題が生まれています。バックボーン選択が難しい理由まず、ResNet、EfficientNet、Vision Transformer など、選択肢となるアーキテクチャが非常に多いことが挙げられます。さらに、パラメータ数や推論速度といった実用上の制約に適合するモデルを見つけるのも一苦労です。また、最新の研究で高い性能を示したモデルが、実際の...

6日前

時系列データ分析論文④「 S4 実装編」

Zennの「機械学習」のフィード

概要前回に引き続き、S4論文の解説をします。今回は実装編です。Github: https://github.com/state-spaces/s4大変ありがたい事に、全実装は以下のページにまとまっています。https://github.com/state-spaces/s4/blob/e757cef57d89e448c413de7325ed5601aceaac13/models/s4/s4.pyさて、理論編でどういった変数が登場し、どう計算すれば入力uからyが求まるのか、が分かりました。ではいったい、それらをどう実装に落とし込むのか。ざっくり分けると、以下の要点をおさえる...

6日前

マテリアルズインフォマティクス（MI）入門：Pythonによる物性予測から逆問題設計まで

Zennの「機械学習」のフィード

📰 概要材料開発のスピードと効率を飛躍的に向上させる「マテリアルズ・インフォマティクス（MI）」を取り入れたいと考えたことはありますか。MIは、データ科学の力を使って新しい材料を効率的に探索・開発する革新的なアプローチとして、今、大きな注目を集めています。本書は、Pythonを用いてマテリアルズ・インフォマティクスの一連のワークフローをハンズオンで学ぶための入門書です。単純な物性予測から始まり、機械学習モデルの解釈、性能チューニング、さらには「欲しい物性を持つ未知の材料」を探索する逆問題設計、そして最終的には対話的なWebアプリケーションの開発まで、MIの核心技術を体系的に解説しています。この機会に是非、実践的なマテリアルズインフォマティクスを始めてみませんか。👫 対象とする読者・マテリアルズ・インフォマティクス（MI）を扱ったことがないが興味がある人・Pythonを用いたデータ解析や機械学習に挑戦したい材料科学系の学生・研究者・技術者・自身の研究や業務にMIを導入し、開発を効率化・高度化したいと考えている人・データ前処理、モデル構築、解釈、最適化、逆問題設計というMIの一連のフローを体系的に学びたい人💰 販売価格¥2000で販売しております！本技術書は随時アップデートされていきます。一度購入された方はアップデートされたとしても追加料金は発生しませんのでご安心ください。📰 アップデート情報2025/9/10: リリースしました！

7日前

Turing MLOpsチームの誕生秘話

Zennの「機械学習」のフィード

Turingには「MLOpsチーム」と呼ばれるチームがあります。このチームはもともと、自動運転を実現するMLモデルを開発する「E2Eチーム」から、2025年3月頃に独立して誕生しました。今回の記事では、MLOpsチーム誕生に至る経緯と、その役割について紹介できればと思います。自動運転MLモデル開発に必要なドメインは多いTuringのE2Eチームは、自動運転用の機械学習(ML)モデルを開発するチームです。チーム名の「E2E」はEnd to Endの意味で、このチームが開発するモデルの特徴を表しています。このチームには、自動運転MLモデルを開発するエンジニアが多くいますが、そのカ...

7日前

【ベクトル・行列】機械学習で使う数学をいまさら勉強する【図解あり】

Zennの「機械学習」のフィード

Webエンジニアとして7年、これまで機械学習とは無縁でしたが、手札を増やすべくディープラーニングの勉強を始めました！「機械学習で使う数学をいまさら勉強する」シリーズでは、「ロジスティック回帰モデル」および「ニューラルネットワーク」の理解を目標にします。本シリーズで目指す目標本記事は微分に続き、第2回として「ベクトル・行列」をまとめます。公開済み : 【微分】機械学習で使う数学をいまさら勉強する⭐️ 本記事：【ベクトル・行列】機械学習で使う数学をいまさら勉強する未公開：【指数関数・対数関数】機械学習で使う数学をいまさら勉強する未公開：【多変数関数の微分】機械学習で使う数...

8日前

ResNet18をRust&burnで実装する．

Zennの「機械学習」のフィード

はじめに機械学習クレートであるburnを用いて，ResNet18を実装した．データセットはMNISTを使用した．MNISTを使用した理由は，画像サイズが小さく，訓練の時間が短く済むからである．この実装は自身の機械学習モデル実装の学習のために行った．pytorchの公式実装コードを参考にして実装していく．実装したコードはこちらのリポジトリにある．本記事ではモデルの実装に焦点をあてている．そのため，データセットの読み込みや学習ループなどについてはリポジトリを参照してほしい．https://github.com/neruneruna7/my-resnet18注意点として，MPS...

9日前

AI駆動開発勉強会の振り返り

Zennの「機械学習」のフィード

1. はじめに2025年7月と8月に、弊社の私が所属する組織内でAI駆動開発の勉強会を開催しました。どのような背景があり勉強会を開催したのか、良かった点/改善するべき点、具体的にどのような内容だったのかを共有したいと思います。 2. 開催の背景勉強会のタイトルはAI駆動開発で学ぶTypeScript開発トレーニングでした。GitHub CopilotやCursor、Claude Code、Codex、Jules、KiroなどAI駆動開発ができるツールがありますが、ツールの使い方を学ぶというよりはAI駆動開発を通して、コーディングを学ぶという趣旨でした。この背景としては、弊社...

10日前

【学習ログ #0】Jリーグ勝敗予測システム[ 計画 ]

Zennの「機械学習」のフィード

このシリーズでは、Jリーグの勝敗予測システムを作りながら、作業手順を記録していきます。 1. 目的Jリーグの試合結果をもとに勝敗確率を予測するシステムを作る統計的な手法（EloレーティングやPoissonモデル）を活用する出力結果を記事としてまとめ、ブログに公開する 2. ゴールイメージ短期（最初の数か月）ローカル環境で完結させるCSVファイルに保存した試合データを使用Eloレーティングで勝敗予測を出す手順と結果をブログ記事に残す中期データ量を増やすPoissonモデルや機械学習を追加可視化（Elo推移や相性グラフ）を導入予測記事を...

10日前

エージェント型AI（Agentic AI）の最新動向 - 2025年9月第1週まとめ

Zennの「機械学習」のフィード

エージェント型AI（Agentic AI）の最新動向まとめ2025年9月1日〜7日の重要な発表・開発 1. 主要発表・リリース DeepSeek社の新エージェント開発中国のAIスタートアップDeepSeek社が、OpenAIに対抗する高度なAIエージェント機能を持つモデルを2025年末までにリリース予定と発表。このシステムは、最小限の指示でマルチステップタスクを自律的に実行し、過去の行動から学習・改善する設計となっている。 Anthropic社のChromeエクステンションAnthropic社が8月26日にClaude AIエージェント用のChromeエクステンショ...

11日前

Transformer に触れてみる (2) — ViT もどき

Zennの「機械学習」のフィード

目的Vision Transformer入門をパラパラめくってもさっぱり理解できる気がしない。arXiv:2010.11929 An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale のいつものパッチ並べを見るのはもう飽きた。のを何とかしたい。ということで、Transformer に触れてみる (1) の続き。再び Vibe codingまたもや GPT-4.1 にお願いして学習素材を作ってもらうが、ViT は Transformer エンコーダに MLP を繋げる形...

11日前

クラスタリングで最適なクラスタ数を決める方法～エルボー法とシルエットスコア～

Zennの「機械学習」のフィード

この記事で学べることみなさん、こんにちは。りゅう9です。この記事ではクラスタリングにおいて最適なクラスタ数を決める方法としてエルボー法やシルエットスコアを使った方法を解説します。なぜクラスタ数を決める必要があるのかクラスタリングでは、どうやってクラスタ数を決定するか？が大きな課題となります。k-means法やk-medoids法では初めにクラスタ数を指定してからクラスタリングを始めます。しかし、未知のデータでは、このデータがいくつのクラスタに分類できるかは予想できません。そこで、客観的な指標を用意することが必要となります。準備 (SSEとシルエットスコアの計算方法)...

11日前

timm で画像の前処理を定義する

Zennの「機械学習」のフィード

はじめに画像分類の事前学習済みモデルを扱いたい時や、画像特徴量抽出器としての事前学習済み Backbone を探す際に timm が選択肢として上がってくると思います。この記事では、画像の前処理クラスに対して新しく timm の関数で定義する場合と事前学習済みモデルの前処理を使う場合の二つを紹介します。!以下の内容は timm==1.0.19 で検証しています。https://huggingface.co/docs/timm/indexhttps://github.com/huggingface/pytorch-image-models 新しく前処理を定義する...

12日前