AI Conductor / Harness Engineer
LLMネイティブ開発のための、エージェント基盤・ハーネス設計・品質統制を設計・実装しています。
複数のAI・工程・責務を束ね、観測可能・再現可能・統制可能なワークフローに落とし込むことが主な関心領域です。
I build agent systems, control planes, and quality governance for LLM-native development.
My work focuses on turning ambiguous AI workflows into observable, reviewable, and governable execution systems.
QA / SDET の経験を土台にしつつ、現在は agentic workflows, orchestration, state, contracts, evidence, and publish gates を主戦場にしています。
-
- AIエージェントの開発フローを統制する control plane。
plan / dev / acceptance / integrate / publish を責務分離して扱う、開発向けオーケストレーション基盤。
- AIエージェントの開発フローを統制する control plane。
-
- コーディングAIエージェント向けの契約駆動プロトコル。
intent / task / acceptance / publish gate / evidence を明示し、統制可能な実行モデルを定義。
- コーディングAIエージェント向けの契約駆動プロトコル。
-
- R&Dエージェントのための多層オーケストレーション基盤。
research / insight / gate / sync / notify をつなぐ探索・評価・連携の土台。
- R&Dエージェントのための多層オーケストレーション基盤。
-
- QA / SDET / LLM の実践を再現可能な形で示すポートフォリオ。
テスト、CI、カバレッジ、検証資産を含む品質成果のハブ。
- QA / SDET / LLM の実践を再現可能な形で示すポートフォリオ。
-
プロンプトエンジニアリング ? RAG ? Skills ? MCP ? コンテキストエンジニアリング ? - 全然わからん!
- 2026年のLLMパイプラインを、MCP・Skills・コンテキストエンジニアリングの役割に分けて整理した記事。
「何をどのレイヤーで扱うのか」を見直すための全体マップです。
- 2026年のLLMパイプラインを、MCP・Skills・コンテキストエンジニアリングの役割に分けて整理した記事。
-
「生成AI!頼むから記憶してくれ!」をOSS調査で分解すると2つの方向性が見えた
- AIの「記憶」を、会話継続のための記憶と、長コンテキスト運用を支える記憶層に分けて整理した記事。
完成品としてのAIと、差し込み可能な記憶モジュールの違いも扱っています。
- AIの「記憶」を、会話継続のための記憶と、長コンテキスト運用を支える記憶層に分けて整理した記事。
-
ついにローカルLLMで安心して仕事が出来る!― Qwen3.5-27B 採用レポート
- ローカルLLMを実運用の観点から評価し、Qwen3.5-27Bを常用エンジンとして採用した判断記録。
ベンチマークの数字だけでなく、実際のコーディング体験ベースで整理しています。
- ローカルLLMを実運用の観点から評価し、Qwen3.5-27Bを常用エンジンとして採用した判断記録。
-
LLM時代のQA再設計──自動化ツール群で考えた「品質保証の再定義」
- QAを「テスト係」ではなく、LLM時代の品質統制として捉え直した記事。
現在の agent systems / harness engineering 的な発想の土台になっている整理です。
- QAを「テスト係」ではなく、LLM時代の品質統制として捉え直した記事。
-
- ローカルLLM前提で設計した、作詞支援ワークベンチ。
-
- Suno / Sora / 画像生成 / ドット絵など、生成AI表現の制作物・設定・振り返りをまとめたサブポートフォリオ。
ファンメイド作品を含むため、該当作品には非公式である旨と権利注記を記載。
- Suno / Sora / 画像生成 / ドット絵など、生成AI表現の制作物・設定・振り返りをまとめたサブポートフォリオ。
-
- 収穫希望週から逆算して播種・定植週を提示する、作付け計画支援OSS。
- Agent Systems
- Harness Engineering
- Control Planes
- Quality Governance
- Contract-Driven Workflows
- State / Memory / Evidence Design
- LLM-native Development
- Reproducible QA Assets
- Languages: Python, TypeScript / JavaScript, SQL, Bash
- QA / Testing: pytest, Playwright, Airtest, Jest / Vitest, GitHub Actions, coverage, CodeQL
- Backend / Infra: FastAPI, Node.js, REST API design, Docker, devcontainers
- Frontend: React, Next.js, Vite, Tailwind CSS
- LLM / GenAI: OpenAI API, Gemini, local LLMs, LiteLLM, orchestration tooling, Suno / Sora / image generation workflows
AI Conductor Harness Engineer Agent Systems Control Plane Quality Governance LLM Orchestration




