実
What is it?
タスク実行後のLLM-as-Judge評価とフィードバックループを備えた実行-評価パターンで、出力品質を継続的に改善します。
How to use it?
Claude環境にインストールすると、実行-判定パターン関連の作業時に自動的にスキルのガイドラインを適用します。
Key Features
- タスク実行後のLLM-as-Judge評価とフィードバックループを備えた実行-評価パターン
- Claude開発ワークフローとのシームレスな統合
- 実行-判定パターンの包括的なガイドラインとベストプラクティス
Related Skills
More from AI & MLAgent Evaluation Framework
Comprehensive Claude Code agent evaluation framework with multi-dimensional scoring, LLM-as-Judge mode, and research-backed performance variance analysis
433NeoLabHQ
AI & ML
Developer Tools
Self-Reflection Framework
Iterative self-improvement system with task complexity grading, strict quality gatekeeper role, confidence thresholds, and verification checklists
433NeoLabHQ
AI & ML
Developer Tools
Multi-Perspective Critique
Multi-perspective review system using Multi-Agent Debate and LLM-as-Judge patterns with 3 specialized judges, debate rounds, and consensus building
433NeoLabHQ
AI & ML
Developer Tools