teleo-codex/domains/ai-alignment/external-evaluators-predominantly-have-black-box-access-creating-false-negatives-in-dangerous-capability-detection.md at 1d12ef084f31da65c42186bd88a6d08eec0a4c37

Teleo Agents 1d12ef084f substantive-fix: address reviewer feedback (frontmatter_schema)

2026-04-05 17:38:35 +00:00

374 B

Raw Blame History

related:
  - "White-box access to frontier AI models for external evaluators is technically feasible via privacy-enhancing technologies without requiring IP disclosure"
reweave_edges:
  - "White-box access to frontier AI models for external evaluators is technically feasible via privacy-enhancing technologies without requiring IP disclosure|related|2026-04-05"

374 B Raw Blame History

374 B

Raw Blame History