refactor: centralize PR state transitions in lib/pr_state.py

Replace 38 hand-crafted UPDATE prs SET status calls across evaluate.py and merge.py with 7 centralized functions that enforce invariants: - close_pr: always syncs Forgejo (opt-out for reconciliation) - approve_pr: raises ValueError on empty domain (prevents NULL bugs) - mark_merged: always sets merged_at, clears last_error - mark_conflict: always increments merge_failures, sets merge_cycled - mark_conflict_permanent: terminal conflict state - reopen_pr: handles all reopen scenarios (transient, rejection, reeval) - start_review: atomic claim with bool return This eliminates the class of bugs that produced 3 incidents: 1. Domain NULL on musings bypass (7 PRs stuck, 20h zero throughput) 2. Forgejo ghost PRs (70 PRs open on Forgejo but closed in DB) 3. Merge_cycled missing on various close paths Also fixes: 3 close paths in merge.py had DB update before Forgejo call (reversed order). close_pr does Forgejo first, then DB. Only remaining raw status transition: _claim_next_pr (approved→merging) which is an atomic subquery and doesn't have invariant requirements. 20 new tests, 264 total passing, 0 regressions. Net -101 lines in evaluate.py + merge.py. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-04-16 12:08:50 +01:00 · 2026-04-16 12:08:50 +01:00 · 1f5eb324f3
commit 1f5eb324f3
parent d073e22e8d
4 changed files with 590 additions and 158 deletions
--- a/lib/evaluate.py
+++ b/lib/evaluate.py
@ -31,6 +31,7 @@ from .forgejo import get_agent_token, get_pr_diff, repo_path
 from .merge import PIPELINE_OWNED_PREFIXES
 from .llm import run_batch_domain_review, run_domain_review, run_leo_review, triage_pr
 from .feedback import format_rejection_comment
 from .pr_state import approve_pr, close_pr, reopen_pr, start_review
 from .validate import load_existing_claims
 logger = logging.getLogger("pipeline.evaluate")
@ -375,17 +376,7 @@ async def _terminate_pr(conn, pr_number: int, reason: str):
        repo_path(f"issues/{pr_number}/comments"),
        {"body": comment_body},
    )
-    await forgejo_api(
+    await close_pr(conn, pr_number, last_error=reason)
        "PATCH",
        repo_path(f"pulls/{pr_number}"),
        {"state": "closed"},
    )
    # Update PR status
    conn.execute(
        "UPDATE prs SET status = 'closed', last_error = ? WHERE number = ?",
        (reason, pr_number),
    )
    # Tag source for re-extraction with feedback
    cursor = conn.execute(
@ -506,11 +497,7 @@ async def evaluate_pr(conn, pr_number: int, tier: str = None) -> dict:
        return {"pr": pr_number, "terminal": True, "reason": "eval_budget_exhausted"}
    # Atomic claim — prevent concurrent workers from evaluating the same PR (Ganymede #11)
-    cursor = conn.execute(
+    if not start_review(conn, pr_number):
        "UPDATE prs SET status = 'reviewing' WHERE number = ? AND status = 'open'",
        (pr_number,),
    )
    if cursor.rowcount == 0:
        logger.debug("PR #%d already claimed by another worker, skipping", pr_number)
        return {"pr": pr_number, "skipped": True, "reason": "already_claimed"}
@ -533,8 +520,7 @@ async def evaluate_pr(conn, pr_number: int, tier: str = None) -> dict:
    diff = await get_pr_diff(pr_number)
    if not diff:
        # Close PRs with no diff — stale branch, nothing to evaluate
-        await forgejo_api("PATCH", repo_path(f"pulls/{pr_number}"), {"state": "closed"})
+        await close_pr(conn, pr_number, last_error='closed: no diff against main (stale branch)')
        conn.execute("UPDATE prs SET status='closed', last_error='closed: no diff against main (stale branch)' WHERE number = ?", (pr_number,))
        return {"pr": pr_number, "skipped": True, "reason": "no_diff_closed"}
    # Musings bypass
@ -545,12 +531,8 @@ async def evaluate_pr(conn, pr_number: int, tier: str = None) -> dict:
            repo_path(f"issues/{pr_number}/comments"),
            {"body": "Auto-approved: musings bypass eval per collective policy."},
        )
-        conn.execute(
+        approve_pr(conn, pr_number, domain='cross-domain', auto_merge=1,
-            """UPDATE prs SET status = 'approved', leo_verdict = 'skipped',
+                   leo_verdict='skipped', domain_verdict='skipped')
               domain_verdict = 'skipped', domain = COALESCE(domain, 'cross-domain'),
               auto_merge = 1 WHERE number = ?""",
            (pr_number,),
        )
        return {"pr": pr_number, "auto_approved": True, "reason": "musings_only"}
    # Reweave bypass — reweave PRs only add frontmatter edges (supports/challenges/
@ -566,12 +548,8 @@ async def evaluate_pr(conn, pr_number: int, tier: str = None) -> dict:
            repo_path(f"issues/{pr_number}/comments"),
            {"body": "Auto-approved: reweave structural update (frontmatter edges only). Leo reviews manually."},
        )
-        conn.execute(
+        approve_pr(conn, pr_number, domain='cross-domain', auto_merge=1,
-            """UPDATE prs SET status = 'approved', leo_verdict = 'skipped',
+                   leo_verdict='skipped', domain_verdict='skipped')
               domain_verdict = 'skipped', auto_merge = 1,
               domain = COALESCE(domain, 'cross-domain') WHERE number = ?""",
            (pr_number,),
        )
        db.audit(
            conn, "evaluate", "reweave_bypass",
            json.dumps({"pr": pr_number, "branch": branch_name}),
@ -676,7 +654,7 @@ async def evaluate_pr(conn, pr_number: int, tier: str = None) -> dict:
        if domain_review is None:
            # OpenRouter failure (timeout, error) — revert to open for retry.
            # NOT a rate limit — don't trigger 15-min backoff, just skip this PR.
-            conn.execute("UPDATE prs SET status = 'open' WHERE number = ?", (pr_number,))
+            reopen_pr(conn, pr_number)
            if pr_cost > 0:
                conn.execute("UPDATE prs SET cost_usd = cost_usd + ? WHERE number = ?", (pr_cost, pr_number))
            return {"pr": pr_number, "skipped": True, "reason": "openrouter_failed"}
@ -700,13 +678,9 @@ async def evaluate_pr(conn, pr_number: int, tier: str = None) -> dict:
    if domain_verdict == "request_changes":
        logger.info("PR #%d: domain rejected, skipping Leo review", pr_number)
        domain_issues = _parse_issues(domain_review) if domain_review else []
-        conn.execute(
+        reopen_pr(conn, pr_number, leo_verdict='skipped',
-            """UPDATE prs SET status = 'open', leo_verdict = 'skipped',
+                  last_error='domain review requested changes',
-               last_error = 'domain review requested changes',
+                  eval_issues=json.dumps(domain_issues))
               eval_issues = ?
               WHERE number = ?""",
            (json.dumps(domain_issues), pr_number),
        )
        db.audit(
            conn, "evaluate", "domain_rejected", json.dumps({"pr": pr_number, "agent": agent, "issues": domain_issues})
        )
@ -744,7 +718,7 @@ async def evaluate_pr(conn, pr_number: int, tier: str = None) -> dict:
        if leo_review is None:
            # DEEP: Opus rate limited (queue for later). STANDARD: OpenRouter failed (skip, retry next cycle).
-            conn.execute("UPDATE prs SET status = 'open' WHERE number = ?", (pr_number,))
+            reopen_pr(conn, pr_number)
            if domain_verdict != "skipped":
                pr_cost += costs.record_usage(
                    conn, config.EVAL_DOMAIN_MODEL, "eval_domain",
@ -793,10 +767,7 @@ async def evaluate_pr(conn, pr_number: int, tier: str = None) -> dict:
        branch_name = branch_row["branch"] if branch_row else ""
        is_agent_pr = not branch_name.startswith(PIPELINE_OWNED_PREFIXES)
-        conn.execute(
+        approve_pr(conn, pr_number, domain=domain, auto_merge=1 if is_agent_pr else 0)
            "UPDATE prs SET status = 'approved', domain = COALESCE(domain, ?), auto_merge = ? WHERE number = ?",
            (domain, 1 if is_agent_pr else 0, pr_number),
        )
        db.audit(
            conn,
            "evaluate",
@ -821,10 +792,7 @@ async def evaluate_pr(conn, pr_number: int, tier: str = None) -> dict:
        if leo_verdict == "request_changes" and leo_review is not None:
            all_issues.extend(_parse_issues(leo_review))
-        conn.execute(
+        reopen_pr(conn, pr_number, eval_issues=json.dumps(all_issues))
            "UPDATE prs SET status = 'open', eval_issues = ? WHERE number = ?",
            (json.dumps(all_issues), pr_number),
        )
        # Store feedback for re-extraction path
        feedback = {"leo": leo_verdict, "domain": domain_verdict, "tier": tier, "issues": all_issues}
        conn.execute(
@ -1050,11 +1018,7 @@ async def _run_batch_domain_eval(
        pr_num = pr_row["number"]
        # Atomic claim
-        cursor = conn.execute(
+        if not start_review(conn, pr_num):
            "UPDATE prs SET status = 'reviewing' WHERE number = ? AND status = 'open'",
            (pr_num,),
        )
        if cursor.rowcount == 0:
            continue
        # Increment eval_attempts — skip if merge-cycled (Ganymede+Rhea)
@ -1074,7 +1038,7 @@ async def _run_batch_domain_eval(
        diff = await _get_pr_diff(pr_num)
        if not diff:
-            conn.execute("UPDATE prs SET status = 'open' WHERE number = ?", (pr_num,))
+            reopen_pr(conn, pr_num)
            continue
        # Musings bypass
@ -1084,12 +1048,8 @@ async def _run_batch_domain_eval(
                repo_path(f"issues/{pr_num}/comments"),
                {"body": "Auto-approved: musings bypass eval per collective policy."},
            )
-            conn.execute(
+            approve_pr(conn, pr_num, domain='cross-domain', auto_merge=1,
-                "UPDATE prs SET status = 'approved', leo_verdict = 'skipped', "
+                       leo_verdict='skipped', domain_verdict='skipped')
                "domain_verdict = 'skipped', domain = COALESCE(domain, 'cross-domain'), "
                "auto_merge = 1 WHERE number = ?",
                (pr_num,),
            )
            succeeded += 1
            continue
@ -1130,11 +1090,7 @@ async def _run_batch_domain_eval(
            running_bytes += p_bytes
        overflow = [p for p in pr_diffs if p not in kept]
        for p in overflow:
-            conn.execute(
+            reopen_pr(conn, p["number"], dec_eval_attempts=True)
                "UPDATE prs SET status = 'open', eval_attempts = COALESCE(eval_attempts, 1) - 1 "
                "WHERE number = ?",
                (p["number"],),
            )
            claimed_prs.remove(p["number"])
            logger.info(
                "PR #%d: diff too large for batch (%d bytes total), deferring to next cycle",
@ -1166,7 +1122,7 @@ async def _run_batch_domain_eval(
        # Complete failure — revert all to open
        logger.warning("Batch domain review failed — reverting all PRs to open")
        for pr_num in claimed_prs:
-            conn.execute("UPDATE prs SET status = 'open' WHERE number = ?", (pr_num,))
+            reopen_pr(conn, pr_num)
        return 0, len(claimed_prs)
    # Step 3: Parse + validate fan-out
@ -1198,17 +1154,13 @@ async def _run_batch_domain_eval(
        if pr_num in fallback_prs:
            # Revert — will be picked up by individual eval next cycle
-            conn.execute(
+            reopen_pr(conn, pr_num, dec_eval_attempts=True)
                "UPDATE prs SET status = 'open', eval_attempts = COALESCE(eval_attempts, 1) - 1 "
                "WHERE number = ?",
                (pr_num,),
            )
            logger.info("PR #%d: batch fallback — will retry individually", pr_num)
            continue
        if pr_num not in valid_reviews:
            # Should not happen, but safety
-            conn.execute("UPDATE prs SET status = 'open' WHERE number = ?", (pr_num,))
+            reopen_pr(conn, pr_num)
            continue
        review_text = valid_reviews[pr_num]
@ -1235,11 +1187,9 @@ async def _run_batch_domain_eval(
                "SELECT eval_attempts FROM prs WHERE number = ?", (pr_num,)
            ).fetchone()["eval_attempts"] or 0)
-            conn.execute(
+            reopen_pr(conn, pr_num, leo_verdict='skipped',
-                "UPDATE prs SET status = 'open', leo_verdict = 'skipped', "
+                      last_error='domain review requested changes',
-                "last_error = 'domain review requested changes', eval_issues = ? WHERE number = ?",
+                      eval_issues=json.dumps(domain_issues))
                (json.dumps(domain_issues), pr_num),
            )
            db.audit(
                conn, "evaluate", "domain_rejected",
                json.dumps({"pr": pr_num, "agent": agent, "issues": domain_issues, "batch": True}),
@ -1257,12 +1207,12 @@ async def _run_batch_domain_eval(
        leo_review, leo_usage = await run_leo_review(review_diff, files, "STANDARD")
        if leo_review is None:
-            conn.execute("UPDATE prs SET status = 'open' WHERE number = ?", (pr_num,))
+            reopen_pr(conn, pr_num)
            logger.debug("PR #%d: Leo review failed, will retry next cycle", pr_num)
            continue
        if leo_review == "RATE_LIMITED":
-            conn.execute("UPDATE prs SET status = 'open' WHERE number = ?", (pr_num,))
+            reopen_pr(conn, pr_num)
            logger.info("PR #%d: Leo rate limited, will retry next cycle", pr_num)
            continue
@ -1292,7 +1242,7 @@ async def _run_batch_domain_eval(
            pr_info = await forgejo_api("GET", repo_path(f"pulls/{pr_num}"))
            pr_author = pr_info.get("user", {}).get("login", "") if pr_info else ""
            await _post_formal_approvals(pr_num, pr_author)
-            conn.execute("UPDATE prs SET status = 'approved', domain = COALESCE(domain, ?), auto_merge = 1 WHERE number = ?", (domain or "cross-domain", pr_num,))
+            approve_pr(conn, pr_num, domain=domain or 'cross-domain', auto_merge=1)
            db.audit(
                conn, "evaluate", "approved",
                json.dumps({"pr": pr_num, "tier": "STANDARD", "domain": domain,
@ -1303,10 +1253,7 @@ async def _run_batch_domain_eval(
            all_issues = []
            if leo_verdict == "request_changes":
                all_issues.extend(_parse_issues(leo_review))
-            conn.execute(
+            reopen_pr(conn, pr_num, eval_issues=json.dumps(all_issues))
                "UPDATE prs SET status = 'open', eval_issues = ? WHERE number = ?",
                (json.dumps(all_issues), pr_num),
            )
            feedback = {"leo": leo_verdict, "domain": domain_verdict,
                        "tier": "STANDARD", "issues": all_issues}
            conn.execute(
@ -1453,7 +1400,7 @@ async def evaluate_cycle(conn, max_workers=None) -> tuple[int, int]:
            logger.exception("Batch eval failed for domain %s", domain)
            # Revert all to open
            for pr_row in batch_prs:
-                conn.execute("UPDATE prs SET status = 'open' WHERE number = ?", (pr_row["number"],))
+                reopen_pr(conn, pr_row["number"])
            failed += len(batch_prs)
    # Process individual PRs (DEEP, LIGHT, single-domain, fallback)
@ -1502,7 +1449,7 @@ async def evaluate_cycle(conn, max_workers=None) -> tuple[int, int]:
        except Exception:
            logger.exception("Failed to evaluate PR #%d", row["number"])
            failed += 1
-            conn.execute("UPDATE prs SET status = 'open' WHERE number = ?", (row["number"],))
+            reopen_pr(conn, row["number"])
    if succeeded or failed:
        logger.info("Evaluate cycle: %d evaluated, %d errors", succeeded, failed)
--- a/lib/merge.py
+++ b/lib/merge.py
@ -24,6 +24,7 @@ from .db import classify_branch
 from .dedup import dedup_evidence_blocks
 from .domains import detect_domain_from_branch
 from .forgejo import api as forgejo_api
 from .pr_state import close_pr, mark_conflict, mark_conflict_permanent, mark_merged, reopen_pr
 # Pipeline-owned branch prefixes — only these get auto-merged.
 # Agent branches (theseus/*, rio/*, astra/*, etc.) stay approved but are NOT
@ -1431,10 +1432,7 @@ async def _merge_domain_queue(conn, domain: str) -> tuple[int, int]:
                logger.error(
                    "PR #%d merge timed out after %ds — resetting to conflict (Rhea)", pr_num, MERGE_TIMEOUT_SECONDS
                )
-                conn.execute(
+                mark_conflict(conn, pr_num, last_error=f"merge timed out after {MERGE_TIMEOUT_SECONDS}s")
                    "UPDATE prs SET status = 'conflict', merge_cycled = 1, merge_failures = COALESCE(merge_failures, 0) + 1, last_error = ? WHERE number = ?",
                    (f"merge timed out after {MERGE_TIMEOUT_SECONDS}s", pr_num),
                )
                db.audit(conn, "merge", "timeout", json.dumps({"pr": pr_num, "timeout_seconds": MERGE_TIMEOUT_SECONDS}))
                failed += 1
                continue
@ -1443,19 +1441,14 @@ async def _merge_domain_queue(conn, domain: str) -> tuple[int, int]:
                logger.warning("PR #%d merge/cherry-pick failed: %s", pr_num, pick_msg)
                # Reweave: close immediately, don't retry (Ship: same rationale as ff-push failure)
                if branch.startswith("reweave/"):
-                    conn.execute(
+                    await close_pr(conn, pr_num,
-                        "UPDATE prs SET status = 'closed', merge_cycled = 1, merge_failures = COALESCE(merge_failures, 0) + 1, last_error = ? WHERE number = ?",
+                                   last_error=f"reweave merge failed (closed, not retried): {pick_msg[:400]}",
-                        (f"reweave merge failed (closed, not retried): {pick_msg[:400]}", pr_num),
+                                   merge_cycled=True, inc_merge_failures=True)
                    )
                    await forgejo_api("PATCH", repo_path(f"pulls/{pr_num}"), {"state": "closed"})
                    await forgejo_api("POST", repo_path(f"issues/{pr_num}/comments"),
                                      {"body": f"Reweave merge failed — closing. Next nightly reweave will create a fresh branch.\n\nError: {pick_msg[:200]}"})
                    await _delete_remote_branch(branch)
                else:
-                    conn.execute(
+                    mark_conflict(conn, pr_num, last_error=pick_msg[:500])
                        "UPDATE prs SET status = 'conflict', merge_cycled = 1, merge_failures = COALESCE(merge_failures, 0) + 1, last_error = ? WHERE number = ?",
                        (pick_msg[:500], pr_num),
                    )
                db.audit(conn, "merge", "cherry_pick_failed", json.dumps({"pr": pr_num, "error": pick_msg[:200]}))
                failed += 1
                continue
@ -1465,10 +1458,7 @@ async def _merge_domain_queue(conn, domain: str) -> tuple[int, int]:
            # The branch ref still points at old commits (not a descendant of main),
            # so pushing branch_sha:main would fail as non-fast-forward.
            if pick_msg in ("already merged (all commits empty)", "already up to date"):
-                conn.execute(
+                mark_merged(conn, pr_num)
                    "UPDATE prs SET status = 'merged', merged_at = datetime('now'), last_error = NULL WHERE number = ?",
                    (pr_num,),
                )
                db.audit(conn, "merge", "merged", json.dumps({"pr": pr_num, "branch": branch, "note": "content already on main"}))
                leo_token = get_agent_token("leo")
                await forgejo_api("POST", repo_path(f"issues/{pr_num}/comments"),
@ -1523,31 +1513,20 @@ async def _merge_domain_queue(conn, domain: str) -> tuple[int, int]:
                # run creates a fresh branch from current main — retry is wasteful.
                # (Ship: prevents reweave flood + wasted retry cycles)
                if branch.startswith("reweave/"):
-                    conn.execute(
+                    await close_pr(conn, pr_num,
-                        "UPDATE prs SET status = 'closed', merge_cycled = 1, merge_failures = COALESCE(merge_failures, 0) + 1, last_error = ? WHERE number = ?",
+                                   last_error=f"reweave merge failed (closed, not retried): {merge_msg[:400]}",
-                        (f"reweave merge failed (closed, not retried): {merge_msg[:400]}", pr_num),
+                                   merge_cycled=True, inc_merge_failures=True)
                    )
                    await forgejo_api("PATCH", repo_path(f"pulls/{pr_num}"), {"state": "closed"})
                    await forgejo_api("POST", repo_path(f"issues/{pr_num}/comments"),
                                      {"body": f"Reweave merge failed — closing. Next nightly reweave will create a fresh branch.\n\nError: {merge_msg[:200]}"})
                    await _delete_remote_branch(branch)
                else:
-                    conn.execute(
+                    mark_conflict(conn, pr_num, last_error=merge_msg[:500])
                        "UPDATE prs SET status = 'conflict', merge_cycled = 1, merge_failures = COALESCE(merge_failures, 0) + 1, last_error = ? WHERE number = ?",
                        (merge_msg[:500], pr_num),
                    )
                db.audit(conn, "merge", "merge_failed", json.dumps({"pr": pr_num, "error": merge_msg[:200]}))
                failed += 1
                continue
            # Success — update status and cleanup
-            conn.execute(
+            mark_merged(conn, pr_num)
                """UPDATE prs SET status = 'merged',
                   merged_at = datetime('now'),
                   last_error = NULL
                   WHERE number = ?""",
                (pr_num,),
            )
            db.audit(conn, "merge", "merged", json.dumps({"pr": pr_num, "branch": branch}))
            logger.info("PR #%d merged successfully", pr_num)
@ -1624,10 +1603,7 @@ async def _reconcile_db_state(conn):
        is_merged = pr_info.get("merged", False)
        if is_merged and db_status != "merged":
-            conn.execute(
+            mark_merged(conn, pr_number)
                "UPDATE prs SET status = 'merged', merged_at = datetime('now') WHERE number = ?",
                (pr_number,),
            )
            reconciled += 1
            continue
@ -1637,10 +1613,7 @@ async def _reconcile_db_state(conn):
            # trigger discover_external_prs → new PR → fail → close → repeat)
            if branch:
                await _delete_remote_branch(branch)
-            conn.execute(
+            await close_pr(conn, pr_number, last_error='reconciled: closed on Forgejo', close_on_forgejo=False)
                "UPDATE prs SET status = 'closed', last_error = 'reconciled: closed on Forgejo' WHERE number = ?",
                (pr_number,),
            )
            reconciled += 1
            continue
@ -1663,10 +1636,7 @@ async def _reconcile_db_state(conn):
                    repo_path(f"issues/{pr_number}/comments"),
                    body={"body": "Auto-closed: branch deleted from remote."},
                )
-                conn.execute(
+                await close_pr(conn, pr_number, last_error='reconciled: branch deleted', close_on_forgejo=False)
                    "UPDATE prs SET status = 'closed', last_error = 'reconciled: branch deleted' WHERE number = ?",
                    (pr_number,),
                )
                logger.info("Ghost PR #%d: branch %s deleted, closing", pr_number, branch)
                reconciled += 1
@ -1763,11 +1733,9 @@ async def _handle_permanent_conflicts(conn) -> int:
            except Exception:
                pass
-        await forgejo_api("PATCH", repo_path(f"pulls/{pr_number}"), {"state": "closed"})
+        await close_pr(conn, pr_number,
-        conn.execute(
+                       last_error='conflict_permanent: closed + filed in archive',
-            "UPDATE prs SET status = 'closed', last_error = 'conflict_permanent: closed + filed in archive' WHERE number = ?",
+                       close_on_forgejo=False)  # Already closed at line 1718
            (pr_number,),
        )
        handled += 1
        logger.info("Permanent conflict handled: PR #%d closed, source filed", pr_number)
@ -1835,11 +1803,8 @@ async def _retry_conflict_prs(conn) -> tuple[int, int]:
        # (Ship: prevents wasting 3 retry cycles on branches that can never cherry-pick)
        if branch.startswith("reweave/"):
            logger.info("Reweave PR #%d: skipping retry, closing + deleting branch", pr_number)
-            conn.execute(
+            await close_pr(conn, pr_number,
-                "UPDATE prs SET status = 'closed', last_error = 'reweave: closed (retry skipped, next nightly creates fresh)' WHERE number = ?",
+                           last_error='reweave: closed (retry skipped, next nightly creates fresh)')
                (pr_number,),
            )
            await forgejo_api("PATCH", repo_path(f"pulls/{pr_number}"), {"state": "closed"})
            await forgejo_api("POST", repo_path(f"issues/{pr_number}/comments"),
                              {"body": "Reweave conflict — closing instead of retrying. Cherry-pick always fails on reweave branches (they modify existing files). Next nightly reweave will create a fresh branch from current main."})
            await _delete_remote_branch(branch)
@ -1858,29 +1823,16 @@ async def _retry_conflict_prs(conn) -> tuple[int, int]:
        if ok:
            # Rebase succeeded — reset for re-eval (Ganymede: approvals are stale after rebase)
-            conn.execute(
+            reopen_pr(conn, pr_number, reset_for_reeval=True,
-                """UPDATE prs
+                      conflict_rebase_attempts=attempts + 1)
                   SET status = 'open',
                       leo_verdict = 'pending',
                       domain_verdict = 'pending',
                       eval_attempts = 0,
                       conflict_rebase_attempts = ?
                   WHERE number = ?""",
                (attempts + 1, pr_number),
            )
            logger.info("Conflict resolved: PR #%d rebased successfully, reset for re-eval", pr_number)
            resolved += 1
        else:
            new_attempts = attempts + 1
            if new_attempts >= MAX_CONFLICT_REBASE_ATTEMPTS:
-                conn.execute(
+                mark_conflict_permanent(conn, pr_number,
-                    """UPDATE prs
+                                        last_error=f"rebase failed {MAX_CONFLICT_REBASE_ATTEMPTS}x: {msg[:200]}",
-                       SET status = 'conflict_permanent',
+                                        conflict_rebase_attempts=new_attempts)
                           conflict_rebase_attempts = ?,
                           last_error = ?
                       WHERE number = ?""",
                    (new_attempts, f"rebase failed {MAX_CONFLICT_REBASE_ATTEMPTS}x: {msg[:200]}", pr_number),
                )
                logger.warning("Conflict permanent: PR #%d failed %d rebase attempts: %s",
                               pr_number, new_attempts, msg[:100])
            else:
--- a/lib/pr_state.py
+++ b/lib/pr_state.py
@ -0,0 +1,197 @@
 """PR state transitions — single source of truth for all status changes.
 Every UPDATE prs SET status = ... MUST go through this module.
 Invariants enforced:
 - close: always syncs Forgejo (opt-out for reconciliation only)
 - approve: requires non-empty domain (ValueError)
 - merged: always sets merged_at, clears last_error
 - conflict: always increments merge_failures, sets merge_cycled
 Why this exists: 36 hand-crafted status transitions across evaluate.py
 and merge.py produced 3 incidents (domain NULL, Forgejo ghost PRs,
 merge_cycled missing). Centralizing eliminates the entire class of
 "forgot to update X in this one code path" bugs.
 """
 import logging
 from .forgejo import api as forgejo_api, repo_path
 logger = logging.getLogger("pipeline.pr_state")
 async def close_pr(
    conn,
    pr_number: int,
    *,
    last_error: str = None,
    merge_cycled: bool = False,
    inc_merge_failures: bool = False,
    close_on_forgejo: bool = True,
 ):
    """Close a PR in DB and on Forgejo.
    Args:
        close_on_forgejo: False only when caller already closed on Forgejo
            (reconciliation, ghost PR cleanup after manual close).
    """
    if close_on_forgejo:
        await forgejo_api("PATCH", repo_path(f"pulls/{pr_number}"), {"state": "closed"})
    parts = ["status = 'closed'"]
    params = []
    if last_error is not None:
        parts.append("last_error = ?")
        params.append(last_error)
    if merge_cycled:
        parts.append("merge_cycled = 1")
    if inc_merge_failures:
        parts.append("merge_failures = COALESCE(merge_failures, 0) + 1")
    params.append(pr_number)
    conn.execute(f"UPDATE prs SET {', '.join(parts)} WHERE number = ?", params)
 def approve_pr(
    conn,
    pr_number: int,
    *,
    domain: str,
    auto_merge: int = 0,
    leo_verdict: str = None,
    domain_verdict: str = None,
 ):
    """Approve a PR. Raises ValueError if domain is empty/None."""
    if not domain:
        raise ValueError(f"Cannot approve PR #{pr_number} without domain")
    parts = ["status = 'approved'", "domain = COALESCE(domain, ?)"]
    params = [domain]
    parts.append("auto_merge = ?")
    params.append(auto_merge)
    if leo_verdict is not None:
        parts.append("leo_verdict = ?")
        params.append(leo_verdict)
    if domain_verdict is not None:
        parts.append("domain_verdict = ?")
        params.append(domain_verdict)
    params.append(pr_number)
    conn.execute(f"UPDATE prs SET {', '.join(parts)} WHERE number = ?", params)
 def mark_merged(conn, pr_number: int):
    """Mark PR as merged. Always sets merged_at, clears last_error."""
    conn.execute(
        "UPDATE prs SET status = 'merged', merged_at = datetime('now'), "
        "last_error = NULL WHERE number = ?",
        (pr_number,),
    )
 def mark_conflict(conn, pr_number: int, *, last_error: str = None):
    """Mark PR as conflict. Always increments merge_failures, sets merge_cycled."""
    conn.execute(
        "UPDATE prs SET status = 'conflict', merge_cycled = 1, "
        "merge_failures = COALESCE(merge_failures, 0) + 1, "
        "last_error = ? WHERE number = ?",
        (last_error, pr_number),
    )
 def mark_conflict_permanent(
    conn,
    pr_number: int,
    *,
    last_error: str = None,
    conflict_rebase_attempts: int = None,
 ):
    """Mark PR as permanently conflicted (no more retries)."""
    parts = ["status = 'conflict_permanent'"]
    params = []
    if last_error is not None:
        parts.append("last_error = ?")
        params.append(last_error)
    if conflict_rebase_attempts is not None:
        parts.append("conflict_rebase_attempts = ?")
        params.append(conflict_rebase_attempts)
    params.append(pr_number)
    conn.execute(f"UPDATE prs SET {', '.join(parts)} WHERE number = ?", params)
 def reopen_pr(
    conn,
    pr_number: int,
    *,
    leo_verdict: str = None,
    domain_verdict: str = None,
    last_error: str = None,
    eval_issues: str = None,
    dec_eval_attempts: bool = False,
    reset_for_reeval: bool = False,
    conflict_rebase_attempts: int = None,
 ):
    """Set PR back to open.
    Covers all reopen scenarios:
    - Transient failure (API error): no extra args
    - Rejection: leo_verdict + last_error + eval_issues
    - Batch overflow: dec_eval_attempts=True
    - Conflict resolved: reset_for_reeval=True
    """
    parts = ["status = 'open'"]
    params = []
    if reset_for_reeval:
        parts.extend([
            "leo_verdict = 'pending'",
            "domain_verdict = 'pending'",
            "eval_attempts = 0",
        ])
    else:
        if leo_verdict is not None:
            parts.append("leo_verdict = ?")
            params.append(leo_verdict)
        if domain_verdict is not None:
            parts.append("domain_verdict = ?")
            params.append(domain_verdict)
    if last_error is not None:
        parts.append("last_error = ?")
        params.append(last_error)
    if eval_issues is not None:
        parts.append("eval_issues = ?")
        params.append(eval_issues)
    if dec_eval_attempts:
        parts.append("eval_attempts = COALESCE(eval_attempts, 1) - 1")
    if conflict_rebase_attempts is not None:
        parts.append("conflict_rebase_attempts = ?")
        params.append(conflict_rebase_attempts)
    params.append(pr_number)
    conn.execute(f"UPDATE prs SET {', '.join(parts)} WHERE number = ?", params)
 def start_review(conn, pr_number: int) -> bool:
    """Atomically claim PR for review (status open -> reviewing).
    Returns True if claimed, False if already claimed by another worker.
    """
    cursor = conn.execute(
        "UPDATE prs SET status = 'reviewing' WHERE number = ? AND status = 'open'",
        (pr_number,),
    )
    return cursor.rowcount > 0
--- a/tests/test_pr_state.py
+++ b/tests/test_pr_state.py
@ -0,0 +1,336 @@
 """Tests for lib/pr_state.py — centralized PR state transitions."""
 import asyncio
 import sqlite3
 import sys
 import os
 from unittest.mock import AsyncMock, MagicMock, patch
 import pytest
 # Mock heavy dependencies before importing pr_state
 sys.modules.setdefault("aiohttp", MagicMock())
 # Add lib parent to path so `lib.pr_state` resolves
 sys.path.insert(0, os.path.join(os.path.dirname(__file__), ".."))
 from lib.pr_state import (
    approve_pr,
    close_pr,
    mark_conflict,
    mark_conflict_permanent,
    mark_merged,
    reopen_pr,
    start_review,
 )
 # ---------------------------------------------------------------------------
 # Fixtures
 # ---------------------------------------------------------------------------
 def _make_db():
    """Create a minimal in-memory DB with the prs table."""
    conn = sqlite3.connect(":memory:")
    conn.row_factory = sqlite3.Row
    conn.execute("""
        CREATE TABLE prs (
            number INTEGER PRIMARY KEY,
            source_path TEXT,
            branch TEXT,
            status TEXT NOT NULL DEFAULT 'open',
            domain TEXT,
            auto_merge INTEGER DEFAULT 0,
            leo_verdict TEXT DEFAULT 'pending',
            domain_verdict TEXT DEFAULT 'pending',
            eval_attempts INTEGER DEFAULT 0,
            eval_issues TEXT DEFAULT '[]',
            merge_cycled INTEGER DEFAULT 0,
            merge_failures INTEGER DEFAULT 0,
            conflict_rebase_attempts INTEGER DEFAULT 0,
            last_error TEXT,
            merged_at TEXT,
            last_attempt TEXT,
            cost_usd REAL DEFAULT 0,
            created_at TEXT DEFAULT (datetime('now'))
        )
    """)
    return conn
 def _insert_pr(conn, number=100, status="open", domain=None, **kwargs):
    """Insert a test PR row."""
    cols = ["number", "status"]
    vals = [number, status]
    if domain is not None:
        cols.append("domain")
        vals.append(domain)
    for k, v in kwargs.items():
        cols.append(k)
        vals.append(v)
    placeholders = ", ".join(["?"] * len(vals))
    col_names = ", ".join(cols)
    conn.execute(f"INSERT INTO prs ({col_names}) VALUES ({placeholders})", vals)
    conn.commit()
 def _get_pr(conn, number=100):
    """Read a PR row back."""
    return conn.execute("SELECT * FROM prs WHERE number = ?", (number,)).fetchone()
 # ---------------------------------------------------------------------------
 # close_pr
 # ---------------------------------------------------------------------------
 class TestClosePr:
    def test_close_calls_forgejo_and_updates_db(self):
        conn = _make_db()
        _insert_pr(conn, 42)
        mock_api = AsyncMock(return_value={})
        with patch("lib.pr_state.forgejo_api", mock_api), \
             patch("lib.pr_state.repo_path", lambda s: f"/repos/test/{s}"):
            asyncio.run(close_pr(conn, 42, last_error="test close"))
        row = _get_pr(conn, 42)
        assert row["status"] == "closed"
        assert row["last_error"] == "test close"
        mock_api.assert_called_once()
    def test_close_skips_forgejo_when_opted_out(self):
        conn = _make_db()
        _insert_pr(conn, 42)
        mock_api = AsyncMock(return_value={})
        with patch("lib.pr_state.forgejo_api", mock_api), \
             patch("lib.pr_state.repo_path", lambda s: f"/repos/test/{s}"):
            asyncio.run(close_pr(conn, 42, last_error="reconciled", close_on_forgejo=False))
        row = _get_pr(conn, 42)
        assert row["status"] == "closed"
        mock_api.assert_not_called()
    def test_close_increments_merge_failures(self):
        conn = _make_db()
        _insert_pr(conn, 42, merge_failures=2)
        mock_api = AsyncMock(return_value={})
        with patch("lib.pr_state.forgejo_api", mock_api), \
             patch("lib.pr_state.repo_path", lambda s: f"/repos/test/{s}"):
            asyncio.run(close_pr(conn, 42, merge_cycled=True, inc_merge_failures=True))
        row = _get_pr(conn, 42)
        assert row["merge_cycled"] == 1
        assert row["merge_failures"] == 3
    def test_close_without_last_error(self):
        conn = _make_db()
        _insert_pr(conn, 42, last_error="old error")
        mock_api = AsyncMock(return_value={})
        with patch("lib.pr_state.forgejo_api", mock_api), \
             patch("lib.pr_state.repo_path", lambda s: f"/repos/test/{s}"):
            asyncio.run(close_pr(conn, 42))
        row = _get_pr(conn, 42)
        assert row["status"] == "closed"
        # last_error not overwritten when not provided
        assert row["last_error"] == "old error"
 # ---------------------------------------------------------------------------
 # approve_pr
 # ---------------------------------------------------------------------------
 class TestApprovePr:
    def test_approve_sets_domain_and_auto_merge(self):
        conn = _make_db()
        _insert_pr(conn, 50)
        approve_pr(conn, 50, domain="internet-finance", auto_merge=1)
        row = _get_pr(conn, 50)
        assert row["status"] == "approved"
        assert row["domain"] == "internet-finance"
        assert row["auto_merge"] == 1
    def test_approve_raises_on_empty_domain(self):
        conn = _make_db()
        _insert_pr(conn, 50)
        with pytest.raises(ValueError, match="without domain"):
            approve_pr(conn, 50, domain="")
    def test_approve_raises_on_none_domain(self):
        conn = _make_db()
        _insert_pr(conn, 50)
        with pytest.raises(ValueError, match="without domain"):
            approve_pr(conn, 50, domain=None)
    def test_approve_sets_verdicts(self):
        conn = _make_db()
        _insert_pr(conn, 50)
        approve_pr(conn, 50, domain="cross-domain", auto_merge=1,
                   leo_verdict="skipped", domain_verdict="skipped")
        row = _get_pr(conn, 50)
        assert row["leo_verdict"] == "skipped"
        assert row["domain_verdict"] == "skipped"
    def test_approve_preserves_existing_domain(self):
        conn = _make_db()
        _insert_pr(conn, 50, domain="living-agents")
        approve_pr(conn, 50, domain="cross-domain", auto_merge=0)
        row = _get_pr(conn, 50)
        # COALESCE(domain, ?) preserves existing domain
        assert row["domain"] == "living-agents"
 # ---------------------------------------------------------------------------
 # mark_merged
 # ---------------------------------------------------------------------------
 class TestMarkMerged:
    def test_sets_merged_at_and_clears_error(self):
        conn = _make_db()
        _insert_pr(conn, 60, status="approved", last_error="some old error")
        mark_merged(conn, 60)
        row = _get_pr(conn, 60)
        assert row["status"] == "merged"
        assert row["merged_at"] is not None
        assert row["last_error"] is None
 # ---------------------------------------------------------------------------
 # mark_conflict
 # ---------------------------------------------------------------------------
 class TestMarkConflict:
    def test_increments_failures_and_sets_cycled(self):
        conn = _make_db()
        _insert_pr(conn, 70, status="approved", merge_failures=0)
        mark_conflict(conn, 70, last_error="cherry-pick failed")
        row = _get_pr(conn, 70)
        assert row["status"] == "conflict"
        assert row["merge_cycled"] == 1
        assert row["merge_failures"] == 1
        assert row["last_error"] == "cherry-pick failed"
    def test_accumulates_failures(self):
        conn = _make_db()
        _insert_pr(conn, 70, merge_failures=5)
        mark_conflict(conn, 70)
        row = _get_pr(conn, 70)
        assert row["merge_failures"] == 6
 # ---------------------------------------------------------------------------
 # mark_conflict_permanent
 # ---------------------------------------------------------------------------
 class TestMarkConflictPermanent:
    def test_sets_status_and_attempts(self):
        conn = _make_db()
        _insert_pr(conn, 80, status="conflict")
        mark_conflict_permanent(conn, 80,
                                last_error="rebase failed 3x",
                                conflict_rebase_attempts=3)
        row = _get_pr(conn, 80)
        assert row["status"] == "conflict_permanent"
        assert row["last_error"] == "rebase failed 3x"
        assert row["conflict_rebase_attempts"] == 3
 # ---------------------------------------------------------------------------
 # reopen_pr
 # ---------------------------------------------------------------------------
 class TestReopenPr:
    def test_simple_reopen(self):
        conn = _make_db()
        _insert_pr(conn, 90, status="reviewing")
        reopen_pr(conn, 90)
        row = _get_pr(conn, 90)
        assert row["status"] == "open"
    def test_reopen_with_rejection(self):
        conn = _make_db()
        _insert_pr(conn, 90, status="reviewing")
        reopen_pr(conn, 90, leo_verdict="skipped",
                  last_error="domain rejected",
                  eval_issues='["factual_error"]')
        row = _get_pr(conn, 90)
        assert row["status"] == "open"
        assert row["leo_verdict"] == "skipped"
        assert row["last_error"] == "domain rejected"
        assert row["eval_issues"] == '["factual_error"]'
    def test_reopen_dec_eval_attempts(self):
        conn = _make_db()
        _insert_pr(conn, 90, status="reviewing", eval_attempts=3)
        reopen_pr(conn, 90, dec_eval_attempts=True)
        row = _get_pr(conn, 90)
        assert row["eval_attempts"] == 2
    def test_reopen_reset_for_reeval(self):
        conn = _make_db()
        _insert_pr(conn, 90, status="conflict",
                   leo_verdict="approve", domain_verdict="approve",
                   eval_attempts=2)
        reopen_pr(conn, 90, reset_for_reeval=True,
                  conflict_rebase_attempts=1)
        row = _get_pr(conn, 90)
        assert row["status"] == "open"
        assert row["leo_verdict"] == "pending"
        assert row["domain_verdict"] == "pending"
        assert row["eval_attempts"] == 0
        assert row["conflict_rebase_attempts"] == 1
 # ---------------------------------------------------------------------------
 # start_review
 # ---------------------------------------------------------------------------
 class TestStartReview:
    def test_claims_open_pr(self):
        conn = _make_db()
        _insert_pr(conn, 100)
        assert start_review(conn, 100) is True
        row = _get_pr(conn, 100)
        assert row["status"] == "reviewing"
    def test_rejects_non_open_pr(self):
        conn = _make_db()
        _insert_pr(conn, 100, status="reviewing")
        assert start_review(conn, 100) is False
    def test_double_claim_fails(self):
        conn = _make_db()
        _insert_pr(conn, 100)
        assert start_review(conn, 100) is True
        assert start_review(conn, 100) is False