clusterfudge · April 9, 2026 17:41
diff --git a/README.md b/README.md
diff --git a/analyze_pfm.py b/analyze_pfm.py
 #!/usr/bin/env python3
 """
 analyze_pfm.py — Deliverable C: musical metrics + corpus comparison for PFM.

 Pure stdlib. Reuses parser/harmony/roles from validate_pfm.py (same dir).

 MODE 1:  python3 analyze_pfm.py file.pfm [--json]
         → per-piece metrics (density, syncopation, contour, harmony, drums,
           phrase structure, voice motion …)

 MODE 2:  python3 analyze_pfm.py --corpus DIR/ --compare file.pfm
         → analyze every .pfm in DIR, compute min/median/max for each scalar,
           compare file.pfm against that envelope, flag outliers.

 Exit 0 always (advisory, not validation).
 """
 from __future__ import annotations
 import sys, os, json, argparse, statistics
 from fractions import Fraction
 from typing import List, Dict, Optional, Tuple

 sys.path.insert(0, os.path.dirname(os.path.abspath(__file__)) or '.')
 from validate_pfm import (parse_pfm, Song, Voice, Note, flatten_voice,
                           infer_roles, implied_chords, midi_to_name)

 # ═════════════════════════════════════════════════════════════ helpers ═══
 def nbars(song: Song) -> int:
    return max((len(v.bars) for v in song.voices.values()), default=0)

 def bar_seconds(song: Song) -> float:
    # whole-note = 4 beats; bar_len is in whole-note units; quarter = 60/tempo
    return float(song.bar_len) * 4.0 * (60.0 / song.tempo)

 def onsets(v: Voice) -> List[Note]:
    """All sounding onsets (no rests, no tie-continuations)."""
    return [n for bar in v.bars for n in bar
            if n.midi is not None and not n.tie_from_prev]

 def pitched_onsets(v: Voice) -> List[Note]:
    return [n for n in onsets(v) if n.drum is None]


 def smart_roles(song: Song) -> Dict[str,str]:
    """Wrap validate_pfm.infer_roles with name-based hints first."""
    roles: Dict[str,str] = {}
    for v in song.voices.values():
        if v.role: roles[v.name] = v.role; continue
        low = v.name.lower()
        if v.wave == 'noise' or 'drum' in low or 'perc' in low:
            roles[v.name] = 'drums'
        elif 'lead' in low or 'mel' in low:
            roles[v.name] = 'lead'
        elif 'bass' in low:
            roles[v.name] = 'bass'
        elif 'harm' in low or 'pad' in low or 'chord' in low:
            roles[v.name] = 'harmony'
        elif 'echo' in low or v.follows:
            roles[v.name] = 'echo'
    # fill remaining via validator heuristic
    base = infer_roles(song)
    for nm, r in base.items():
        roles.setdefault(nm, r)
    # ensure at most one lead: keep the one with most onsets
    leads = [nm for nm,r in roles.items() if r=='lead']
    if len(leads) > 1:
        leads.sort(key=lambda nm: -len(onsets(song.voices[nm])))
        for nm in leads[1:]: roles[nm] = 'harmony'
    if 'lead' not in roles.values():
        # promote busiest pitched non-bass voice
        cand = [(len(onsets(v)), nm) for nm,v in song.voices.items()
                if roles.get(nm) not in ('drums','bass') and v.wave!='noise']
        if cand:
            cand.sort(reverse=True); roles[cand[0][1]]='lead'
    return roles

 def find_role(roles: Dict[str,str], song: Song, want: str) -> Optional[Voice]:
    for nm, r in roles.items():
        if r == want and nm in song.voices:
            return song.voices[nm]
    return None

 # ═══════════════════════════════════════════════════════════════ MODE 1 ═══
 def analyze(song: Song) -> Dict:
    roles  = smart_roles(song)
    nb     = nbars(song)
    bsec   = bar_seconds(song)
    total_sec = nb * bsec
    beat_len  = song.beat_len
    n_beats   = song.timesig[0]
    out: Dict = {
        'title': song.title, 'tempo': song.tempo,
        'timesig': f"{song.timesig[0]}/{song.timesig[1]}",
        'key': None, 'style': song.style, 'loop': song.loop,
        'bars': nb, 'seconds': round(total_sec, 2),
        'roles': roles,
    }

    # ── note_density ────────────────────────────────────────────────────
    per_voice = {}
    total_ons = 0
    for v in song.voices.values():
        c = len(onsets(v))
        total_ons += c
        per_voice[v.name] = {
            'events': c,
            'ev_per_bar': round(c / nb, 2) if nb else 0.0,
            'ev_per_sec': round(c / total_sec, 3) if total_sec else 0.0,
        }
    out['note_density'] = {
        'overall_ev_per_sec': round(total_ons / total_sec, 3) if total_sec else 0.0,
        'overall_ev_per_bar': round(total_ons / nb, 2) if nb else 0.0,
        'per_voice': per_voice,
    }

    # ── duration_histogram ──────────────────────────────────────────────
    NAMED = {Fraction(1,1):'1', Fraction(1,2):'2', Fraction(1,4):'4',
             Fraction(1,8):'8', Fraction(1,16):'16', Fraction(1,32):'32',
             Fraction(3,8):'4.', Fraction(3,16):'8.', Fraction(3,4):'2.',
             Fraction(3,32):'16.', Fraction(1,12):'8t', Fraction(1,6):'4t',
             Fraction(1,24):'16t'}
    hist: Dict[str,int] = {}
    for v in song.voices.values():
        for n in onsets(v):
            key = NAMED.get(n.dur, str(n.dur))
            hist[key] = hist.get(key, 0) + 1
    out['duration_histogram'] = dict(sorted(hist.items(),
        key=lambda kv: -kv[1]))

    # ── syncopation_index ───────────────────────────────────────────────
    sync_on = sync_tot = 0
    EPS = 1e-6
    for v in song.voices.values():
        if roles.get(v.name) == 'drums' or v.wave == 'noise':
            continue
        for n in onsets(v):
            sync_tot += 1
            frac = (n.beat - 1.0) % 1.0
            if frac > EPS and frac < 1 - EPS:
                sync_on += 1
    out['syncopation_index'] = round(sync_on / sync_tot, 3) if sync_tot else 0.0

    # ── swing_ratio ─────────────────────────────────────────────────────
    if abs(song.swing - 0.5) > 1e-6:
        out['swing_ratio'] = {'declared': song.swing, 'detected': song.swing,
                              'n_pairs': 0}
    else:
        # detect from consecutive 8th-note pairs on beat boundaries
        eighth = Fraction(1, 8)
        ratios = []
        for v in song.voices.values():
            if v.wave == 'noise': continue
            flat = flatten_voice(v)
            for a, b in zip(flat, flat[1:]):
                if a.midi is None or b.midi is None: continue
                tot = a.dur + b.dur
                # pair spans exactly one beat, first note on a beat
                if tot == 2*eighth*Fraction(song.timesig[1],4)*0 + Fraction(1,4): pass
                if tot == Fraction(1,4) and abs((a.beat-1.0)%1.0) < EPS:
                    ratios.append(float(a.dur / tot))
        det = round(statistics.median(ratios), 3) if ratios else 0.5
        out['swing_ratio'] = {'declared': song.swing, 'detected': det,
                              'n_pairs': len(ratios)}

    # ── melodic_contour (lead) ──────────────────────────────────────────
    lead = find_role(roles, song, 'lead')
    if lead:
        ps = [n for n in flatten_voice(lead)
              if n.midi is not None and not n.tie_from_prev and n.drum is None]
        ups = downs = reps = 0
        leaps = []
        for a, b in zip(ps, ps[1:]):
            d = b.midi - a.midi
            if d > 0: ups += 1
            elif d < 0: downs += 1
            else: reps += 1
            if d != 0: leaps.append(abs(d))
        n_iv = max(1, len(ps) - 1)
        midis = [n.midi for n in ps]
        # phrase shapes per 4-bar window
        shapes = []
        for w0 in range(0, nb, 4):
            seg = [n.midi for n in ps if w0 < n.bar <= w0 + 4]
            shapes.append(_contour_shape(seg))
        out['melodic_contour'] = {
            'voice': lead.name,
            'pct_up':   round(ups   / n_iv, 3),
            'pct_down': round(downs / n_iv, 3),
            'pct_repeat': round(reps / n_iv, 3),
            'mean_leap_semitones': round(statistics.mean(leaps), 2) if leaps else 0.0,
            'range_span': (max(midis) - min(midis)) if midis else 0,
            'range': f"{midi_to_name(min(midis))}-{midi_to_name(max(midis))}" if midis else '',
            'phrase_shapes': shapes,
        }
    else:
        out['melodic_contour'] = None

    # ── harmonic_rhythm ─────────────────────────────────────────────────
    chords = implied_chords(song)
    changes = sum(1 for a, b in zip(chords, chords[1:])
                  if a != b and a != '—' and b != '—')
    per8 = round(changes / nb * 8, 2) if nb else 0.0
    out['harmonic_rhythm'] = {
        'chords_per_bar': chords,
        'n_distinct': len({c for c in chords if c != '—'}),
        'changes_per_8bars': per8,
    }

    # ── drum_grid ───────────────────────────────────────────────────────
    drumv = find_role(roles, song, 'drums')
    out['has_drums'] = drumv is not None and len(onsets(drumv)) > 0
    if out['has_drums']:
        step = song.bar_len / 16
        grids = []
        backbeat_bars = 0
        for bi, bar in enumerate(drumv.bars, 1):
            g = ['.'] * 16
            pos = Fraction(0)
            snare_beats = set()
            for n in bar:
                if n.midi is not None and not n.tie_from_prev:
                    idx = int(pos / step)
                    if 0 <= idx < 16:
                        sym = n.drum or 'x'
                        # don't overwrite K/S with H
                        if g[idx] in ('.','H','O') or sym in ('K','S','C'):
                            g[idx] = sym
                    if n.drum == 'S':
                        b = 1 + float(pos / beat_len)
                        if abs(b - round(b)) < 1e-6:
                            snare_beats.add(int(round(b)))
                pos += n.dur
            grids.append(''.join(g))
            if n_beats == 4 and {2, 4} <= snare_beats:
                backbeat_bars += 1
            elif n_beats != 4 and 2 in snare_beats:
                backbeat_bars += 1
        out['drum_grid'] = {
            'voice': drumv.name,
            'patterns': grids,
            'distinct_patterns': len(set(grids)),
            'backbeat_present': backbeat_bars >= max(1, len(grids) // 2),
            'backbeat_bars': f"{backbeat_bars}/{len(grids)}",
        }
    else:
        out['drum_grid'] = None

    # ── phrase_structure (lead bar-similarity → AABA…) ──────────────────
    if lead and nb:
        sigs = []
        for bi in range(nb):
            bar = lead.bars[bi] if bi < len(lead.bars) else []
            seq = tuple((n.midi, n.dur) for n in bar
                        if n.midi is not None and not n.tie_from_prev)
            sigs.append(seq)
        # similarity matrix (normalized LCS on pitch-contour+dur)
        sim = [[_bar_similarity(sigs[i], sigs[j]) for j in range(nb)]
               for i in range(nb)]
        # greedy label per bar
        labels = [''] * nb
        next_l = 0
        LET = 'ABCDEFGHIJKLMNOPQRSTUVWXYZ'
        for i in range(nb):
            if labels[i]: continue
            lab = LET[next_l % 26]; next_l += 1
            labels[i] = lab
            for j in range(i + 1, nb):
                if not labels[j] and sim[i][j] >= 0.75:
                    labels[j] = lab
        bar_form = ''.join(labels)
        # collapse to 4-bar phrases
        phrase_form = _collapse_phrases(labels, 4)
        out['phrase_structure'] = {
            'bar_labels': bar_form,
            'form': phrase_form,
            'similarity_matrix': [[round(x, 2) for x in row] for row in sim],
        }
    else:
        out['phrase_structure'] = None

    # ── voice_motion (lead vs harmony, beat-grid) ───────────────────────
    harm = find_role(roles, song, 'harmony') or find_role(roles, song, 'bass')
    if lead and harm and harm is not lead:
        tl_l = _timeline(lead, song)
        tl_h = _timeline(harm, song)
        par = con = obl = 0
        prev = None
        t = Fraction(0)
        end = nb * song.bar_len
        while t < end:
            a = _sounding(tl_l, t)
            b = _sounding(tl_h, t)
            if a is not None and b is not None:
                if prev is not None:
                    pa, pb = prev
                    da, db = a - pa, b - pb
                    if da == 0 and db == 0:
                        pass  # static, skip
                    elif da == 0 or db == 0:
                        obl += 1
                    elif (da > 0) == (db > 0):
                        par += 1
                    else:
                        con += 1
                prev = (a, b)
            else:
                prev = None
            t += beat_len
        tot = max(1, par + con + obl)
        out['voice_motion'] = {
            'vs': f"{lead.name}↔{harm.name}",
            'pct_parallel': round(par / tot, 3),
            'pct_contrary': round(con / tot, 3),
            'pct_oblique':  round(obl / tot, 3),
            'n_samples': par + con + obl,
        }
    else:
        out['voice_motion'] = None

    return out

 # ── contour / similarity helpers ────────────────────────────────────────
 def _contour_shape(seg: List[int]) -> str:
    if len(seg) < 3: return 'flat'
    n = len(seg)
    first, last = seg[0], seg[-1]
    peak_i = max(range(n), key=lambda i: seg[i])
    trough_i = min(range(n), key=lambda i: seg[i])
    span = max(seg) - min(seg)
    if span <= 2: return 'flat'
    mid_lo, mid_hi = n * 0.25, n * 0.75
    if mid_lo <= peak_i <= mid_hi and seg[peak_i] - first >= 2 and seg[peak_i] - last >= 2:
        return 'arch'
    if mid_lo <= trough_i <= mid_hi and first - seg[trough_i] >= 2 and last - seg[trough_i] >= 2:
        return 'valley'
    if last - first >= span * 0.5: return 'ramp-up'
    if first - last >= span * 0.5: return 'ramp-down'
    return 'wave'

 def _bar_similarity(a: tuple, b: tuple) -> float:
    if not a and not b: return 1.0
    if not a or not b:  return 0.0
    # LCS on (pitch-class, dur) pairs
    A = [(m % 12, d) for (m, d) in a]
    B = [(m % 12, d) for (m, d) in b]
    la, lb = len(A), len(B)
    dp = [[0]*(lb+1) for _ in range(la+1)]
    for i in range(la):
        for j in range(lb):
            dp[i+1][j+1] = dp[i][j]+1 if A[i]==B[j] else max(dp[i][j+1], dp[i+1][j])
    return dp[la][lb] / max(la, lb)

 def _collapse_phrases(labels: List[str], width: int) -> str:
    if not labels: return ''
    phrases = [tuple(labels[i:i+width]) for i in range(0, len(labels), width)]
    LET = 'ABCDEFGHIJKLMNOPQRSTUVWXYZ'
    plabs = []
    seen: Dict[tuple,str] = {}
    for p in phrases:
        # match if ≥ half the bar-labels agree with a prior phrase
        best = None
        for q, lab in seen.items():
            if len(q) == len(p):
                agree = sum(1 for x,y in zip(p,q) if x==y)
                if agree >= (len(p)+1)//2:
                    best = lab; break
        if best is None:
            best = LET[len(seen) % 26]
            seen[p] = best
        plabs.append(best)
    return ''.join(plabs)

 def _timeline(v: Voice, song: Song) -> List[Tuple[Fraction,Fraction,int]]:
    t = Fraction(0); out = []
    for n in flatten_voice(v):
        if n.midi is not None and n.drum is None:
            out.append((t, t + n.dur, n.midi))
        t += n.dur
    return out

 def _sounding(tl, t: Fraction) -> Optional[int]:
    for s, e, m in tl:
        if s <= t < e: return m
    return None

 # ═════════════════════════════════════════════════════════════ scalars ═══
 # Scalar metrics extracted for corpus comparison. Each is (label, getter,
 # higher_is_more, fmt). getter returns float or None.
 SCALARS = [
    ('density (ev/s)',      lambda m: m['note_density']['overall_ev_per_sec'], '{:.2f}'),
    ('density (ev/bar)',    lambda m: m['note_density']['overall_ev_per_bar'], '{:.1f}'),
    ('syncopation',         lambda m: m['syncopation_index'],                  '{:.2f}'),
    ('swing ratio',         lambda m: m['swing_ratio']['detected'],            '{:.2f}'),
    ('harm changes/8b',     lambda m: m['harmonic_rhythm']['changes_per_8bars'],'{:.1f}'),
    ('harm distinct',       lambda m: m['harmonic_rhythm']['n_distinct'],      '{:.0f}'),
    ('lead range (st)',     lambda m: (m['melodic_contour'] or {}).get('range_span'), '{:.0f}'),
    ('lead mean leap',      lambda m: (m['melodic_contour'] or {}).get('mean_leap_semitones'), '{:.2f}'),
    ('lead %repeat',        lambda m: (m['melodic_contour'] or {}).get('pct_repeat'), '{:.2f}'),
    ('motion %contrary',    lambda m: (m['voice_motion'] or {}).get('pct_contrary'), '{:.2f}'),
    ('motion %parallel',    lambda m: (m['voice_motion'] or {}).get('pct_parallel'), '{:.2f}'),
    ('bars',                lambda m: m['bars'],                                '{:.0f}'),
 ]
 BOOLS = [
    ('has_drums',           lambda m: m['has_drums']),
    ('backbeat',            lambda m: (m['drum_grid'] or {}).get('backbeat_present', False)),
    ('loop',                lambda m: m['loop']),
 ]

 # ═════════════════════════════════════════════════════════════ printing ═══
 def print_human(m: Dict):
    p = print
    p(f"══ {m['title'] or 'untitled'}  —  {m['timesig']} @ {m['tempo']}bpm  "
      f"style={m['style']}  {m['bars']} bars ({m['seconds']}s)  loop={'yes' if m['loop'] else 'no'}")
    roles = m['roles']
    p("   voices: " + ", ".join(f"{n}[{r}]" for n, r in roles.items()))
    p("")
    # density
    nd = m['note_density']
    p(f"┌ note_density        overall = {nd['overall_ev_per_sec']:.2f} ev/s  "
      f"({nd['overall_ev_per_bar']:.1f} ev/bar)")
    for nm, d in nd['per_voice'].items():
        p(f"│   {nm:<12} {d['ev_per_sec']:>6.2f} ev/s   {d['ev_per_bar']:>5.1f} ev/bar   "
          f"({d['events']} events)")
    # durations
    dh = m['duration_histogram']
    p(f"├ duration_histogram  " +
      "  ".join(f"{k}:{v}" for k, v in list(dh.items())[:8]) +
      ("  …" if len(dh) > 8 else ""))
    # syncopation / swing
    sw = m['swing_ratio']
    p(f"├ syncopation_index   {m['syncopation_index']:.3f}   "
      f"(non-drum onsets off the beat)")
    p(f"├ swing_ratio         declared={sw['declared']}  detected={sw['detected']}  "
      f"(from {sw['n_pairs']} 8th-pairs)")
    # contour
    mc = m['melodic_contour']
    if mc:
        p(f"├ melodic_contour     [{mc['voice']}]  "
          f"up={mc['pct_up']:.0%} down={mc['pct_down']:.0%} rep={mc['pct_repeat']:.0%}  "
          f"mean_leap={mc['mean_leap_semitones']}st  "
          f"range={mc['range']} ({mc['range_span']}st)")
        p(f"│   phrase shapes:    {' '.join(mc['phrase_shapes'])}")
    # harmony
    hr = m['harmonic_rhythm']
    ch = hr['chords_per_bar']
    p(f"├ harmonic_rhythm     {hr['changes_per_8bars']} changes/8bars  "
      f"({hr['n_distinct']} distinct chords)")
    p(f"│   per-bar:          {' '.join(ch[:16])}" + (" …" if len(ch)>16 else ""))
    # drums
    dg = m['drum_grid']
    if dg:
        p(f"├ drum_grid           [{dg['voice']}]  "
          f"backbeat={'yes' if dg['backbeat_present'] else 'no'} "
          f"({dg['backbeat_bars']} bars)  "
          f"{dg['distinct_patterns']} distinct pattern(s)")
        for i, g in enumerate(dg['patterns'][:4], 1):
            p(f"│   bar {i:<2}            {g}")
        if len(dg['patterns']) > 4: p(f"│   … ({len(dg['patterns'])-4} more)")
    else:
        p(f"├ drum_grid           (no drums voice)")
    # phrase structure
    ps = m['phrase_structure']
    if ps:
        p(f"├ phrase_structure    bars: {ps['bar_labels']}")
        p(f"│   form (4-bar):     {ps['form']}")
    # voice motion
    vm = m['voice_motion']
    if vm:
        p(f"└ voice_motion        {vm['vs']}  "
          f"parallel={vm['pct_parallel']:.0%}  contrary={vm['pct_contrary']:.0%}  "
          f"oblique={vm['pct_oblique']:.0%}  (n={vm['n_samples']})")
    else:
        p(f"└ voice_motion        (need lead + harmony/bass)")

 # ═════════════════════════════════════════════════════════════ MODE 2 ═══
 def corpus_compare(corpus_dir: str, target_file: str):
    files = sorted(os.path.join(corpus_dir, f)
                   for f in os.listdir(corpus_dir) if f.endswith('.pfm'))
    if not files:
        print(f"no .pfm files in {corpus_dir}"); return
    corpus = []
    for f in files:
        try:
            with open(f) as fh:
                corpus.append((os.path.basename(f), analyze(parse_pfm(fh.read()))))
        except Exception as e:
            print(f"  (skip {f}: {e})", file=sys.stderr)
    with open(target_file) as fh:
        tgt = analyze(parse_pfm(fh.read()))

    print(f"══ CORPUS COMPARISON")
    print(f"   corpus: {corpus_dir}  ({len(corpus)} piece(s): "
          f"{', '.join(n for n,_ in corpus)})")
    print(f"   target: {target_file}  «{tgt['title'] or 'untitled'}»")
    print("")
    W = (20, 9, 24, 10)
    hdr = f"{'metric':<{W[0]}} | {'song':>{W[1]}} | {'corpus min-med-max':<{W[2]}} | verdict"
    print(hdr)
    print('-' * len(hdr))

    def mmm(vals):
        vals = [v for v in vals if v is not None]
        if not vals: return None
        return (min(vals), statistics.median(vals), max(vals))

    for label, getter, fmt in SCALARS:
        try: sv = getter(tgt)
        except Exception: sv = None
        cvals = []
        for _, cm in corpus:
            try: cvals.append(getter(cm))
            except Exception: cvals.append(None)
        stat = mmm(cvals)
        if sv is None:
            sstr = 'n/a'
        else:
            sstr = fmt.format(sv)
        if stat is None:
            cstr, verdict = 'n/a', ''
        else:
            lo, med, hi = stat
            cstr = f"{fmt.format(lo)} - {fmt.format(med)} - {fmt.format(hi)}"
            if sv is None:
                verdict = '⚠ MISSING'
            elif sv < lo:
                verdict = '⚠ BELOW'
            elif sv > hi:
                verdict = '⚠ ABOVE'
            else:
                verdict = '✓ ok'
        print(f"{label:<{W[0]}} | {sstr:>{W[1]}} | {cstr:<{W[2]}} | {verdict}")

    for label, getter in BOOLS:
        sv = bool(getter(tgt))
        cvs = [bool(getter(cm)) for _, cm in corpus]
        yes = sum(1 for x in cvs if x)
        cstr = f"{'yes' if yes==len(cvs) else 'no' if yes==0 else 'mixed'} ({yes}/{len(cvs)})"
        if yes == len(cvs) and not sv:
            verdict = '⚠ MISSING'
        elif yes == 0 and sv:
            verdict = '⚠ EXTRA'
        else:
            verdict = '✓ ok'
        print(f"{label:<{W[0]}} | {('yes' if sv else 'no'):>{W[1]}} | "
              f"{cstr:<{W[2]}} | {verdict}")

 # ═══════════════════════════════════════════════════════════════ main ═══
 def main(argv=None) -> int:
    ap = argparse.ArgumentParser(description="Analyze PFM musical metrics")
    ap.add_argument('file', nargs='?')
    ap.add_argument('--json', action='store_true')
    ap.add_argument('--corpus', metavar='DIR')
    ap.add_argument('--compare', metavar='FILE')
    args = ap.parse_args(argv)

    if args.corpus and args.compare:
        corpus_compare(args.corpus, args.compare)
        return 0

    if not args.file:
        ap.error("need FILE (mode 1) or --corpus DIR --compare FILE (mode 2)")

    with open(args.file) as f:
        song = parse_pfm(f.read())
    m = analyze(song)
    if args.json:
        print(json.dumps(m, indent=2, default=str))
    else:
        print_human(m)
    return 0

 if __name__ == '__main__':
    sys.exit(main())
diff --git a/corpus-report.md b/corpus-report.md
diff --git a/disney-resolution-study.md b/disney-resolution-study.md
diff --git a/format-spec.md b/format-spec.md
diff --git a/meter_pfm.py b/meter_pfm.py
 #!/usr/bin/env python3
 """
 meter_pfm.py — headroom / saturation / per-voice mix analysis for PFM.

 Renders each voice to float (reusing render_pfm.render_voice), then
 measures the raw float sum BEFORE the tanh limiter / normalizer in
 render_pfm.mix_and_write. This exposes what the limiter is hiding.

 Why this exists
 ---------------
 render_pfm does:  out = normalize( tanh(0.6 · Σ voice_i) , −1 dBFS )
 If Σ voice_i regularly > ~0.83 the tanh is in its nonlinear knee: wave
 tops flatten → audible "crunch" even though the WAV peaks at −1 dBFS.
 And because everything is then normalized to the SAME peak, relative
 track loudness is lost and the loudest voice sets the ceiling for all.

 Reports
  · per-voice peak / RMS / energy-share of the mix
  · raw-sum peak (>1.0 ⇒ limiter doing real work), RMS, crest
  · saturation %: |raw| > 0.833 (tanh >8% nonlinear)
  · hard-over %:  |raw| > 1.667 (tanh slope <0.25, tops ~flat)
  · longest continuous saturation run (sustained crunch vs transient)

 WAV mode (meter_pfm.py --wav file.wav or any *.wav arg):
  · peak dBFS, RMS dBFS, crest
  · flat-top run: longest run of consecutive samples within 0.1 dB of
    file peak → limiter/clip artefact even when peak < 0 dBFS.

 Exit 1 if saturation% > --sat-limit (default 5) or raw peak > --peak-limit
 (default 1.5) or any voice energy-share > --dom-limit (default 50).
 """
 from __future__ import annotations
 import sys, os, math, argparse, json, wave, struct
 from fractions import Fraction
 sys.path.insert(0, os.path.dirname(os.path.abspath(__file__)))
 from validate_pfm import parse_pfm
 from render_pfm import render_voice, whole_note_seconds

 SAT_THRESH  = 0.833   # |raw| beyond which tanh(0.6x) is >8% nonlinear
 HARD_THRESH = 1.667   # tanh slope ≈0.25 — effectively squaring the tops

 def db(x): return 20*math.log10(x) if x>1e-12 else -120.0

 def stats(buf):
    n=len(buf); pk=0.0; ss=0.0
    for s in buf:
        a=abs(s); ss+=s*s
        if a>pk: pk=a
    rms=math.sqrt(ss/n) if n else 0.0
    return pk, rms

 def longest_run_above(buf, thr):
    best=cur=0
    for s in buf:
        if abs(s)>=thr: cur+=1; best=max(best,cur)
        else: cur=0
    return best

 # ─────────────────────────────────────────────────────────── WAV mode
 def meter_wav(path):
    with wave.open(path,'rb') as w:
        n=w.getnframes(); raw=w.readframes(n)
    samps=struct.unpack(f'<{n}h',raw)
    buf=[s/32767.0 for s in samps]
    pk,rms=stats(buf)
    ft_thr=pk*10**(-0.1/20)
    ft=longest_run_above(buf, ft_thr)
    near=sum(1 for s in buf if abs(s)>=ft_thr)
    return dict(path=path, n=n, peak=pk, peak_db=db(pk), rms_db=db(rms),
                crest_db=db(pk)-db(rms), flat_top_run=ft,
                flat_top_ms=1000*ft/22050, near_peak_pct=100*near/n)

 # ─────────────────────────────────────────────────────────── PFM mode
 def meter_pfm(path, rate=22050, loops=1):
    with open(path) as f: song=parse_pfm(f.read())
    lim_mode=song.master.get('limiter','none')
    total=Fraction(0)
    for v in song.voices.values():
        t=sum((n.dur for bar in v.bars for n in bar), Fraction(0))
        if t>total: total=t
    n_samp=max(1,int(round(float(total)*whole_note_seconds(song)*rate*loops)))

    vbufs={v.name: render_voice(song,v,total,rate,loops)
           for v in song.voices.values()}
    mix=[0.0]*n_samp
    for vb in vbufs.values():
        for i in range(n_samp): mix[i]+=vb[i]

    pk,rms=stats(mix)
    sat =sum(1 for s in mix if abs(s)>SAT_THRESH)
    hard=sum(1 for s in mix if abs(s)>HARD_THRESH)
    sat_run=longest_run_above(mix, SAT_THRESH)

    ve={}; tot_e=0.0
    for name,vb in vbufs.items():
        vpk,vrms=stats(vb)
        vol=song.voices[name].vol if hasattr(song.voices[name],'vol') else None
        ve[name]=dict(vol=vol, peak=vpk, peak_db=db(vpk), rms=vrms,
                      rms_db=db(vrms), crest_db=db(vpk)-db(vrms),
                      energy=vrms*vrms)
        tot_e+=vrms*vrms
    for name in ve:
        ve[name]['energy_pct']=100*ve[name]['energy']/tot_e if tot_e else 0

    return dict(
        path=path, tempo=song.tempo, n_samples=n_samp, seconds=n_samp/rate,
        voices=ve,
        mix=dict(peak=pk, peak_db=db(pk), rms=rms, rms_db=db(rms),
                 crest_db=db(pk)-db(rms)),
        saturation=dict(thresh=SAT_THRESH, pct=100*sat/n_samp,
                        longest_run=sat_run, longest_ms=1000*sat_run/rate),
        hard_over=dict(thresh=HARD_THRESH, pct=100*hard/n_samp),
        limiter=dict(mode=lim_mode, over=pk>1.0,
                     engaged=(pk>1.0 and lim_mode!='none'),
                     gain_reduction_db=db(1.0/pk) if pk>1.0 else 0.0,
                     headroom_db=song.master.get('headroom_db',-3.0)),
    )

 def fmt_report(r, sat_limit, peak_limit, dom_limit):
    L=[]; a=L.append
    a(f"══ {r['path']}  {r['seconds']:.2f}s @ {r['tempo']}bpm")
    m=r['mix']
    a(f"   raw mix   peak={m['peak']:.3f} ({m['peak_db']:+.2f} dB)  "
      f"rms={m['rms']:.3f} ({m['rms_db']:+.2f} dB)  crest={m['crest_db']:.1f} dB")
    lim=r['limiter']
    if lim['mode']=='none':
        a(f"   limiter   none → linear normalize to {lim['headroom_db']:+.1f} dBFS "
          f"(scale ×{10**(lim['headroom_db']/20)/m['peak']:.3f})"
          +("  [raw>1.0: balance set by normalizer]" if lim['over'] else ""))
    else:
        a(f"   limiter   {lim['mode']} "+
          (f"ENGAGED (~{abs(lim['gain_reduction_db']):.1f} dB into knee)" if lim['engaged'] else "clean"))
    s=r['saturation']; h=r['hard_over']
    a(f"   saturate  {s['pct']:6.2f}% |raw|>{s['thresh']:.2f}   "
      f"longest run {s['longest_run']:6d} samp ({s['longest_ms']:.1f} ms)")
    a(f"   hard-over {h['pct']:6.2f}% |raw|>{h['thresh']:.2f}")
    a( "   ── per-voice ──────────────────────────────────────────────────")
    a(f"   {'voice':10} {'vol':>5} {'peak':>7} {'pk dB':>7} {'rms dB':>7} {'crest':>6} {'energy%':>8}")
    for name,v in sorted(r['voices'].items(), key=lambda kv:-kv[1]['energy_pct']):
        vol=f"{v['vol']:.2f}" if v['vol'] is not None else '  ?  '
        a(f"   {name:10} {vol:>5} {v['peak']:7.3f} {v['peak_db']:7.2f} "
          f"{v['rms_db']:7.2f} {v['crest_db']:6.1f} {v['energy_pct']:7.1f}%")
    warn=[]
    lim=r['limiter']
    if lim['mode']!='none':
        if m['peak']>peak_limit:
            warn.append(f"raw peak {m['peak']:.2f} > {peak_limit} — {lim['mode']}-limiter driven hard")
        if s['pct']>sat_limit:
            warn.append(f"saturation {s['pct']:.1f}% > {sat_limit}% — audible {lim['mode']}-clip crunch")
    else:
        if m['peak']>3.0:
            warn.append(f"raw peak {m['peak']:.2f} > 3.0 — voice vols are decorative; "
                        f"rebalance so Σ≈1.0")
        if s['pct']>30.0:
            warn.append(f"{s['pct']:.0f}% of samples >0.83 — consider @master limiter=soft "
                        f"or lower vols for transient safety")
    if len(r['voices'])>1:
        dn,dv=max(r['voices'].items(), key=lambda kv:kv[1]['energy_pct'])
        if dv['energy_pct']>dom_limit:
            warn.append(f"voice '{dn}' dominates mix ({dv['energy_pct']:.0f}% energy, limit {dom_limit}%)")
    for w in warn: a(f"   ⚠ {w}")
    if not warn: a("   ✔ headroom ok")
    return "\n".join(L), (1 if warn else 0)

 def main(argv=None):
    ap=argparse.ArgumentParser()
    ap.add_argument('paths', nargs='+')
    ap.add_argument('--wav', action='store_true')
    ap.add_argument('--json', action='store_true')
    ap.add_argument('--rate', type=int, default=22050)
    ap.add_argument('--sat-limit', type=float, default=5.0)
    ap.add_argument('--peak-limit', type=float, default=1.5)
    ap.add_argument('--dom-limit', type=float, default=55.0)
    a=ap.parse_args(argv)
    rc=0
    for p in a.paths:
        if a.wav or p.endswith('.wav'):
            r=meter_wav(p)
            if a.json: print(json.dumps(r)); continue
            print(f"══ {p}  peak={r['peak_db']:+.2f} dBFS  rms={r['rms_db']:+.2f}  "
                  f"crest={r['crest_db']:.1f} dB  flat-top={r['flat_top_run']} samp "
                  f"({r['flat_top_ms']:.1f} ms)  near-peak={r['near_peak_pct']:.2f}%")
            continue
        r=meter_pfm(p, rate=a.rate)
        if a.json: print(json.dumps(r)); continue
        txt,code=fmt_report(r, a.sat_limit, a.peak_limit, a.dom_limit)
        print(txt); print()
        rc|=code
    return rc

 if __name__=='__main__':
    sys.exit(main())
diff --git a/philosophy.md b/philosophy.md
diff --git a/rebuild.sh b/rebuild.sh
 #!/usr/bin/env bash
 # Re-render every compositions/*.pfm and corpus/*.pfm, run meter on each,
 # then regenerate soundboard-manifest.json (music/sfx/corpus) with per-track
 # validator + meter reports embedded.
 set -euo pipefail
 cd "$(dirname "$0")"

 echo "── Rendering compositions/*.pfm ──"
 for f in compositions/*.pfm; do
  base="$(basename "$f" .pfm)"
  case "$base" in
    game-sfx-*)
      sfx="${base#game-sfx-}"
      out="compositions/game-${sfx}.wav" ;;
    game-sfx) continue ;;
    *) out="compositions/${base}.wav" ;;
  esac
  python3 render_pfm.py "$f" -o "$out"
 done
 # keep ambient == ambient-v2 (soundboard 'ambient' slot plays the current pick)
 cp compositions/game-ambient-v2.wav compositions/game-ambient.wav
 cp compositions/game-ambient-v2.pfm compositions/game-ambient.pfm

 echo "── Rendering corpus/*.pfm ──"
 for f in corpus/*.pfm; do
  python3 render_pfm.py "$f" -o "${f%.pfm}.wav"
 done

 echo "── Regenerating manifest ──"
 python3 - <<'PY'
 import json, subprocess, os, wave, glob
 from meter_pfm import meter_pfm, meter_wav

 def entry(slot, wav, pfm, cat, desc):
    w = wave.open(wav); dur = w.getnframes() / w.getframerate(); w.close()
    rv = subprocess.run(["python3","validate_pfm.py",pfm], capture_output=True, text=True)
    try:
        mp = meter_pfm(pfm)
        # compact per-voice energy + headline numbers
        mtr = {
          "raw_peak": round(mp["mix"]["peak"],3),
          "raw_peak_db": round(mp["mix"]["peak_db"],2),
          "raw_rms_db": round(mp["mix"]["rms_db"],2),
          "crest_db": round(mp["mix"]["crest_db"],1),
          "sat_pct": round(mp["saturation"]["pct"],2),
          "hard_pct": round(mp["hard_over"]["pct"],2),
          "limiter": mp["limiter"]["mode"],
          "headroom_db": mp["limiter"]["headroom_db"],
          "voices": {n: {"vol":v["vol"],"energy_pct":round(v["energy_pct"],1),
                         "rms_db":round(v["rms_db"],1)}
                     for n,v in mp["voices"].items()},
        }
        rm = subprocess.run(["python3","meter_pfm.py",pfm],capture_output=True,text=True)
        mtr_txt = rm.stdout.strip()
        mtr_ok  = rm.returncode==0
    except Exception as e:
        mtr={"error":str(e)}; mtr_txt=str(e); mtr_ok=False
    mw = meter_wav(wav)
    return {
        "slot": slot, "category": cat, "description": desc,
        "wav": wav, "duration": round(dur,2), "bytes": os.path.getsize(wav),
        "pfm": open(pfm).read() if os.path.exists(pfm) else "",
        "report": (rv.stdout + rv.stderr).strip(),
        "clean": rv.returncode == 0,
        "meter": mtr, "meter_report": mtr_txt, "meter_ok": mtr_ok,
        "wav_peak_db": round(mw["peak_db"],2),
        "wav_flat_top_ms": round(mw["flat_top_ms"],2),
    }

 out = []
 music = [
  ("ambient",      "game-ambient.wav",      "game-ambient.pfm",
   "16-bar loop · A pent-minor · 104 bpm · arp ostinato + breathing bass + hat-pulse"),
  ("ambient-calm", "game-ambient-calm.wav", "game-ambient-calm.pfm",
   "12-bar deep-focus loop · 88 bpm · Brinstar-style · tri lead + arp + sparse K/H"),
  ("complete",     "game-complete.wav",     "game-complete.pfm",
   "2-bar victory sting · ascending arpeggio → tonic"),
  ("fail",         "game-fail.wav",         "game-fail.pfm",
   "descending m2 — the only out-of-key sound"),
 ]
 for slot, wav, pfm, desc in music:
    out.append(entry(slot, f"compositions/{wav}", f"compositions/{pfm}", "music", desc))

 sfx = [
  ("tap",     "game-tap.wav",     "game-sfx-tap.pfm",     "E6 click · 5̂ · barely-there feedback"),
  ("connect", "game-connect.wav", "game-sfx-connect.pfm", "A5→C6 · 1̂→♭3̂ rising · affirmation"),
  ("undo",    "game-undo.wav",    "game-sfx-undo.pfm",    "C5→A4 · ♭3̂→1̂ falling · inverse of connect"),
  ("star",    "game-star.wav",    "game-sfx-star.pfm",    "A6-C7-E7 sparkle · 12.5% pulse · highest register"),
  ("unlock",  "game-unlock.wav",  "game-sfx-unlock.pfm",  "E5→A5→C6 · door-open chime"),
 ]
 for slot, wav, pfm, desc in sfx:
    out.append(entry(slot, f"compositions/{wav}", f"compositions/{pfm}", "sfx", desc))

 corpus_meta = {
  "tetris-a":          "Tetris Type-A (Korobeiniki) · Hirokazu Tanaka · GB 1989",
  "smb-overworld":     "Super Mario Bros. Overworld · Koji Kondo · NES 1985",
  "smb-underground":   "Super Mario Bros. Underground · Koji Kondo · NES 1985",
  "zelda-overworld":   "Legend of Zelda Overworld · Koji Kondo · NES 1986",
  "metroid-brinstar":  "Metroid Brinstar · Hirokazu Tanaka · NES 1986",
  "megaman2-wily1":    "Mega Man 2 Wily Stage 1 · Takashi Tateishi · NES 1988",
  "kirby-greengreens": "Kirby Green Greens · Jun Ishikawa · GB 1992",
  "drmario-fever":     "Dr. Mario Fever · Hirokazu Tanaka · NES 1990",
 }
 for f in sorted(glob.glob("corpus/*.pfm")):
    slot = os.path.splitext(os.path.basename(f))[0]
    wav  = f"corpus/{slot}.wav"
    if not os.path.exists(wav): continue
    out.append(entry(slot, wav, f, "corpus", corpus_meta.get(slot, slot)))

 json.dump(out, open("soundboard-manifest.json","w"), indent=2)
 print(f"manifest: {len(out)} sounds "
      f"(music={sum(1 for e in out if e['category']=='music')}, "
      f"sfx={sum(1 for e in out if e['category']=='sfx')}, "
      f"corpus={sum(1 for e in out if e['category']=='corpus')})")
 # headroom summary table
 print()
 print(f"{'slot':16} {'cat':7} {'peak':>6} {'sat%':>6} {'dom-voice':>16} {'ok':>3}")
 for e in out:
    m=e.get('meter',{})
    if 'error' in m: print(f"{e['slot']:16} {e['category']:7}   ERROR: {m['error']}"); continue
    dom=max(m['voices'].items(),key=lambda kv:kv[1]['energy_pct']) if len(m['voices'])>1 else ('—',{'energy_pct':0})
    print(f"{e['slot']:16} {e['category']:7} {m['raw_peak']:6.2f} {m['sat_pct']:6.2f} "
          f"{dom[0]+' '+str(round(dom[1]['energy_pct']))+'%':>16} {'✔' if e['meter_ok'] else '⚠':>3}")
 PY
 echo "✓ done — reload http://localhost:3090/soundboard.html"
diff --git a/render_pfm.py b/render_pfm.py
 #!/usr/bin/env python3
 """
 render_pfm.py — synthesize a PFM (v2) file to 16-bit mono WAV @ 22050 Hz.

 Pure stdlib. Imports parser from validate_pfm.py.

 v2 features
 -----------
  - Drum-kit macros (K/S/H/C/O) on noise voice: LFSR rate + pitch-drop
    envelope + per-hit ADSR.
  - Arpeggio [C E G]:4 — cycles pitches at ~45 Hz for the duration.
  - Vibrato ~v — ±25 cents sine @ 6 Hz during sustain.
  - Pitch bend C4>E4:4 — linear freq ramp.
  - @swing 0.67 — 8th-note pairs become long-short at onset time.
  - Echo voice (follows=/delay=) — parser already expands bars.

 CLI
 ---
  render_pfm.py song.pfm -o song.wav [--loops N] [--rate 22050]
 """
 from __future__ import annotations
 import sys, os, math, wave, argparse
 from array import array
 from fractions import Fraction

 sys.path.insert(0, os.path.dirname(os.path.abspath(__file__)))
 from validate_pfm import parse_pfm, flatten_voice, Song, Voice, Note, DRUM_KIT  # noqa

 TAU = math.pi * 2.0
 ARP_RATE_HZ = 45.0       # pitch-cycle rate for [...] arps
 VIB_RATE_HZ = 6.0
 VIB_DEPTH_CENTS = 25.0

 # ------------------------------------------------------------ oscillators
 def osc_pulse(phase: float, duty: float) -> float:
    return 1.0 if (phase % 1.0) < duty else -1.0

 def osc_triangle(phase: float) -> float:
    p = phase % 1.0
    return 4.0*p - 1.0 if p < 0.5 else 3.0 - 4.0*p

 def osc_saw(phase: float) -> float:
    return 2.0*(phase % 1.0) - 1.0

 class LFSR:
    __slots__ = ('reg',)
    def __init__(self): self.reg = 0x4A11
    def step(self) -> float:
        fb = (self.reg ^ (self.reg >> 1)) & 1
        self.reg = (self.reg >> 1) | (fb << 14)
        return 1.0 if (self.reg & 1) else -1.0

 # ------------------------------------------------------------ helpers
 def midi_to_hz(m: float) -> float:
    return 440.0 * (2.0 ** ((m - 69) / 12.0))

 def whole_note_seconds(song: Song) -> float:
    return (60.0 / song.tempo) * 4.0

 def noise_clock(midi: float) -> float:
    """Map a pseudo-midi value to an LFSR clock rate (Hz)."""
    octv = max(0.0, min(9.0, midi/12.0 - 1.0))
    return 180.0 * (2.0 ** octv)

 def apply_swing(start_whole: Fraction, dur_whole: Fraction, swing: float) -> tuple:
    """Piecewise-linear time warp: within each beat, the first half is
       stretched to `swing` of the beat, the second compressed to `1-swing`.
       NOTE: this warps ALL onsets, including 16ths — if you write 16ths
       under @swing they will be unevenly spaced. Use swing for 8th-pair
       feel only; for straight syncopation, write rests on a straight grid.
       validate_pfm warns on @swing + sub-8th values."""
    if abs(swing - 0.5) < 1e-9:
        return float(start_whole), float(dur_whole)
    eighth = Fraction(1,8)
    def warp(t: Fraction) -> float:
        q = t // (2*eighth)               # which beat (quarter)
        r = t - q*(2*eighth)              # 0..1/4
        base = float(q)*0.25
        rf = float(r)/0.25                # 0..1 within the beat
        # piecewise-linear: first half stretched to `swing`, second to 1-swing
        if rf <= 0.5:
            return base + (rf/0.5)*swing*0.25
        else:
            return base + (swing + ((rf-0.5)/0.5)*(1.0-swing))*0.25
    s = warp(start_whole)
    e = warp(start_whole + dur_whole)
    return s, max(1e-5, e - s)

 # ------------------------------------------------------------ rendering
 def render_voice(song: Song, v: Voice, total_whole: Fraction,
                 rate: int, loops: int) -> array:
    wns = whole_note_seconds(song)
    n_samples = int(round(float(total_whole) * wns * rate * loops))
    buf = array('f', bytes(4*n_samples))

    events = flatten_voice(v)
    starts = []
    t = Fraction(0)
    for n in events:
        starts.append(t); t += n.dur

    duty = (v.duty/100.0) if v.wave=='pulse' else 0.5
    lfsr = LFSR(); noise_val = 0.0; noise_acc = 0.0
    vib_depth = (2.0 ** (VIB_DEPTH_CENTS/1200.0)) - 1.0  # fractional freq dev

    for loop_i in range(loops):
        loop_off = float(Fraction(loop_i) * total_whole)
        for n, st in zip(events, starts):
            if n.midi is None:
                continue
            a,d,s,r = (n.adsr or v.adsr)
            # swing-warp onset/duration
            sw_start, sw_dur = apply_swing(st, n.dur, song.swing)
            start_sec = (loop_off + sw_start) * wns
            dur_sec   = sw_dur * wns
            rel = min(r, 0.5)
            end_sec = start_sec + dur_sec + rel
            i0 = int(start_sec * rate)
            i1 = min(int(end_sec * rate), n_samples)
            if i0 >= n_samples: continue
            gate = dur_sec
            nv = v.vol * n.vol
            phase = 0.0
            is_noise = (v.wave == 'noise')
            # precompute per-note params
            arp = n.arp
            arp_period = 1.0/ARP_RATE_HZ
            bend_from = float(n.midi)
            bend_to   = float(n.bend_to) if n.bend_to is not None else bend_from
            drum_drop = DRUM_KIT[n.drum]['drop'] if n.drum else 0
            for i in range(i0, i1):
                ts = (i - i0) / rate
                # ---- ADSR
                if ts < a:
                    env = ts/a if a>0 else 1.0
                elif ts < a + d:
                    env = 1.0 - (1.0 - s) * ((ts-a)/d if d>0 else 1.0)
                elif ts < gate:
                    env = s
                else:
                    rs = ts - gate
                    env = s * (1.0 - rs/rel) if rel>0 else 0.0
                    if env < 0: env = 0.0
                # ---- instantaneous pitch (midi)
                if arp:
                    idx = int(ts / arp_period) % len(arp)
                    cur_m = float(arp[idx])
                elif n.bend_to is not None:
                    frac = min(1.0, ts/gate) if gate>0 else 1.0
                    cur_m = bend_from + (bend_to - bend_from)*frac
                else:
                    cur_m = bend_from
                if n.drum and drum_drop:
                    # fast pitch drop over ~40ms
                    dd = max(0.0, 1.0 - ts/0.04)
                    cur_m = bend_from - drum_drop*(1.0-dd*0) # start high, drop
                    cur_m = bend_from*dd + (bend_from-drum_drop)*(1.0-dd)
                if n.vibrato and ts > a+d:
                    cur_m += (VIB_DEPTH_CENTS/100.0)*math.sin(TAU*VIB_RATE_HZ*ts)
                # ---- oscillator
                if is_noise:
                    nclock = noise_clock(cur_m)
                    noise_acc += nclock/rate
                    while noise_acc >= 1.0:
                        noise_val = lfsr.step(); noise_acc -= 1.0
                    smp = noise_val
                else:
                    hz = midi_to_hz(cur_m)
                    if v.wave == 'pulse':
                        smp = osc_pulse(phase, duty)
                    elif v.wave == 'triangle':
                        smp = osc_triangle(phase)
                    elif v.wave == 'saw':
                        smp = osc_saw(phase)
                    else:
                        smp = math.sin(TAU*phase)
                    phase += hz/rate
                buf[i] += smp * env * nv
    return buf

 def mix_and_write(song: Song, out_path: str, rate: int, loops: int,
                  verbose: bool = True):
    """Sum voices linearly, normalize to @master headroom (default −3 dBFS).
    No tanh/soft-clip unless @master limiter=soft|hard. Warns to stderr if
    the raw float sum exceeded 1.0 (meaning voice vols are too hot and the
    mix balance depends on post-normalization, not on the written vols)."""
    total = Fraction(0)
    for v in song.voices.values():
        t = sum((n.dur for bar in v.bars for n in bar), Fraction(0))
        if t > total: total = t
    if total == 0:
        raise SystemExit("no notes to render")
    wns = whole_note_seconds(song)
    n_samples = int(round(float(total) * wns * rate * loops))
    mix = array('f', bytes(4*n_samples))
    for v in song.voices.values():
        vb = render_voice(song, v, total, rate, loops)
        for i in range(n_samples):
            mix[i] += vb[i]
    # ── meter raw sum
    raw_peak = 0.0; raw_ss = 0.0
    for x in mix:
        ax=abs(x); raw_ss += x*x
        if ax>raw_peak: raw_peak=ax
    raw_rms=(raw_ss/n_samples)**0.5
    # ── optional limiter
    limiter = song.master.get('limiter','none')
    if limiter == 'soft':
        for i in range(n_samples): mix[i]=math.tanh(mix[i])
    elif limiter == 'hard':
        for i in range(n_samples):
            x=mix[i]; mix[i]=1.0 if x>1.0 else (-1.0 if x<-1.0 else x)
    # post-limiter peak
    pk=0.0
    for x in mix:
        ax=abs(x)
        if ax>pk: pk=ax
    headroom_db = song.master.get('headroom_db', -3.0)
    target = 10**(headroom_db/20.0)
    pregain = song.master.get('gain', 1.0)
    gain = pregain * ((target/pk) if pk>1e-9 else 1.0)
    pcm = array('h', [0]*n_samples)
    for i in range(n_samples):
        s=int(mix[i]*gain*32767.0)
        if s>32767:s=32767
        if s<-32768:s=-32768
        pcm[i]=s
    with wave.open(out_path,'wb') as w:
        w.setnchannels(1); w.setsampwidth(2); w.setframerate(rate)
        w.writeframes(pcm.tobytes())
    if verbose:
        warn = raw_peak > 1.0 and limiter=='none'
        print(f"  meter: raw peak={raw_peak:.3f} "
              f"({20*math.log10(raw_peak) if raw_peak>0 else -120:+.1f} dB)  "
              f"rms={raw_rms:.3f}  limiter={limiter}  "
              f"→ norm to {headroom_db:+.1f} dBFS (gain={gain:.3f})",
              file=sys.stderr)
        if warn:
            print(f"  ⚠ raw mix peaked at {raw_peak:.2f} (>1.0) with no "
                  f"limiter — voice vols too hot; mix balance is being "
                  f"rescued by normalization, not by your levels.",
                  file=sys.stderr)
    return n_samples, n_samples/rate, dict(raw_peak=raw_peak, raw_rms=raw_rms,
                                            limiter=limiter, gain=gain)

 def main(argv=None) -> int:
    ap = argparse.ArgumentParser(description="Render PFM to WAV (v2)")
    ap.add_argument('file')
    ap.add_argument('-o','--out', required=True)
    ap.add_argument('--loops', type=int, default=1)
    ap.add_argument('--rate', type=int, default=22050)
    args = ap.parse_args(argv)
    with open(args.file) as f:
        song = parse_pfm(f.read())
    if song.errors:
        for e in song.errors: print(f"parse: {e}", file=sys.stderr)
    n,dur,_m = mix_and_write(song, args.out, args.rate, args.loops)
    sz = os.path.getsize(args.out)
    print(f"wrote {args.out}: {n} samples, {dur:.2f}s, {sz} bytes "
          f"({sz/1024:.1f} KiB) @ {args.rate}Hz mono s16")
    return 0

 if __name__=='__main__':
    sys.exit(main())
diff --git a/sample-ambient.pfm b/sample-ambient.pfm
 @title Sample Ambient v2
 # Puzzle-calm loop. v2.1: bass rewritten to breathe (rests every bar, walks
 # between chords), voice vols rebalanced so raw mix stays under 0 dBFS.
 # Harm arp-ostinato still carries the 8th-pulse; bass now anchors & moves.
 @tempo 104
 @timesig 4/4
 @key A pent_minor
 @loop
 @style standard
 @master headroom=-3 limiter=none
 voice lead  wave=pulse duty=25   adsr=0.004,0.07,0.55,0.06 vol=0.38 range=E4-A6 role=lead
 voice harm  wave=pulse duty=12.5 adsr=0.003,0.05,0.40,0.04 vol=0.22 range=G3-A6 role=harmony
 voice bass  wave=triangle        adsr=0.003,0.02,0.90,0.03 vol=0.42 range=E1-A4 role=bass
 voice drums wave=drums vol=0.22

 # ══ HARM: arp-macro chord ostinato, 8ths — unchanged. This IS the pulse.
 # TECHNIQUE: arp-macro ostinato → metroid-brinstar bars 1-12.
 # Progression: Am ×4 → C ×4 → G ×4 → Am ×4
 harm: [A3 E4 A4]:8 [A3 E4 A4]:8 [A3 E4 A4]:8 [A3 E4 A4]:8 [A3 E4 A4]:8 [A3 E4 A4]:8 [A3 E4 A4]:8 [A3 E4 A4]:8 |
 harm: [A3 E4 C5]:8 [A3 E4 C5]:8 [A3 E4 C5]:8 [A3 E4 C5]:8 [A3 E4 C5]:8 [A3 E4 C5]:8 [A3 E4 C5]:8 [A3 E4 C5]:8 |
 harm: [A3 E4 A4]:8 [A3 E4 A4]:8 [A3 E4 A4]:8 [A3 E4 A4]:8 [A3 E4 A4]:8 [A3 E4 A4]:8 [A3 E4 A4]:8 [A3 E4 A4]:8 |
 harm: [A3 E4 C5]:8 [A3 E4 C5]:8 [A3 E4 C5]:8 [A3 E4 C5]:8 [A3 E4 C5]:8 [A3 E4 C5]:8 [A3 E4 C5]:8 [A3 E4 C5]:8 |
 harm: [C4 G4 C5]:8 [C4 G4 C5]:8 [C4 G4 C5]:8 [C4 G4 C5]:8 [C4 G4 C5]:8 [C4 G4 C5]:8 [C4 G4 C5]:8 [C4 G4 C5]:8 |
 harm: [C4 G4 E5]:8 [C4 G4 E5]:8 [C4 G4 E5]:8 [C4 G4 E5]:8 [C4 G4 E5]:8 [C4 G4 E5]:8 [C4 G4 E5]:8 [C4 G4 E5]:8 |
 harm: [C4 G4 C5]:8 [C4 G4 C5]:8 [C4 G4 C5]:8 [C4 G4 C5]:8 [C4 G4 C5]:8 [C4 G4 C5]:8 [C4 G4 C5]:8 [C4 G4 C5]:8 |
 harm: [C4 G4 E5]:8 [C4 G4 E5]:8 [C4 G4 E5]:8 [C4 G4 E5]:8 [C4 G4 E5]:8 [C4 G4 E5]:8 [C4 G4 E5]:8 [C4 G4 E5]:8 |
 harm: [G3 D4 G4]:8 [G3 D4 G4]:8 [G3 D4 G4]:8 [G3 D4 G4]:8 [G3 D4 G4]:8 [G3 D4 G4]:8 [G3 D4 G4]:8 [G3 D4 G4]:8 |
 harm: [G3 D4 A4]:8 [G3 D4 A4]:8 [G3 D4 A4]:8 [G3 D4 A4]:8 [G3 D4 A4]:8 [G3 D4 A4]:8 [G3 D4 A4]:8 [G3 D4 A4]:8 |
 harm: [G3 D4 G4]:8 [G3 D4 G4]:8 [G3 D4 G4]:8 [G3 D4 G4]:8 [G3 D4 G4]:8 [G3 D4 G4]:8 [G3 D4 G4]:8 [G3 D4 G4]:8 |
 harm: [G3 D4 A4]:8 [G3 D4 A4]:8 [G3 D4 A4]:8 [G3 D4 A4]:8 [E4 A4 C5]:8 [E4 A4 C5]:8 [E4 A4 C5]:8 [E4 A4 C5]:8 |
 harm: [A3 E4 A4]:8 [A3 E4 A4]:8 [A3 E4 A4]:8 [A3 E4 A4]:8 [A3 E4 A4]:8 [A3 E4 A4]:8 [A3 E4 A4]:8 [A3 E4 A4]:8 |
 harm: [A3 E4 C5]:8 [A3 E4 C5]:8 [A3 E4 C5]:8 [A3 E4 C5]:8 [A3 E4 C5]:8 [A3 E4 C5]:8 [A3 E4 C5]:8 [A3 E4 C5]:8 |
 harm: [A3 E4 A4]:8 [A3 E4 A4]:8 [A3 E4 A4]:8 [A3 E4 A4]:8 [A3 E4 A4]:8 [A3 E4 A4]:8 [A3 E4 A4]:8 [A3 E4 A4]:8 |
 harm: [A3 E4 C5]:8 [A3 E4 C5]:8 [A3 E4 C5]:8 [A3 E4 C5]:8 [A3 E4 A4]:8 [A3 E4 A4]:8 [A3 E4 A4]:8 [A3 E4 A4]:8 |

 # ══ BASS: anchor & walk. Root on 1, gap on 2, move on 3/4, rest → breathe.
 # TECHNIQUE: anchored-walk bass with rests → smb-overworld (44% rest, runs
 # ≤5 notes). Every bar contains at least one 8th or quarter rest; the last
 # bar of each 4-bar phrase walks stepwise into the next chord root.
 # ── Am (bars 1-4)
 bass: A2:4       R:8 E2:8   R:8 A2:8 R:8 C3:8 | A2:4       R:8 E2:8   A2:8 R:8 G2:8 R:8 |
 bass: A2:8 R:8   E2:8 R:8   A2:4     R:8 C3:8 | A2:4       R:8 G2:8   E2:8 D2:8 C2:8 R:8 |
 # ── C (bars 5-8)
 bass: C3:4       R:8 G2:8   R:8 C3:8 R:8 E3:8 | C3:4       R:8 G2:8   C3:8 R:8 D3:8 R:8 |
 bass: C3:8 R:8   G2:8 R:8   E3:4     R:8 C3:8 | C3:4       R:8 C3:8   A2:8 G2:8 A2:8 R:8 |
 # ── G (bars 9-12)
 bass: G2:4       R:8 D2:8   R:8 G2:8 R:8 A2:8 | G2:4       R:8 D2:8   G2:8 R:8 E2:8 R:8 |
 bass: G2:8 R:8   D2:8 R:8   G2:4     R:8 A2:8 | G2:4       R:8 D2:8   E2:8 G2:8 A2:8 R:8 |
 # ── Am' (bars 13-16) — settle for loop seam
 bass: A2:4       R:8 E2:8   R:8 A2:8 R:8 C3:8 | A2:4       R:8 E2:8   A2:8 R:8 G2:8 R:8 |
 bass: A2:8 R:8   E2:8 R:8   A2:4     R:8 E2:8 | A2:4       R:8 E2:8   R:4      A2:8 R:8 |

 # ══ LEAD: unchanged — pushed-8th pentatonic phrases.
 lead: A4:8 C5:8 E5:8 R:8   R:8 D5:8 C5:8 A4:8  | R:8 E5:8 R:8 C5:8   D5:8 C5:8 A4:8 G4:8~ |
 lead: -:8  A4:8 C5:8 E5:8  R:8 G5:8 E5:8 D5:8  | C5:8 R:8 A4:8 R:8   G4:8 A4:8 C5:8 E5:8~ |
 lead: -:8  G5:8 E5:8 R:8   R:8 C5:8 D5:8 E5:8  | R:8 G5:8 R:8 E5:8   G5:8 A5:8 G5:8 E5:8~ |
 lead: -:8  D5:8 C5:8 R:8   E5:8 D5:8 C5:8 G4:8 | R:8 C5:8 E5:8 G5:8  R:8 E5:8 D5:8 D5:8~  |
 lead: -:8  G5:8 D5:8 R:8   R:8 A4:8 C5:8 D5:8  | R:8 G5:8 A5:8 G5:8  R:8 D5:8 E5:8 D5:8~  |
 lead: -:8  C5:8 D5:8 G5:8  R:8 D5:8 C5:8 A4:8  | G4:8 R:8 A4:8 C5:8  R:8 D5:8 E5:8 E5:8~  |
 lead: -:8  A4:8 C5:8 E5:8  R:8 D5:8 C5:8 A4:8  | R:8 E5:8 R:8 C5:8   D5:8 C5:8 A4:8 G4:8~ |
 lead: -:8  A4:8 C5:8 E5:8  D5:8 C5:8 A4:8 R:8  | E4:8 G4:8 A4:8 R:8  R:8 C5:8 A4:8 A4:8   |

 # ══ DRUMS: unchanged — K+H hat-pulse, no snare.
 drums: K:8 H:8 H:8 K:8 H:8 H:8 H:8 H:8 | K:8 H:8 H:8 K:8 H:8 H:8 H:8 H:8 |
 drums: K:8 H:8 H:8 K:8 H:8 H:8 H:8 H:8 | K:8 H:8 H:8 K:8 H:8 H:8 H:8 H:8 |
 drums: K:8 H:8 H:8 K:8 H:8 H:8 H:8 H:8 | K:8 H:8 H:8 K:8 H:8 H:8 H:8 H:8 |
 drums: K:8 H:8 H:8 K:8 H:8 H:8 H:8 H:8 | K:8 H:8 H:8 K:8 H:8 K:8 H:8 O:8 |
 drums: K:8 H:8 H:8 K:8 H:8 H:8 H:8 H:8 | K:8 H:8 H:8 K:8 H:8 H:8 H:8 H:8 |
 drums: K:8 H:8 H:8 K:8 H:8 H:8 H:8 H:8 | K:8 H:8 H:8 K:8 H:8 H:8 H:8 H:8 |
 drums: K:8 H:8 H:8 K:8 H:8 H:8 H:8 H:8 | K:8 H:8 H:8 K:8 H:8 H:8 H:8 H:8 |
 drums: K:8 H:8 H:8 K:8 H:8 H:8 H:8 H:8 | K:8 H:8 K:8 H:8 K:8 H:8 K:8 O:8 |
diff --git a/sample-complete.pfm b/sample-complete.pfm
 @title Sample Complete
 # Victory sting — 1 bar, under 2s. Same iv→V→I Picardy resolution
 # compressed: 4-8th ascending run (A4→E5→G#5 leading tone) then
 # resolve to A5 held over C#5 Picardy third.
 @tempo 180
 @timesig 4/4
 @key A pent_minor
 @master headroom=-1 limiter=none
 voice p1  wave=pulse duty=50 adsr=0.001,0.03,0.65,0.12 vol=0.38 range=A3-B6 role=lead
 voice p2  wave=pulse duty=25 adsr=0.001,0.04,0.55,0.10 vol=0.26 range=D4-E6 role=harmony
 voice tri wave=triangle      adsr=0.001,0.02,0.90,0.18 vol=0.38 range=A1-A4 role=bass
 voice drums wave=drums vol=0.20

 # Beats 1-2: ascending run over iv→V. Beat 2.5: G#5 (leading tone).
 # Beats 3-4: resolve — A5 held, C#5 Picardy in harmony, A2 root in bass.
 p1:    R:8 A4:8 E5:8 G#5:8   A5:2                           |
 p2:    D4:8 F4:8 B4:8 G#4:8  C#5:2                          |
 tri:   D3:4      E3:4         A2:2                           |
 drums: R:8 K:8 S:4            K:4 C:4                        |
diff --git a/sample-fail.pfm b/sample-fail.pfm
 @title Sample Fail
 @tempo 140
 @timesig 2/4
 @key A chromatic
 @master headroom=-1 limiter=none
 voice p1 wave=pulse duty=50 adsr=0.002,0.05,0.40,0.08 vol=0.45 range=A3-A6

 # A4 -> G#4 (m2 down) -> Eb4 (tritone below A). Total = 2/4.
 p1: A4:16 G#4:16 Eb4:8 R:4 |
diff --git a/sample-sfx.pfm b/sample-sfx.pfm
 @title Sample SFX (catalogue)
 @tempo 160
 @timesig 1/4
 @key A pent_minor
 voice tap     wave=pulse    duty=25   adsr=0.001,0.04,0.00,0.02 vol=0.70 range=A3-A7
 voice connect wave=pulse    duty=50   adsr=0.002,0.08,0.30,0.05 vol=0.80 range=A3-A7
 voice undo    wave=triangle           adsr=0.002,0.06,0.20,0.04 vol=0.80 range=A2-A6
 voice star    wave=pulse    duty=12.5 adsr=0.002,0.05,0.50,0.10 vol=0.80 range=A4-A7

 # tap:     very short high click on E6 (5th above tonic, bright)
 # connect: rising A5->C6 sixteenth pair (affirming minor 3rd up)
 # undo:    falling C5->A4 (minor 3rd down, gentle triangle)
 # star:    shimmering A6->E7 arpeggio (octave+5th, thin 12.5% pulse)
 # unlock:  re-uses star voice but deeper: E5->A5->C6 (door-open chime)
 tap:     E6:16 R:16 R:8 |
 connect: A5:16 C6:16 R:8 |
 undo:    C5:16 A4:16 R:8 |
 star:    A6:32 C7:32 E7:32 A6:32 R:8 |
 star:    E5:16 A5:16 C6:8 |
diff --git a/SKILL.md b/SKILL.md
diff --git a/techniques.md b/techniques.md
diff --git a/validate_pfm.py b/validate_pfm.py
 #!/usr/bin/env python3
 """
 validate_pfm.py — parser + validator for PFM (Programmable Fun Music) v2.

 Pure stdlib. See format-spec.md for the grammar.

 v2 ADDITIONS (back-compatible with v1):
  - Drum kit on noise voice: K/S/H/C named hits (kick/snare/hat/crash)
  - Arpeggio macro: [C4 E4 G4]:4 cycles pitches for the given duration
  - Vibrato: C4~v:4 (note-level effect flag)
  - Pitch bend: C4>E4:4
  - Swing: @swing 0.67 header
  - Triplets: :8t (already in v1, reaffirmed)
  - Echo voice: `voice echo follows=<name> delay=3/16 vol=0.4`
  - @style ambient|drone|energetic|standard — tunes musicality thresholds
  - wave=drums alias for noise

 v2 MUSICALITY CHECKS (warnings, not errors):
  - density     : any 4-bar window most-active-voice < floor ev/s
  - percussion  : @loop piece >8 bars with no noise/drums voice
  - harmony     : implied chord static >4 bars
  - stagnation  : lead repeats same pitch >3× consecutively w/o rhythm var
  - pedal-bass  : bass is pure pedal tone >8 bars

 Exit 0 = clean (no errors, no warnings), 1 = issues.  --json for machine output.
 """
 from __future__ import annotations
 import sys, re, json, argparse
 from fractions import Fraction
 from dataclasses import dataclass, field
 from typing import List, Dict, Optional, Tuple

 # ---------------------------------------------------------------- pitch ---
 NOTE_BASE = {'C':0,'D':2,'E':4,'F':5,'G':7,'A':9,'B':11}
 PITCH_RE  = re.compile(r'^([A-Ga-g])([#b]?)(-?\d)$')

 def pitch_to_midi(tok: str) -> int:
    m = PITCH_RE.match(tok)
    if not m:
        raise ValueError(f"bad pitch '{tok}'")
    letter, acc, octv = m.group(1).upper(), m.group(2), int(m.group(3))
    semis = NOTE_BASE[letter] + (1 if acc=='#' else -1 if acc=='b' else 0)
    return 12 * (octv + 1) + semis   # C4 -> 60

 def midi_to_name(m: int) -> str:
    names = ['C','C#','D','D#','E','F','F#','G','G#','A','A#','B']
    return f"{names[m%12]}{m//12 - 1}"

 # ---------------------------------------------------------------- modes ---
 MODES = {
    'major':      [0,2,4,5,7,9,11],
    'ionian':     [0,2,4,5,7,9,11],
    'minor':      [0,2,3,5,7,8,10],
    'aeolian':    [0,2,3,5,7,8,10],
    'dorian':     [0,2,3,5,7,9,10],
    'phrygian':   [0,1,3,5,7,8,10],
    'lydian':     [0,2,4,6,7,9,11],
    'mixolydian': [0,2,4,5,7,9,10],
    'locrian':    [0,1,3,5,6,8,10],
    'pent_major': [0,2,4,7,9],
    'pent_minor': [0,3,5,7,10],
    'blues':      [0,3,5,6,7,10],
    'chromatic':  list(range(12)),
 }

 # ---------------------------------------------------------- consonance ---
 DIRECTED_SCORE = {
    0:1.0, 1:0.0, 2:0.3, 3:0.8, 4:0.8, 5:0.6, 6:0.0,
    7:1.0, 8:0.8, 9:0.8,10:0.3,11:0.0,
 }

 # ---------------------------------------------------------------- drums ---
 # Drum-kit macros for noise voice. Each is (pseudo-midi for LFSR rate,
 # adsr override, pitch-drop semitones over attack, label)
 DRUM_KIT = {
    'K': dict(midi=36, adsr=(0.001,0.08,0.0,0.02),  drop=18, label='kick'),
    'S': dict(midi=64, adsr=(0.001,0.09,0.0,0.03),  drop=4,  label='snare'),
    'H': dict(midi=84, adsr=(0.001,0.025,0.0,0.01), drop=0,  label='hat'),
    'O': dict(midi=82, adsr=(0.001,0.18,0.0,0.05),  drop=0,  label='openhat'),
    'C': dict(midi=80, adsr=(0.001,0.45,0.1,0.25),  drop=0,  label='crash'),
 }

 # ---------------------------------------------------------------- model ---
 @dataclass
 class Note:
    midi: Optional[int]      # None = rest
    dur:  Fraction           # in whole-note units
    bar:  int                # 1-based
    beat: float              # 1-based beat position within bar at onset
    tie_from_prev: bool = False
    vol:  float = 1.0
    adsr: Optional[Tuple[float,float,float,float]] = None
    tok:  str = ''
    # v2
    arp:  Optional[List[int]] = None   # list of midi pitches to cycle
    drum: Optional[str] = None         # 'K','S','H','C','O'
    vibrato: bool = False
    bend_to: Optional[int] = None      # target midi for pitch bend

 @dataclass
 class Voice:
    name: str
    wave: str = 'pulse'
    duty: float = 50.0
    adsr: Tuple[float,float,float,float] = (0.005,0.05,0.7,0.05)
    vol:  float = 0.8
    rng:  Tuple[int,int] = (pitch_to_midi('C1'), pitch_to_midi('C7'))
    bars: List[List['Note']] = field(default_factory=list)
    # v2
    follows: Optional[str] = None      # echo source voice
    delay:   Fraction = Fraction(0)    # echo delay in whole-note units
    role:    Optional[str] = None      # 'lead','bass','drums','harmony' hint

 @dataclass
 class Song:
    title: str = ''
    tempo: float = 120.0
    timesig: Tuple[int,int] = (4,4)
    key_root: int = 0
    key_mode: str = 'major'
    loop: bool = False
    swing: float = 0.5                 # 0.5 = straight; 0.67 = triplet swing
    style: str = 'standard'            # ambient|drone|energetic|standard
    voices: Dict[str,'Voice'] = field(default_factory=dict)
    master: Dict[str,float] = field(default_factory=lambda: {'headroom_db': -3.0, 'limiter': 'none'})
    errors: List[str] = field(default_factory=list)

    @property
    def bar_len(self) -> Fraction:
        n,d = self.timesig
        return Fraction(n, d)

    @property
    def beat_len(self) -> Fraction:
        return Fraction(1, self.timesig[1])

 # -------------------------------------------------------------- parsing ---
 DUR_RE = re.compile(r'^(\d+)(?:/(\d+))?(\.{0,2})(t?)$')

 def parse_dur(tok: str) -> Fraction:
    m = DUR_RE.match(tok)
    if not m:
        raise ValueError(f"bad duration '{tok}'")
    a = int(m.group(1))
    b = m.group(2)
    base = Fraction(a, int(b)) if b else Fraction(1, a)
    dots = len(m.group(3))
    if dots == 1: base = base * Fraction(3,2)
    elif dots == 2: base = base * Fraction(7,4)
    if m.group(4) == 't':
        base = base * Fraction(2,3)
    return base

 def parse_frac(tok: str) -> Fraction:
    """Parse '3/16' or '0.1875' or '8' (→1/8) into whole-note Fraction."""
    if '/' in tok:
        a,b = tok.split('/')
        return Fraction(int(a), int(b))
    try:
        return Fraction(tok).limit_denominator(192)
    except Exception:
        return Fraction(1, int(tok))

 # v2 event regex
 EVENT_RE = re.compile(
    r'^(?:'
      r'(?P<adsr>\{[^}]*\})'
      r'|(?P<rest>R):(?P<rdur>\S+)'
      r'|(?P<hold>-):(?P<hdur>\S+)'
      r'|(?P<drum>[KSHCO]):(?P<ddur>[0-9./t]+)(?:!(?P<dvol>[0-9.]+))?'
      r'|(?P<pitch>[A-Ga-g][#b]?\d)(?:>(?P<bend>[A-Ga-g][#b]?\d))?(?P<vib>~v)?'
         r':(?P<ndur>[0-9./t]+)(?P<tie>~?)(?:!(?P<vol>[0-9.]+))?'
    r')$'
 )
 ARP_RE = re.compile(r'^\[([^\]]+)\]:(?P<dur>[0-9./t]+)(?:!(?P<vol>[0-9.]+))?$')

 def _tokenize_bar(chunk: str) -> List[str]:
    """Whitespace split, but keep [...] groups intact."""
    out, buf, depth = [], '', 0
    for ch in chunk:
        if ch == '[': depth += 1; buf += ch
        elif ch == ']': depth -= 1; buf += ch
        elif ch.isspace() and depth == 0:
            if buf: out.append(buf); buf=''
        else:
            buf += ch
    if buf: out.append(buf)
    return out

 def parse_pfm(text: str) -> Song:
    song = Song()
    pending_adsr: Dict[str, Optional[Tuple[float,float,float,float]]] = {}
    for lineno, raw in enumerate(text.splitlines(), 1):
        line = re.sub(r'(^|\s)#.*$', '', raw).rstrip()
        if not line.strip():
            continue
        # ---- directives
        if line.startswith('@'):
            parts = line[1:].split()
            d = parts[0].lower()
            args = parts[1:]
            if d == 'title':   song.title = ' '.join(args)
            elif d == 'tempo': song.tempo = float(args[0])
            elif d == 'timesig':
                n,den = args[0].split('/'); song.timesig = (int(n), int(den))
            elif d == 'key':
                root = args[0]; mode = args[1].lower() if len(args)>1 else 'major'
                r = NOTE_BASE[root[0].upper()]
                if len(root)>1:
                    r += 1 if root[1]=='#' else -1 if root[1]=='b' else 0
                song.key_root = r % 12
                if mode not in MODES:
                    song.errors.append(f"line {lineno}: unknown mode '{mode}', using chromatic")
                    mode = 'chromatic'
                song.key_mode = mode
            elif d == 'loop':  song.loop = True
            elif d == 'swing': song.swing = float(args[0])
            elif d == 'style': song.style = args[0].lower()
            elif d == 'master':
                for kv in args:
                    if '=' not in kv: continue
                    k,val = kv.split('=',1)
                    if k=='headroom': song.master['headroom_db']=float(val)
                    elif k=='limiter': song.master['limiter']=val
                    elif k=='gain': song.master['gain']=float(val)
            else:
                song.errors.append(f"line {lineno}: unknown directive @{d}")
            continue
        # ---- voice decl
        if line.startswith('voice ') or line.startswith('voice\t'):
            toks = line.split()
            name = toks[1]
            v = Voice(name=name)
            for kv in toks[2:]:
                if '=' not in kv:
                    song.errors.append(f"line {lineno}: voice '{name}' bad attr '{kv}'"); continue
                k,val = kv.split('=',1); k=k.lower()
                if   k=='wave':
                    v.wave = 'noise' if val=='drums' else val
                    if val=='drums': v.role='drums'
                elif k=='duty': v.duty = float(val)
                elif k=='vol':  v.vol  = float(val)
                elif k=='adsr':
                    a = [float(x) for x in val.split(',')]
                    if len(a)!=4: song.errors.append(f"line {lineno}: adsr needs 4 values")
                    else: v.adsr = tuple(a)
                elif k=='range':
                    lo,hi = val.split('-'); v.rng = (pitch_to_midi(lo), pitch_to_midi(hi))
                elif k=='follows': v.follows = val
                elif k=='delay':   v.delay = parse_frac(val)
                elif k=='role':    v.role = val
                else:
                    song.errors.append(f"line {lineno}: voice '{name}' unknown attr '{k}'")
            song.voices[name] = v
            pending_adsr[name] = None
            continue
        # ---- score line
        if ':' in line:
            vname, rest = line.split(':',1)
            vname = vname.strip()
            if vname not in song.voices:
                song.errors.append(f"line {lineno}: undeclared voice '{vname}'"); continue
            v = song.voices[vname]
            chunks = rest.split('|')
            if chunks and chunks[-1].strip()=='': chunks = chunks[:-1]
            for chunk in chunks:
                barno = len(v.bars) + 1
                evs: List[Note] = []
                pos = Fraction(0)
                tie_next = False
                for tok in _tokenize_bar(chunk):
                    # arpeggio
                    am = ARP_RE.match(tok)
                    if am:
                        try:
                            pitches = [pitch_to_midi(p) for p in am.group(1).split()]
                            d = parse_dur(am.group('dur'))
                        except ValueError as e:
                            song.errors.append(f"line {lineno}: {vname} bar {barno}: {e}"); continue
                        beat = 1 + float(pos / song.beat_len)
                        nv = float(am.group('vol')) if am.group('vol') else 1.0
                        evs.append(Note(pitches[0], d, barno, beat, vol=nv,
                                        adsr=pending_adsr.get(vname), arp=pitches, tok=tok))
                        pending_adsr[vname]=None; pos += d; tie_next=False; continue
                    m = EVENT_RE.match(tok)
                    if not m:
                        song.errors.append(f"line {lineno}: voice {vname} bar {barno}: bad token '{tok}'"); continue
                    if m.group('adsr'):
                        try:
                            nums = [float(x) for x in m.group('adsr').strip('{}').split(',')]
                            if len(nums)!=4: raise ValueError
                            pending_adsr[vname] = tuple(nums)
                        except Exception:
                            song.errors.append(f"line {lineno}: bad ADSR override '{tok}'")
                        continue
                    if m.group('rest'):
                        d = parse_dur(m.group('rdur')); beat = 1 + float(pos / song.beat_len)
                        evs.append(Note(None, d, barno, beat, tok=tok))
                        pos += d; tie_next=False; continue
                    if m.group('hold'):
                        d = parse_dur(m.group('hdur')); beat = 1 + float(pos / song.beat_len)
                        evs.append(Note(-1, d, barno, beat, tie_from_prev=True, tok=tok))
                        pos += d; continue
                    if m.group('drum'):
                        dk = m.group('drum'); d = parse_dur(m.group('ddur'))
                        beat = 1 + float(pos / song.beat_len)
                        spec = DRUM_KIT[dk]
                        nv = float(m.group('dvol')) if m.group('dvol') else 1.0
                        evs.append(Note(spec['midi'], d, barno, beat, vol=nv,
                                        adsr=spec['adsr'], drum=dk, tok=tok))
                        pos += d; tie_next=False; continue
                    # pitched note
                    d = parse_dur(m.group('ndur'))
                    midi = pitch_to_midi(m.group('pitch'))
                    beat = 1 + float(pos / song.beat_len)
                    bend = pitch_to_midi(m.group('bend')) if m.group('bend') else None
                    note = Note(midi, d, barno, beat,
                                tie_from_prev=tie_next,
                                vol=float(m.group('vol')) if m.group('vol') else 1.0,
                                adsr=pending_adsr.get(vname),
                                vibrato=bool(m.group('vib')),
                                bend_to=bend, tok=tok)
                    pending_adsr[vname] = None
                    evs.append(note); pos += d
                    tie_next = (m.group('tie') == '~')
                v.bars.append(evs)
            continue
        song.errors.append(f"line {lineno}: unrecognised line")
    # resolve holds
    for v in song.voices.values():
        last_midi = None
        for bar in v.bars:
            for n in bar:
                if n.midi == -1:
                    n.midi = last_midi
                if n.midi is not None:
                    last_midi = n.midi
    # resolve echo voices: copy source bars, apply delay as leading rest
    for v in list(song.voices.values()):
        if v.follows:
            src = song.voices.get(v.follows)
            if not src:
                song.errors.append(f"voice {v.name}: follows='{v.follows}' not found"); continue
            if v.bars:
                song.errors.append(f"voice {v.name}: echo voice cannot have its own score lines"); continue
            if not v.wave or v.wave=='pulse': v.wave = src.wave
            # flatten src into absolute-time events then re-bar with delay
            bar_len = song.bar_len
            t = Fraction(0); seq=[]
            for bar in src.bars:
                for n in bar:
                    seq.append((t, n)); t += n.dur
            total = t
            nbars = len(src.bars)
            # build echo sequence
            v.bars = [[] for _ in range(nbars)]
            pos = Fraction(0)
            def emit(dur, proto=None):
                nonlocal pos
                rem = dur
                while rem > 0:
                    bi = int(pos // bar_len)
                    if bi >= nbars: return
                    in_bar = pos - bi*bar_len
                    cap = bar_len - in_bar
                    d = min(rem, cap)
                    beat = 1 + float(in_bar / song.beat_len)
                    if proto is None or proto.midi is None:
                        v.bars[bi].append(Note(None, d, bi+1, beat, tok='R'))
                    else:
                        tie = (rem != dur)
                        v.bars[bi].append(Note(proto.midi, d, bi+1, beat,
                            tie_from_prev=tie, vol=proto.vol, adsr=proto.adsr,
                            arp=proto.arp, drum=proto.drum,
                            vibrato=proto.vibrato, bend_to=proto.bend_to,
                            tok=proto.tok))
                    pos += d; rem -= d
            emit(v.delay, None)
            for (st,n) in seq:
                emit(n.dur, n)
            # pad
            if pos < nbars*bar_len:
                emit(nbars*bar_len - pos, None)
    return song

 # ----------------------------------------------------------- flattening ---
 def flatten_voice(v: Voice) -> List[Note]:
    """Merge ties into single Note objects with summed duration."""
    out: List[Note] = []
    for bar in v.bars:
        for n in bar:
            if n.tie_from_prev and out and out[-1].midi == n.midi and n.midi is not None:
                prev = out[-1]
                out[-1] = Note(prev.midi, prev.dur + n.dur, prev.bar, prev.beat,
                               prev.tie_from_prev, prev.vol, prev.adsr, prev.tok,
                               prev.arp, prev.drum, prev.vibrato, prev.bend_to)
            else:
                out.append(n)
    return out

 # ----------------------------------------------------- role inference ---
 def infer_roles(song: Song) -> Dict[str,str]:
    """Best-effort classification of each voice as lead/bass/drums/harmony."""
    roles = {}
    for v in song.voices.values():
        if v.role: roles[v.name]=v.role; continue
        if v.wave=='noise': roles[v.name]='drums'; continue
        if v.follows: roles[v.name]='echo'; continue
    # remaining pitched voices: lowest avg pitch = bass, highest = lead
    pitched = []
    for v in song.voices.values():
        if v.name in roles: continue
        ps = [n.midi for bar in v.bars for n in bar if n.midi is not None]
        if not ps: roles[v.name]='harmony'; continue
        pitched.append((sum(ps)/len(ps), v.name))
    pitched.sort()
    have_lead = 'lead' in roles.values()
    have_bass = 'bass' in roles.values()
    for i,(avg,nm) in enumerate(pitched):
        if i==0 and (len(pitched)>1 or have_lead) and not have_bass:
            roles[nm]='bass'
        elif i==len(pitched)-1 and not have_lead:
            roles[nm]='lead'
        else:
            roles[nm]='harmony'
    # name-based hints as last resort
    for nm,r in list(roles.items()):
        low=nm.lower()
        if r=='harmony' and ('bass' in low or 'tri' in low) and 'bass' not in roles.values():
            roles[nm]='bass'
        if r=='harmony' and 'lead' in low and 'lead' not in roles.values():
            roles[nm]='lead'
    return roles

 # ----------------------------------------------------- implied harmony ---
 CHORD_TEMPLATES = {
    'maj':[0,4,7], 'min':[0,3,7], 'dim':[0,3,6], 'aug':[0,4,8],
    'sus4':[0,5,7], 'sus2':[0,2,7],
 }
 PC_NAMES=['C','C#','D','D#','E','F','F#','G','G#','A','A#','B']
 def implied_chords(song: Song) -> List[str]:
    """One label per bar, derived from bass root + pitch-class histogram."""
    roles = infer_roles(song)
    nbars = max((len(v.bars) for v in song.voices.values()), default=0)
    out=[]
    for bi in range(nbars):
        hist=[0.0]*12; bass_pc=None; bass_lo=999
        for v in song.voices.values():
            if v.wave=='noise': continue
            if bi>=len(v.bars): continue
            for n in v.bars[bi]:
                if n.midi is None: continue
                pcs = [p%12 for p in (n.arp or [n.midi])]
                w = float(n.dur)/len(pcs)
                for pc in pcs: hist[pc]+=w
                if roles.get(v.name)=='bass' and n.midi<bass_lo:
                    bass_lo=n.midi; bass_pc=n.midi%12
        if sum(hist)==0: out.append('—'); continue
        if bass_pc is None:
            bass_pc = max(range(12), key=lambda i:hist[i])
        best=('?',-1)
        for q,iv in CHORD_TEMPLATES.items():
            for root in ([bass_pc] + list(range(12))):
                sc = sum(hist[(root+i)%12] for i in iv)
                if root==bass_pc: sc*=1.5
                if sc>best[1]: best=(f"{PC_NAMES[root]}{q}",sc)
        out.append(best[0])
    return out

 # ------------------------------------------------------------ validator ---
 @dataclass
 class Issue:
    severity: str; check: str; where: str; msg: str
    def as_dict(self): return self.__dict__

 STYLE_THRESHOLDS = {
    'standard':  dict(density_floor=1.5, need_perc=True,  harm_static=4, pedal_bars=8, bass_run_bars=4,  bass_rest_min=8.0,  vol_sum_max=1.6),
    'energetic': dict(density_floor=2.5, need_perc=True,  harm_static=4, pedal_bars=4, bass_run_bars=8,  bass_rest_min=0.0,  vol_sum_max=1.8),
    'ambient':   dict(density_floor=0.8, need_perc=True,  harm_static=8, pedal_bars=16, bass_run_bars=4,  bass_rest_min=15.0, vol_sum_max=1.4),
    'drone':     dict(density_floor=0.4, need_perc=False, harm_static=16,pedal_bars=32, bass_run_bars=32, bass_rest_min=0.0,  vol_sum_max=1.4),
 }

 def validate(song: Song) -> Tuple[List[Issue], Dict]:
    issues: List[Issue] = []
    stats: Dict = {}
    for e in song.errors:
        issues.append(Issue('error','parse','',e))

    bar_len = song.bar_len
    beat_len = song.beat_len
    scale = set((song.key_root + s) % 12 for s in MODES[song.key_mode])
    roles = infer_roles(song)
    th = STYLE_THRESHOLDS.get(song.style, STYLE_THRESHOLDS['standard'])

    # ---- rhythm ----------------------------------------------------------
    for v in song.voices.values():
        for i, bar in enumerate(v.bars, 1):
            tot = sum((n.dur for n in bar), Fraction(0))
            if tot != bar_len:
                beat = 1 + float(tot / beat_len)
                issues.append(Issue('error','rhythm', f"{v.name} bar {i}",
                    f"expected {song.timesig[0]}/{song.timesig[1]} (={float(bar_len):.3f} whole), "
                    f"got {float(tot):.3f} (ends at beat {beat:.2f})"))

    # ---- range -----------------------------------------------------------
    for v in song.voices.values():
        if v.wave=='noise': continue
        lo,hi = v.rng
        for bar in v.bars:
            for n in bar:
                if n.midi is None: continue
                for p in (n.arp or [n.midi]):
                    if not (lo <= p <= hi):
                        issues.append(Issue('error','range',
                            f"{v.name} bar {n.bar} beat {n.beat:.2f}",
                            f"{midi_to_name(p)} outside {midi_to_name(lo)}-{midi_to_name(hi)}"))

    # ---- tonality --------------------------------------------------------
    total_dur = Fraction(0); in_key_dur = Fraction(0); out_notes = []
    for v in song.voices.values():
        if v.wave == 'noise': continue
        flat = flatten_voice(v)
        pitched = [n for n in flat if n.midi is not None]
        for idx,n in enumerate(pitched):
            pcs = (n.arp or [n.midi])
            for p in pcs:
                d = n.dur/len(pcs); total_dur += d; pc=p%12
                if pc in scale: in_key_dur += d
                else:
                    prev_m = pitched[idx-1].midi if idx>0 else None
                    next_m = pitched[idx+1].midi if idx+1<len(pitched) else None
                    stepwise = (prev_m is not None and abs(p-prev_m)<=2) and \
                               (next_m is not None and abs(p-next_m)<=2)
                    short = d <= Fraction(1,8)
                    passing = stepwise and short
                    out_notes.append({'voice':v.name,'bar':n.bar,'beat':round(n.beat,2),
                        'note':midi_to_name(p),'dur':float(d),'passing':passing})
    # common alterations that are idiomatic, downgrade to 'passing'
    root=song.key_root; mode=song.key_mode
    alter=set()
    if mode in ('minor','aeolian','dorian','phrygian','pent_minor','blues'):
        alter |= {(root+11)%12,(root+9)%12}   # raised 7th, raised 6th (harmonic/melodic minor)
    if mode in ('major','ionian','mixolydian','lydian','pent_major'):
        alter |= {(root+10)%12,(root+3)%12}   # b7, b3 (mixolydian/blues inflection)
    if mode in ('pent_minor','pent_major'):
        alter |= {(root+2)%12,(root+8)%12,(root+5)%12,(root+11)%12,(root+4)%12}  # fill diatonic gaps
    alter |= {(root+6)%12}                    # tritone/blue note
    for o in out_notes:
        pc = pitch_to_midi(o['note'])%12
        if pc in alter: o['passing']=True
    pct = float(in_key_dur/total_dur*100) if total_dur else 100.0
    stats['tonality'] = {'in_key_pct': round(pct,1),
                         'key': f"{PC_NAMES[song.key_root]} {song.key_mode}",
                         'out_of_key': out_notes}
    non_passing = [o for o in out_notes if not o['passing']]
    for o in non_passing:
        issues.append(Issue('warn','tonality',
            f"{o['voice']} bar {o['bar']} beat {o['beat']}",
            f"{o['note']} not in {stats['tonality']['key']} (dur {o['dur']})"))
    if out_notes and not non_passing:
        issues.append(Issue('info','tonality','',
            f"{len(out_notes)} chromatic passing tone(s), all stepwise & short — OK"))

    # ---- dissonance ------------------------------------------------------
    timelines: Dict[str,List[Tuple[Fraction,Fraction,int]]] = {}
    max_len = Fraction(0)
    for v in song.voices.values():
        if v.wave == 'noise': continue
        t = Fraction(0); tl=[]
        for n in flatten_voice(v):
            if n.midi is not None:
                tl.append((t, t+n.dur, n.midi))
            t += n.dur
        timelines[v.name] = tl
        if t > max_len: max_len = t
    grid = Fraction(1,16); scores=[]; harsh_run=Fraction(0); harsh_runs=[]
    t=Fraction(0); harsh_start=None
    while t < max_len:
        sounding=[]
        for tl in timelines.values():
            for (s,e,m) in tl:
                if s<=t<e: sounding.append(m); break
        if len(sounding)>=2:
            ps=[]
            for i in range(len(sounding)):
                for j in range(i+1,len(sounding)):
                    ps.append(DIRECTED_SCORE[abs(sounding[i]-sounding[j])%12])
            sc=sum(ps)/len(ps); scores.append(sc)
            if sc<0.3:
                if harsh_start is None: harsh_start=t
                harsh_run+=grid
            else:
                if harsh_run>beat_len:
                    harsh_runs.append((float(harsh_start/beat_len)+1,float(harsh_run/beat_len)))
                harsh_run=Fraction(0); harsh_start=None
        else:
            if harsh_run>beat_len:
                harsh_runs.append((float(harsh_start/beat_len)+1,float(harsh_run/beat_len)))
            harsh_run=Fraction(0); harsh_start=None
        t+=grid
    if harsh_run>beat_len and harsh_start is not None:
        harsh_runs.append((float(harsh_start/beat_len)+1,float(harsh_run/beat_len)))
    if scores:
        stats['dissonance']={'mean':round(sum(scores)/len(scores),3),
            'min':round(min(scores),3),'samples':len(scores),
            'harsh_runs':[{'start_beat':round(a,2),'length_beats':round(b,2)} for a,b in harsh_runs]}
        for (a,b) in harsh_runs:
            bar=int((a-1)//song.timesig[0])+1; beat=((a-1)%song.timesig[0])+1
            issues.append(Issue('warn','dissonance',f"bar {bar} beat {beat:.2f}",
                f"sustained harsh interval for {b:.2f} beats (score<0.3)"))
    else:
        stats['dissonance']={'mean':None,'min':None,'samples':0,'harsh_runs':[]}

    # ---- loop seam -------------------------------------------------------
    nbars = max((len(v.bars) for v in song.voices.values()), default=0)
    if song.loop:
        lens={v.name:len(v.bars) for v in song.voices.values()}
        if len(set(lens.values()))>1:
            issues.append(Issue('error','loop','',f"voice bar counts differ: {lens}"))
        for v in song.voices.values():
            if v.wave=='noise' or v.follows: continue
            flat=[n for n in flatten_voice(v) if n.midi is not None]
            if len(flat)<2: continue
            last=flat[-1].midi; first=flat[0].midi; leap=abs(last-first)
            # bass lines routinely leap octaves at seams — judge by pitch class
            if roles.get(v.name) in ('bass','harmony'):
                leap = min(leap%12, 12-leap%12)
            elif leap%12==0: leap=0
            if leap>7:
                issues.append(Issue('warn','loop',v.name,
                    f"seam leap {midi_to_name(last)}→{midi_to_name(first)} = {leap} semitones (>P5)"))
        stats['loop']={'bars':lens}

    stats['rhythm']={'bars_per_voice':{v.name:len(v.bars) for v in song.voices.values()}}
    stats['roles']=roles

    # ═══════════════ v2 MUSICALITY CHECKS (warnings) ═════════════════════
    bar_sec = float(bar_len) * (60.0/song.tempo) * 4.0
    # per-voice onset counts per bar
    onsets = {v.name:[0]*nbars for v in song.voices.values()}
    for v in song.voices.values():
        for bi,bar in enumerate(v.bars):
            for n in bar:
                if n.midi is not None and not n.tie_from_prev:
                    onsets[v.name][bi]+=1
    stats['onsets_per_bar']=onsets

    # ---- density floor (4-bar sliding window, most active voice) --------
    if nbars>=4 and bar_sec>0:
        pitched_v=[v.name for v in song.voices.values() if v.wave!='noise']
        worst=None
        for w0 in range(0, nbars-3):
            best_v=0
            for nm in pitched_v:
                c=sum(onsets[nm][w0:w0+4]); best_v=max(best_v,c)
            evs=best_v/(4*bar_sec)
            if worst is None or evs<worst[1]: worst=(w0+1,evs)
        stats['density']={'min_window_evs':round(worst[1],2),'at_bar':worst[0]}
        if worst[1] < th['density_floor']:
            issues.append(Issue('warn','density',f"bars {worst[0]}-{worst[0]+3}",
                f"most-active voice only {worst[1]:.2f} ev/s "
                f"(floor {th['density_floor']} for @style {song.style}) — too sparse"))

    # ---- percussion presence --------------------------------------------
    has_noise = any(v.wave=='noise' and any(onsets[v.name]) for v in song.voices.values())
    stats['percussion_present']=has_noise
    if song.loop and nbars>8 and th['need_perc'] and not has_noise:
        issues.append(Issue('warn','percussion','',
            f"@loop piece with {nbars} bars has no noise/drum voice "
            f"(declare @style drone to suppress)"))

    # ---- static harmony --------------------------------------------------
    chords = implied_chords(song)
    stats['implied_chords']=chords
    run=1; flagged=False
    for i in range(1,len(chords)):
        if chords[i]==chords[i-1] and chords[i]!='—': run+=1
        else:
            if run>th['harm_static']:
                issues.append(Issue('warn','harmony',f"bars {i-run+1}-{i}",
                    f"implied chord '{chords[i-1]}' static for {run} bars (>{th['harm_static']})"))
                flagged=True
            run=1
    if run>th['harm_static'] and chords:
        issues.append(Issue('warn','harmony',f"bars {len(chords)-run+1}-{len(chords)}",
            f"implied chord '{chords[-1]}' static for {run} bars (>{th['harm_static']})"))

    # ---- melodic stagnation ---------------------------------------------
    for v in song.voices.values():
        if roles.get(v.name)!='lead': continue
        flat=[n for n in flatten_voice(v) if n.midi is not None]
        i=0
        while i<len(flat):
            j=i
            while j+1<len(flat) and flat[j+1].midi==flat[i].midi: j+=1
            reps=j-i+1
            if reps>3:
                durs={flat[k].dur for k in range(i,j+1)}
                if len(durs)==1:
                    issues.append(Issue('warn','stagnation',
                        f"{v.name} bar {flat[i].bar}",
                        f"{midi_to_name(flat[i].midi)} repeated {reps}× with identical rhythm"))
            i=j+1

    # ---- pedal bass ------------------------------------------------------
    for v in song.voices.values():
        if roles.get(v.name)!='bass': continue
        pcs_per_bar=[]
        for bar in v.bars:
            s={n.midi%12 for n in bar if n.midi is not None}
            pcs_per_bar.append(s)
        i=0
        while i<len(pcs_per_bar):
            if len(pcs_per_bar[i])!=1: i+=1; continue
            pc=list(pcs_per_bar[i])[0]; j=i
            while j+1<len(pcs_per_bar) and pcs_per_bar[j+1]=={pc}: j+=1
            if j-i+1>th['pedal_bars']:
                issues.append(Issue('warn','pedal-bass',f"{v.name} bars {i+1}-{j+1}",
                    f"bass pedal on {PC_NAMES[pc]} for {j-i+1} bars (>{th['pedal_bars']})"))
            i=j+1

    # ---- bass breathing (rest% + longest run without rest) --------------
    for v in song.voices.values():
        if roles.get(v.name)!='bass': continue
        seq=[n for bar in v.bars for n in bar]
        tot=sum((n.dur for n in seq), Fraction(0))
        rst=sum((n.dur for n in seq if n.midi is None), Fraction(0))
        rest_pct=100*float(rst)/float(tot) if tot else 0
        run=Fraction(0); longest=Fraction(0)
        for n in seq:
            if n.midi is None: run=Fraction(0)
            else: run+=n.dur; longest=max(longest,run)
        run_bars=float(longest)/float(song.bar_len)
        stats.setdefault('bass',{}).update(rest_pct=rest_pct, longest_run_bars=run_bars)
        if run_bars>th['bass_run_bars'] and rest_pct<th['bass_rest_min']:
            issues.append(Issue('warn','bass-breathe',v.name,
                f"bass plays {run_bars:.1f} bars without a rest "
                f"(>{th['bass_run_bars']}) and rest%={rest_pct:.0f}% "
                f"(<{th['bass_rest_min']:.0f}%) — relentless, will dominate mix"))

    # ---- swing vs fine subdivision --------------------------------------
    if abs(song.swing-0.5)>1e-6:
        fine=set()
        for v in song.voices.values():
            for bar in v.bars:
                for n in bar:
                    if n.dur < Fraction(1,8) and n.dur != Fraction(1,12):
                        fine.add(n.dur)
        if fine:
            ds=', '.join(f"1/{int(1/float(d))}" for d in sorted(fine,reverse=True))
            issues.append(Issue('warn','swing-grid','',
                f"@swing={song.swing} but piece uses sub-8th values ({ds}); "
                f"renderer warps ALL onsets — 16ths will be unevenly spaced. "
                f"If you want straight 16ths with syncopation, remove @swing."))

    # ---- voice-volume headroom (cheap static proxy; meter_pfm for real) --
    vsum=sum(v.vol for v in song.voices.values())
    stats['vol_sum']=vsum
    if vsum>th['vol_sum_max']:
        vols=', '.join(f"{v.name}={v.vol:.2f}" for v in song.voices.values())
        issues.append(Issue('warn','headroom','',
            f"Σ voice vol = {vsum:.2f} > {th['vol_sum_max']:.1f} "
            f"({vols}) — raw mix will likely exceed 0 dBFS; "
            f"run meter_pfm.py to confirm"))

    return issues, stats

 # ----------------------------------------------------------------- main ---
 def main(argv=None) -> int:
    ap = argparse.ArgumentParser(description="Validate a PFM file (v2)")
    ap.add_argument('file')
    ap.add_argument('--json', action='store_true')
    args = ap.parse_args(argv)
    with open(args.file) as f:
        song = parse_pfm(f.read())
    issues, stats = validate(song)
    errs=[i for i in issues if i.severity=='error']
    warns=[i for i in issues if i.severity=='warn']
    infos=[i for i in issues if i.severity=='info']
    if args.json:
        print(json.dumps({'file':args.file,'title':song.title,
            'ok':len(errs)==0 and len(warns)==0,
            'errors':[i.as_dict() for i in errs],
            'warnings':[i.as_dict() for i in warns],
            'info':[i.as_dict() for i in infos],
            'stats':stats},indent=2))
    else:
        print(f"══ {args.file}  «{song.title or 'untitled'}»  "
              f"{song.timesig[0]}/{song.timesig[1]} @ {song.tempo}bpm  "
              f"key={stats['tonality']['key']}  style={song.style}  loop={'yes' if song.loop else 'no'}")
        rl=stats["roles"]
        print("   voices: " + ", ".join(f"{n}({v.wave},{len(v.bars)}bars,{rl.get(n,'?')})" for n,v in song.voices.items()))
        print(f"   tonality: {stats['tonality']['in_key_pct']}% in key"
              + (f"  ({len(stats['tonality']['out_of_key'])} out-of-key, "
                 f"{sum(1 for o in stats['tonality']['out_of_key'] if o['passing'])} passing)"
                 if stats['tonality']['out_of_key'] else ""))
        d=stats['dissonance']
        if d['samples']:
            print(f"   consonance: mean={d['mean']} min={d['min']} over {d['samples']} samples"
                  + (f"  ⚠ {len(d['harsh_runs'])} harsh run(s)" if d['harsh_runs'] else ""))
        if 'density' in stats:
            print(f"   density: min 4-bar window = {stats['density']['min_window_evs']} ev/s @ bar {stats['density']['at_bar']}")
        print(f"   harmony: {' '.join(stats['implied_chords'][:16])}"
              + (" …" if len(stats['implied_chords'])>16 else ""))
        for i in errs:  print(f"   ✘ [{i.check}] {i.where}: {i.msg}")
        for i in warns: print(f"   ⚠ [{i.check}] {i.where}: {i.msg}")
        for i in infos: print(f"   ℹ [{i.check}] {i.msg}")
        if not errs and not warns: print("   ✔ clean")
    return 0 if (not errs and not warns) else 1

 if __name__ == '__main__':
    sys.exit(main())
	#!/usr/bin/env python3
	"""
	analyze_pfm.py — Deliverable C: musical metrics + corpus comparison for PFM.

	Pure stdlib. Reuses parser/harmony/roles from validate_pfm.py (same dir).

	MODE 1: python3 analyze_pfm.py file.pfm [--json]
	→ per-piece metrics (density, syncopation, contour, harmony, drums,
	phrase structure, voice motion …)

	MODE 2: python3 analyze_pfm.py --corpus DIR/ --compare file.pfm
	→ analyze every .pfm in DIR, compute min/median/max for each scalar,
	compare file.pfm against that envelope, flag outliers.

	Exit 0 always (advisory, not validation).
	"""
	from __future__ import annotations
	import sys, os, json, argparse, statistics
	from fractions import Fraction
	from typing import List, Dict, Optional, Tuple

	sys.path.insert(0, os.path.dirname(os.path.abspath(__file__)) or '.')
	from validate_pfm import (parse_pfm, Song, Voice, Note, flatten_voice,
	infer_roles, implied_chords, midi_to_name)

	# ═════════════════════════════════════════════════════════════ helpers ═══
	def nbars(song: Song) -> int:
	return max((len(v.bars) for v in song.voices.values()), default=0)

	def bar_seconds(song: Song) -> float:
	# whole-note = 4 beats; bar_len is in whole-note units; quarter = 60/tempo
	return float(song.bar_len) * 4.0 * (60.0 / song.tempo)

	def onsets(v: Voice) -> List[Note]:
	"""All sounding onsets (no rests, no tie-continuations)."""
	return [n for bar in v.bars for n in bar
	if n.midi is not None and not n.tie_from_prev]

	def pitched_onsets(v: Voice) -> List[Note]:
	return [n for n in onsets(v) if n.drum is None]


	def smart_roles(song: Song) -> Dict[str,str]:
	"""Wrap validate_pfm.infer_roles with name-based hints first."""
	roles: Dict[str,str] = {}
	for v in song.voices.values():
	if v.role: roles[v.name] = v.role; continue
	low = v.name.lower()
	if v.wave == 'noise' or 'drum' in low or 'perc' in low:
	roles[v.name] = 'drums'
	elif 'lead' in low or 'mel' in low:
	roles[v.name] = 'lead'
	elif 'bass' in low:
	roles[v.name] = 'bass'
	elif 'harm' in low or 'pad' in low or 'chord' in low:
	roles[v.name] = 'harmony'
	elif 'echo' in low or v.follows:
	roles[v.name] = 'echo'
	# fill remaining via validator heuristic
	base = infer_roles(song)
	for nm, r in base.items():
	roles.setdefault(nm, r)
	# ensure at most one lead: keep the one with most onsets
	leads = [nm for nm,r in roles.items() if r=='lead']
	if len(leads) > 1:
	leads.sort(key=lambda nm: -len(onsets(song.voices[nm])))
	for nm in leads[1:]: roles[nm] = 'harmony'
	if 'lead' not in roles.values():
	# promote busiest pitched non-bass voice
	cand = [(len(onsets(v)), nm) for nm,v in song.voices.items()
	if roles.get(nm) not in ('drums','bass') and v.wave!='noise']
	if cand:
	cand.sort(reverse=True); roles[cand[0][1]]='lead'
	return roles

	def find_role(roles: Dict[str,str], song: Song, want: str) -> Optional[Voice]:
	for nm, r in roles.items():
	if r == want and nm in song.voices:
	return song.voices[nm]
	return None

	# ═══════════════════════════════════════════════════════════════ MODE 1 ═══
	def analyze(song: Song) -> Dict:
	roles = smart_roles(song)
	nb = nbars(song)
	bsec = bar_seconds(song)
	total_sec = nb * bsec
	beat_len = song.beat_len
	n_beats = song.timesig[0]
	out: Dict = {
	'title': song.title, 'tempo': song.tempo,
	'timesig': f"{song.timesig[0]}/{song.timesig[1]}",
	'key': None, 'style': song.style, 'loop': song.loop,
	'bars': nb, 'seconds': round(total_sec, 2),
	'roles': roles,
	}

	# ── note_density ────────────────────────────────────────────────────
	per_voice = {}
	total_ons = 0
	for v in song.voices.values():
	c = len(onsets(v))
	total_ons += c
	per_voice[v.name] = {
	'events': c,
	'ev_per_bar': round(c / nb, 2) if nb else 0.0,
	'ev_per_sec': round(c / total_sec, 3) if total_sec else 0.0,
	}
	out['note_density'] = {
	'overall_ev_per_sec': round(total_ons / total_sec, 3) if total_sec else 0.0,
	'overall_ev_per_bar': round(total_ons / nb, 2) if nb else 0.0,
	'per_voice': per_voice,
	}

	# ── duration_histogram ──────────────────────────────────────────────
	NAMED = {Fraction(1,1):'1', Fraction(1,2):'2', Fraction(1,4):'4',
	Fraction(1,8):'8', Fraction(1,16):'16', Fraction(1,32):'32',
	Fraction(3,8):'4.', Fraction(3,16):'8.', Fraction(3,4):'2.',
	Fraction(3,32):'16.', Fraction(1,12):'8t', Fraction(1,6):'4t',
	Fraction(1,24):'16t'}
	hist: Dict[str,int] = {}
	for v in song.voices.values():
	for n in onsets(v):
	key = NAMED.get(n.dur, str(n.dur))
	hist[key] = hist.get(key, 0) + 1
	out['duration_histogram'] = dict(sorted(hist.items(),
	key=lambda kv: -kv[1]))

	# ── syncopation_index ───────────────────────────────────────────────
	sync_on = sync_tot = 0
	EPS = 1e-6
	for v in song.voices.values():
	if roles.get(v.name) == 'drums' or v.wave == 'noise':
	continue
	for n in onsets(v):
	sync_tot += 1
	frac = (n.beat - 1.0) % 1.0
	if frac > EPS and frac < 1 - EPS:
	sync_on += 1
	out['syncopation_index'] = round(sync_on / sync_tot, 3) if sync_tot else 0.0

	# ── swing_ratio ─────────────────────────────────────────────────────
	if abs(song.swing - 0.5) > 1e-6:
	out['swing_ratio'] = {'declared': song.swing, 'detected': song.swing,
	'n_pairs': 0}
	else:
	# detect from consecutive 8th-note pairs on beat boundaries
	eighth = Fraction(1, 8)
	ratios = []
	for v in song.voices.values():
	if v.wave == 'noise': continue
	flat = flatten_voice(v)
	for a, b in zip(flat, flat[1:]):
	if a.midi is None or b.midi is None: continue
	tot = a.dur + b.dur
	# pair spans exactly one beat, first note on a beat
	if tot == 2eighthFraction(song.timesig[1],4)*0 + Fraction(1,4): pass
	if tot == Fraction(1,4) and abs((a.beat-1.0)%1.0) < EPS:
	ratios.append(float(a.dur / tot))
	det = round(statistics.median(ratios), 3) if ratios else 0.5
	out['swing_ratio'] = {'declared': song.swing, 'detected': det,
	'n_pairs': len(ratios)}

	# ── melodic_contour (lead) ──────────────────────────────────────────
	lead = find_role(roles, song, 'lead')
	if lead:
	ps = [n for n in flatten_voice(lead)
	if n.midi is not None and not n.tie_from_prev and n.drum is None]
	ups = downs = reps = 0
	leaps = []
	for a, b in zip(ps, ps[1:]):
	d = b.midi - a.midi
	if d > 0: ups += 1
	elif d < 0: downs += 1
	else: reps += 1
	if d != 0: leaps.append(abs(d))
	n_iv = max(1, len(ps) - 1)
	midis = [n.midi for n in ps]
	# phrase shapes per 4-bar window
	shapes = []
	for w0 in range(0, nb, 4):
	seg = [n.midi for n in ps if w0 < n.bar <= w0 + 4]
	shapes.append(_contour_shape(seg))
	out['melodic_contour'] = {
	'voice': lead.name,
	'pct_up': round(ups / n_iv, 3),
	'pct_down': round(downs / n_iv, 3),
	'pct_repeat': round(reps / n_iv, 3),
	'mean_leap_semitones': round(statistics.mean(leaps), 2) if leaps else 0.0,
	'range_span': (max(midis) - min(midis)) if midis else 0,
	'range': f"{midi_to_name(min(midis))}-{midi_to_name(max(midis))}" if midis else '',
	'phrase_shapes': shapes,
	}
	else:
	out['melodic_contour'] = None

	# ── harmonic_rhythm ─────────────────────────────────────────────────
	chords = implied_chords(song)
	changes = sum(1 for a, b in zip(chords, chords[1:])
	if a != b and a != '—' and b != '—')
	per8 = round(changes / nb * 8, 2) if nb else 0.0
	out['harmonic_rhythm'] = {
	'chords_per_bar': chords,
	'n_distinct': len({c for c in chords if c != '—'}),
	'changes_per_8bars': per8,
	}

	# ── drum_grid ───────────────────────────────────────────────────────
	drumv = find_role(roles, song, 'drums')
	out['has_drums'] = drumv is not None and len(onsets(drumv)) > 0
	if out['has_drums']:
	step = song.bar_len / 16
	grids = []
	backbeat_bars = 0
	for bi, bar in enumerate(drumv.bars, 1):
	g = ['.'] * 16
	pos = Fraction(0)
	snare_beats = set()
	for n in bar:
	if n.midi is not None and not n.tie_from_prev:
	idx = int(pos / step)
	if 0 <= idx < 16:
	sym = n.drum or 'x'
	# don't overwrite K/S with H
	if g[idx] in ('.','H','O') or sym in ('K','S','C'):
	g[idx] = sym
	if n.drum == 'S':
	b = 1 + float(pos / beat_len)
	if abs(b - round(b)) < 1e-6:
	snare_beats.add(int(round(b)))
	pos += n.dur
	grids.append(''.join(g))
	if n_beats == 4 and {2, 4} <= snare_beats:
	backbeat_bars += 1
	elif n_beats != 4 and 2 in snare_beats:
	backbeat_bars += 1
	out['drum_grid'] = {
	'voice': drumv.name,
	'patterns': grids,
	'distinct_patterns': len(set(grids)),
	'backbeat_present': backbeat_bars >= max(1, len(grids) // 2),
	'backbeat_bars': f"{backbeat_bars}/{len(grids)}",
	}
	else:
	out['drum_grid'] = None

	# ── phrase_structure (lead bar-similarity → AABA…) ──────────────────
	if lead and nb:
	sigs = []
	for bi in range(nb):
	bar = lead.bars[bi] if bi < len(lead.bars) else []
	seq = tuple((n.midi, n.dur) for n in bar
	if n.midi is not None and not n.tie_from_prev)
	sigs.append(seq)
	# similarity matrix (normalized LCS on pitch-contour+dur)
	sim = [[_bar_similarity(sigs[i], sigs[j]) for j in range(nb)]
	for i in range(nb)]
	# greedy label per bar
	labels = [''] * nb
	next_l = 0
	LET = 'ABCDEFGHIJKLMNOPQRSTUVWXYZ'
	for i in range(nb):
	if labels[i]: continue
	lab = LET[next_l % 26]; next_l += 1
	labels[i] = lab
	for j in range(i + 1, nb):
	if not labels[j] and sim[i][j] >= 0.75:
	labels[j] = lab
	bar_form = ''.join(labels)
	# collapse to 4-bar phrases
	phrase_form = _collapse_phrases(labels, 4)
	out['phrase_structure'] = {
	'bar_labels': bar_form,
	'form': phrase_form,
	'similarity_matrix': [[round(x, 2) for x in row] for row in sim],
	}
	else:
	out['phrase_structure'] = None

	# ── voice_motion (lead vs harmony, beat-grid) ───────────────────────
	harm = find_role(roles, song, 'harmony') or find_role(roles, song, 'bass')
	if lead and harm and harm is not lead:
	tl_l = _timeline(lead, song)
	tl_h = _timeline(harm, song)
	par = con = obl = 0
	prev = None
	t = Fraction(0)
	end = nb * song.bar_len
	while t < end:
	a = _sounding(tl_l, t)
	b = _sounding(tl_h, t)
	if a is not None and b is not None:
	if prev is not None:
	pa, pb = prev
	da, db = a - pa, b - pb
	if da == 0 and db == 0:
	pass # static, skip
	elif da == 0 or db == 0:
	obl += 1
	elif (da > 0) == (db > 0):
	par += 1
	else:
	con += 1
	prev = (a, b)
	else:
	prev = None
	t += beat_len
	tot = max(1, par + con + obl)
	out['voice_motion'] = {
	'vs': f"{lead.name}↔{harm.name}",
	'pct_parallel': round(par / tot, 3),
	'pct_contrary': round(con / tot, 3),
	'pct_oblique': round(obl / tot, 3),
	'n_samples': par + con + obl,
	}
	else:
	out['voice_motion'] = None

	return out

	# ── contour / similarity helpers ────────────────────────────────────────
	def _contour_shape(seg: List[int]) -> str:
	if len(seg) < 3: return 'flat'
	n = len(seg)
	first, last = seg[0], seg[-1]
	peak_i = max(range(n), key=lambda i: seg[i])
	trough_i = min(range(n), key=lambda i: seg[i])
	span = max(seg) - min(seg)
	if span <= 2: return 'flat'
	mid_lo, mid_hi = n * 0.25, n * 0.75
	if mid_lo <= peak_i <= mid_hi and seg[peak_i] - first >= 2 and seg[peak_i] - last >= 2:
	return 'arch'
	if mid_lo <= trough_i <= mid_hi and first - seg[trough_i] >= 2 and last - seg[trough_i] >= 2:
	return 'valley'
	if last - first >= span * 0.5: return 'ramp-up'
	if first - last >= span * 0.5: return 'ramp-down'
	return 'wave'

	def _bar_similarity(a: tuple, b: tuple) -> float:
	if not a and not b: return 1.0
	if not a or not b: return 0.0
	# LCS on (pitch-class, dur) pairs
	A = [(m % 12, d) for (m, d) in a]
	B = [(m % 12, d) for (m, d) in b]
	la, lb = len(A), len(B)
	dp = [[0]*(lb+1) for _ in range(la+1)]
	for i in range(la):
	for j in range(lb):
	dp[i+1][j+1] = dp[i][j]+1 if A[i]==B[j] else max(dp[i][j+1], dp[i+1][j])
	return dp[la][lb] / max(la, lb)

	def _collapse_phrases(labels: List[str], width: int) -> str:
	if not labels: return ''
	phrases = [tuple(labels[i:i+width]) for i in range(0, len(labels), width)]
	LET = 'ABCDEFGHIJKLMNOPQRSTUVWXYZ'
	plabs = []
	seen: Dict[tuple,str] = {}
	for p in phrases:
	# match if ≥ half the bar-labels agree with a prior phrase
	best = None
	for q, lab in seen.items():
	if len(q) == len(p):
	agree = sum(1 for x,y in zip(p,q) if x==y)
	if agree >= (len(p)+1)//2:
	best = lab; break
	if best is None:
	best = LET[len(seen) % 26]
	seen[p] = best
	plabs.append(best)
	return ''.join(plabs)

	def _timeline(v: Voice, song: Song) -> List[Tuple[Fraction,Fraction,int]]:
	t = Fraction(0); out = []
	for n in flatten_voice(v):
	if n.midi is not None and n.drum is None:
	out.append((t, t + n.dur, n.midi))
	t += n.dur
	return out

	def _sounding(tl, t: Fraction) -> Optional[int]:
	for s, e, m in tl:
	if s <= t < e: return m
	return None

	# ═════════════════════════════════════════════════════════════ scalars ═══
	# Scalar metrics extracted for corpus comparison. Each is (label, getter,
	# higher_is_more, fmt). getter returns float or None.
	SCALARS = [
	('density (ev/s)', lambda m: m['note_density']['overall_ev_per_sec'], '{:.2f}'),
	('density (ev/bar)', lambda m: m['note_density']['overall_ev_per_bar'], '{:.1f}'),
	('syncopation', lambda m: m['syncopation_index'], '{:.2f}'),
	('swing ratio', lambda m: m['swing_ratio']['detected'], '{:.2f}'),
	('harm changes/8b', lambda m: m['harmonic_rhythm']['changes_per_8bars'],'{:.1f}'),
	('harm distinct', lambda m: m['harmonic_rhythm']['n_distinct'], '{:.0f}'),
	('lead range (st)', lambda m: (m['melodic_contour'] or {}).get('range_span'), '{:.0f}'),
	('lead mean leap', lambda m: (m['melodic_contour'] or {}).get('mean_leap_semitones'), '{:.2f}'),
	('lead %repeat', lambda m: (m['melodic_contour'] or {}).get('pct_repeat'), '{:.2f}'),
	('motion %contrary', lambda m: (m['voice_motion'] or {}).get('pct_contrary'), '{:.2f}'),
	('motion %parallel', lambda m: (m['voice_motion'] or {}).get('pct_parallel'), '{:.2f}'),
	('bars', lambda m: m['bars'], '{:.0f}'),
	]
	BOOLS = [
	('has_drums', lambda m: m['has_drums']),
	('backbeat', lambda m: (m['drum_grid'] or {}).get('backbeat_present', False)),
	('loop', lambda m: m['loop']),
	]

	# ═════════════════════════════════════════════════════════════ printing ═══
	def print_human(m: Dict):
	p = print
	p(f"══ {m['title'] or 'untitled'} — {m['timesig']} @ {m['tempo']}bpm "
	f"style={m['style']} {m['bars']} bars ({m['seconds']}s) loop={'yes' if m['loop'] else 'no'}")
	roles = m['roles']
	p(" voices: " + ", ".join(f"{n}[{r}]" for n, r in roles.items()))
	p("")
	# density
	nd = m['note_density']
	p(f"┌ note_density overall = {nd['overall_ev_per_sec']:.2f} ev/s "
	f"({nd['overall_ev_per_bar']:.1f} ev/bar)")
	for nm, d in nd['per_voice'].items():
	p(f"│ {nm:<12} {d['ev_per_sec']:>6.2f} ev/s {d['ev_per_bar']:>5.1f} ev/bar "
	f"({d['events']} events)")
	# durations
	dh = m['duration_histogram']
	p(f"├ duration_histogram " +
	" ".join(f"{k}:{v}" for k, v in list(dh.items())[:8]) +
	(" …" if len(dh) > 8 else ""))
	# syncopation / swing
	sw = m['swing_ratio']
	p(f"├ syncopation_index {m['syncopation_index']:.3f} "
	f"(non-drum onsets off the beat)")
	p(f"├ swing_ratio declared={sw['declared']} detected={sw['detected']} "
	f"(from {sw['n_pairs']} 8th-pairs)")
	# contour
	mc = m['melodic_contour']
	if mc:
	p(f"├ melodic_contour [{mc['voice']}] "
	f"up={mc['pct_up']:.0%} down={mc['pct_down']:.0%} rep={mc['pct_repeat']:.0%} "
	f"mean_leap={mc['mean_leap_semitones']}st "
	f"range={mc['range']} ({mc['range_span']}st)")
	p(f"│ phrase shapes: {' '.join(mc['phrase_shapes'])}")
	# harmony
	hr = m['harmonic_rhythm']
	ch = hr['chords_per_bar']
	p(f"├ harmonic_rhythm {hr['changes_per_8bars']} changes/8bars "
	f"({hr['n_distinct']} distinct chords)")
	p(f"│ per-bar: {' '.join(ch[:16])}" + (" …" if len(ch)>16 else ""))
	# drums
	dg = m['drum_grid']
	if dg:
	p(f"├ drum_grid [{dg['voice']}] "
	f"backbeat={'yes' if dg['backbeat_present'] else 'no'} "
	f"({dg['backbeat_bars']} bars) "
	f"{dg['distinct_patterns']} distinct pattern(s)")
	for i, g in enumerate(dg['patterns'][:4], 1):
	p(f"│ bar {i:<2} {g}")
	if len(dg['patterns']) > 4: p(f"│ … ({len(dg['patterns'])-4} more)")
	else:
	p(f"├ drum_grid (no drums voice)")
	# phrase structure
	ps = m['phrase_structure']
	if ps:
	p(f"├ phrase_structure bars: {ps['bar_labels']}")
	p(f"│ form (4-bar): {ps['form']}")
	# voice motion
	vm = m['voice_motion']
	if vm:
	p(f"└ voice_motion {vm['vs']} "
	f"parallel={vm['pct_parallel']:.0%} contrary={vm['pct_contrary']:.0%} "
	f"oblique={vm['pct_oblique']:.0%} (n={vm['n_samples']})")
	else:
	p(f"└ voice_motion (need lead + harmony/bass)")

	# ═════════════════════════════════════════════════════════════ MODE 2 ═══
	def corpus_compare(corpus_dir: str, target_file: str):
	files = sorted(os.path.join(corpus_dir, f)
	for f in os.listdir(corpus_dir) if f.endswith('.pfm'))
	if not files:
	print(f"no .pfm files in {corpus_dir}"); return
	corpus = []
	for f in files:
	try:
	with open(f) as fh:
	corpus.append((os.path.basename(f), analyze(parse_pfm(fh.read()))))
	except Exception as e:
	print(f" (skip {f}: {e})", file=sys.stderr)
	with open(target_file) as fh:
	tgt = analyze(parse_pfm(fh.read()))

	print(f"══ CORPUS COMPARISON")
	print(f" corpus: {corpus_dir} ({len(corpus)} piece(s): "
	f"{', '.join(n for n,_ in corpus)})")
	print(f" target: {target_file} «{tgt['title'] or 'untitled'}»")
	print("")
	W = (20, 9, 24, 10)
	hdr = f"{'metric':<{W[0]}} \| {'song':>{W[1]}} \| {'corpus min-med-max':<{W[2]}} \| verdict"
	print(hdr)
	print('-' * len(hdr))

	def mmm(vals):
	vals = [v for v in vals if v is not None]
	if not vals: return None
	return (min(vals), statistics.median(vals), max(vals))

	for label, getter, fmt in SCALARS:
	try: sv = getter(tgt)
	except Exception: sv = None
	cvals = []
	for _, cm in corpus:
	try: cvals.append(getter(cm))
	except Exception: cvals.append(None)
	stat = mmm(cvals)
	if sv is None:
	sstr = 'n/a'
	else:
	sstr = fmt.format(sv)
	if stat is None:
	cstr, verdict = 'n/a', ''
	else:
	lo, med, hi = stat
	cstr = f"{fmt.format(lo)} - {fmt.format(med)} - {fmt.format(hi)}"
	if sv is None:
	verdict = '⚠ MISSING'
	elif sv < lo:
	verdict = '⚠ BELOW'
	elif sv > hi:
	verdict = '⚠ ABOVE'
	else:
	verdict = '✓ ok'
	print(f"{label:<{W[0]}} \| {sstr:>{W[1]}} \| {cstr:<{W[2]}} \| {verdict}")

	for label, getter in BOOLS:
	sv = bool(getter(tgt))
	cvs = [bool(getter(cm)) for _, cm in corpus]
	yes = sum(1 for x in cvs if x)
	cstr = f"{'yes' if yes==len(cvs) else 'no' if yes==0 else 'mixed'} ({yes}/{len(cvs)})"
	if yes == len(cvs) and not sv:
	verdict = '⚠ MISSING'
	elif yes == 0 and sv:
	verdict = '⚠ EXTRA'
	else:
	verdict = '✓ ok'
	print(f"{label:<{W[0]}} \| {('yes' if sv else 'no'):>{W[1]}} \| "
	f"{cstr:<{W[2]}} \| {verdict}")

	# ═══════════════════════════════════════════════════════════════ main ═══
	def main(argv=None) -> int:
	ap = argparse.ArgumentParser(description="Analyze PFM musical metrics")
	ap.add_argument('file', nargs='?')
	ap.add_argument('--json', action='store_true')
	ap.add_argument('--corpus', metavar='DIR')
	ap.add_argument('--compare', metavar='FILE')
	args = ap.parse_args(argv)

	if args.corpus and args.compare:
	corpus_compare(args.corpus, args.compare)
	return 0

	if not args.file:
	ap.error("need FILE (mode 1) or --corpus DIR --compare FILE (mode 2)")

	with open(args.file) as f:
	song = parse_pfm(f.read())
	m = analyze(song)
	if args.json:
	print(json.dumps(m, indent=2, default=str))
	else:
	print_human(m)
	return 0

	if __name__ == '__main__':
	sys.exit(main())
piece	bpm	density (ev/s)	sync	harm-chg/8b	backbeat	signature move
tetris-a (Tanaka '89)	150	15.39	0.32	7.0	yes	Relentless octave-pump 8th bass under a folk melody
smb-overworld (Kondo '85)	150	17.19	0.63	7.2	yes	Pushed-16th calypso syncopation + oom-pah root-fifth bass
smb-underground (Kondo '85)	100	4.58	0.52	1.3	no	Six stabs then 2.5 beats of silence — rest IS the groove
zelda-overworld (Kondo '86)	130	13.47	0.36	7.0	yes	Dotted-8th+16th gallop + triplet brass fanfares; triangle counter-melody
metroid-brinstar (Tanaka '86)	130	10.83	0.33	4.7	no	Arp-macro 8th ostinato + triangle-as-lead = ambient but dense
megaman2-wily1 (Tateishi '88)	170	33.29	0.74	7.2	yes	Dotted-8th echo voice (3/16 delay) + unbroken 16th-note bass engine
kirby-greengreens (Ishikawa '92)	140	12.91	0.25	6.0	yes	Call-and-response between pulse1 and pulse2 over walking bass
drmario-fever (Tanaka '90)	150	17.03	0.51	5.0	yes	Chromatic approach-tone funk bass + swung ghost-snare go-go
piece	rest%	longest run	notes
smb-overworld	44%	0.62 bars	the model: anchor + gap + walk
smb-underground	92%	0.12 bars	almost all space
others	0%	8–12 bars	but pieces are only 8–12 bars total
ambient v2.0	0%	16 bars	relentless
ambient v2.1	36%	0.5 bars	root-anchor · rest · approach
Section	Function	Typical Harmony	Feeling
Verse	Establish character's world	I – V/I – IV – I diatonic, often with a pedal tone	Contained, conversational
Pre-chorus	Tension / yearning	ii → ii/♯4 → V or IV → V/V → V — rising bass line	"Reaching upward"
Chorus	Emotional release	I → V → vi → IV (or IV → V → I) — big open voicings	Arrival, declaration
Landing	Feeling	Who Does It
1̂ (tonic)	Complete, triumphant, certain	Menken, Lopez, Miranda
3̂ (mediant)	Bittersweet, reflective, open	Randy Newman, Giacchino
5̂ (dominant)	Hopeful, "to be continued"	Giacchino (score cues), Menken (mid-song)
Cadence	Roman	In C	Feeling	Use For
Authentic	V→I	G→C	Definitive, triumphant	Victory, boss defeat
Plagal	IV→I	F→C	Warm, benediction	Level complete, save point
♭VII→I	♭VII→I	B♭→C	Heroic, folk, modal	Quest complete, overworld
♭VI→♭VII→I	♭VI→♭VII→I	A♭→B♭→C	Anthemic, ascending	Final boss, credits
Deceptive	V→vi	G→Am	Delayed, yearning	Mid-level, "not yet"
Picardy	i→I	Cm→C	Transformation, hope	Story twist, dawn scene
Lydian color	I(♯4) → I	Fmaj7♯11→F	Wonder, floating	Discovery, new area reveal
Directive	Form	Meaning
`@title`	`@title <text…>`	Free text, metadata only.
`@tempo`	`@tempo <bpm>`	Quarter-note BPM. Integer or float. Required.
`@timesig`	`@timesig <num>/<den>`	e.g. `4/4`, `3/4`, `6/8`. Den must be 1,2,4,8,16. Required.
`@key`	`@key <tonic> <mode>`	Tonic = `C`..`B` w/ optional `#`/`b`. Mode = `major`, `minor`, `dorian`, `phrygian`, `lydian`, `mixolydian`, `locrian`, `pent_major`, `pent_minor`, `blues`, `chromatic`. Required (use `chromatic` to opt out of tonality checks).
`@loop`	`@loop`	Marks the piece as a seamless loop. Validator checks the loop seam; renderer honours `--loops N`.
Field	Values	Default
`<name>`	identifier, e.g. `pulse1`, `tri`, `lead`, `bass`. Max 4 voices.	—
`wave`	`pulse`, `triangle`, `saw`, `noise`	— (required)
`duty`	`12.5`, `25`, `50` (percent; pulse only)	`50`
`adsr`	Attack, Decay (seconds), Sustain (0–1 level), Release (seconds).	`0.005,0.05,0.7,0.05`
`vol`	Mix level 0–1.	`0.8`
`range`	`<lo>-<hi>` scientific pitch, e.g. `C2-C6`. Validator flags notes outside.	`C1-C7`
Token	Pattern	Meaning
Note	`<Pitch>:<dur>[~][!<vol>]`	Sound a pitch for a duration.
Rest	`R:<dur>`	Silence for a duration.
Hold	`-:<dur>`	Continue the previous sounding note (tie extension). Same as `~` on the previous note but lets a tie cross a barline cleanly.
ADSR override	`{a,d,s,r}`	Applies to the next note only, then reverts to the voice default.
Directive	Form	Meaning
`@swing`	`@swing <0.5..0.75>`	Swing ratio for 8th pairs. `0.5`=straight, `0.67`=triplet swing. Renderer warps onset times; bar-sum validation is unchanged (write straight 8ths).
`@style`	`@style standard\|ambient\|drone\|energetic`	Tunes musicality-check thresholds (density floor, percussion requirement, static-harmony window).