← Experiment

P1_RC_GGL: Test strict de închidere pentru dinamica galaxiilor și lentilarea slabă (curbe de rotație + GGL)

Cadrul de gravitație medie al EFT vs. referința NFW minimală pentru materia întunecată rece (DM)

Autor: Guanglin Tu
E-mail: riniky@energyfilament.org | ORCID: 0009-0003-7659-6138
Afiliere: EFT Working Group, Shenzhen Energy Filament Science Research Co., Ltd. (China)
Versiune: v1.1 | Data: 2026-02-14

Preprint (nerecenzat) | Această versiune este destinată diseminării publice și reproductibilității și nu reprezintă versiunea finală publicată într-o revistă.

Licență: raport (CC BY-NC-ND 4.0); pachet complet de reproducere (CC BY 4.0).

Raport la nivel de publicare (Concept DOI): https://doi.org/10.5281/zenodo.18526334 Pachet complet de reproducere (Concept DOI): https://doi.org/10.5281/zenodo.18526286

0 Rezumat executiv

Acest raport este o ediție arhivistică la nivel de publicare, depusă pe Zenodo. El oferă un lanț integrat și auditabil care acoperă datele, registrul modelelor, comparația echitabilă, testarea închiderii și materialele de reproductibilitate. Anexa B (P1A) servește drept supliment de robustețe. Ea se concentrează pe teste de stres cu o «referință DM mai standard + o sistematică-cheie de lentilare», folosite pentru a evalua sensibilitatea concluziilor principale la o modelare DM mai realistă și la tratarea sistematicilor de lentilare.

Concluzii principale (patru enunțuri direct citabile; vezi secțiunea 2.4):

(1) În ajustarea curbelor de rotație (RC), familia EFT depășește semnificativ DM_RAZOR pentru toate combinațiile nucleu/prior; o îmbunătățire tipică este Δlog𝓛_RC ≈ 10^3 (vezi Tabelul S1a).
(2) În testul de închidere RC→GGL, EFT arată o transferabilitate mai puternică între sonde: intensitatea închiderii Δlog𝓛_closure (True−Perm) este semnificativ mai mare decât cea a DM_RAZOR, iar diferența este robustă la shrinkage-ul covarianței, R_min și scanările σ_int (vezi Fig. S3 și Tabelul S1b).
(3) În ajustarea comună (RC+GGL), EFT păstrează un avantaj stabil; în controlul negativ care rupe maparea partajată, acest avantaj se prăbușește, susținând interpretarea că «efectul de gravitație medie» provine din maparea partajată, nu dintr-o ajustare accidentală (vezi Fig. S4).
(4) Fără a crește substanțial dimensionalitatea, Anexa B (P1A) testează prin stres partea DM cu module de referință DM mai standard și cu un nuisance-cheie de sistematică a lentilării. Aceste îmbunătățiri nu elimină avantajul de închidere al EFT (vezi Tabelul B1 și Fig. B1).

Disponibilitatea datelor și codului: Concept DOI al raportului 10.5281/zenodo.18526334; Concept DOI al pachetului complet de reproducere 10.5281/zenodo.18526286. Etichetele corespunzătoare Anexei B (P1A) sunt run_tag=20260213_151233, closure_tag=20260213_161731 și joint_tag=20260213_195428.

1 Rezumat

Realizăm o comparație cantitativă reproductibilă a două cadre teoretice, folosind aceleași date și același protocol statistic: modelul de «corecție a gravitației medii» propus de Teoria Firului de Energie (EFT; diferită de abrevierea curentă pentru effective field theory) și un model de referință cu halou NFW de materie întunecată rece (DM_RAZOR). DM_RAZOR este ales deliberat ca «referință DM minimală»: un halou NFW cu relație c–M fixă, fără scatter de la halou la halou, care servește drept control auditabil și reproductibil. De asemenea, trebuie subliniat că această lucrare tratează EFT ca pe o parametrizare fenomenologică, de tip MOND, a unui câmp/răspuns efectiv pentru testare într-un protocol statistic unificat, nu ca pe o derivare a principiilor sale microscopice prime în cadrul acestei lucrări.

Datele constau din 2.295 de puncte de viteză din curbele de rotație SPARC (RC), preprocesate și împărțite uniform în binuri (104 galaxii, 20 de binuri RC), împreună cu densitatea de suprafață excedentară ΔΣ(R) din lentilarea slabă galaxie–galaxie KiDS-1000 (GGL) (4 binuri de masă stelară × 15 puncte R pe bin, 60 de puncte în total, folosind covarianța completă).

Executăm succesiv inferență RC-only, un test de închidere RC→GGL, inferență GGL-only și inferență comună RC+GGL, folosind audituri de consistență pentru a ne asigura că fiecare valoare numerică citată este trasabilă. Sub un registru strict de parametri și constrângeri de mapare partajată (DM: 20 de parametri log M200_bin; EFT: 20 de parametri log V0_bin + 1 log ℓ global), familia EFT depășește semnificativ DM_RAZOR în ajustarea comună: ΔlogL_total = 1155–1337 relativ la DM_RAZOR. Mai important, testul de închidere arată că posteriorul RC are putere predictivă nontrivială pentru GGL: intensitatea de închidere a EFT este ΔlogL_closure = 172–281, mai mare decât valoarea 127 a DM_RAZOR. Când gruparea RC-bin→GGL-bin este amestecată aleatoriu, semnalul de închidere se prăbușește la 6–23, confirmând că semnalul nu este un accident statistic sau un artefact de implementare. În scanările sistematice ale σ_int, R_min și shrinkage-ului covarianței, avantajul relativ al EFT rămâne pozitiv și stabil ca ordin de mărime. Pentru a răspunde preocupărilor comune că «referința DM este prea slabă» sau că «sistematicile sunt confundate cu fizica», Anexa B (P1A) oferă un test de stres al referinței DM mai standard, dar încă de dimensionalitate joasă și auditabilă, incluzând scatter ierarhic c–M + prior, un proxy de core cu un singur parametru, lentilare m și modelul combinat DM_STD. În același protocol de închidere, aceste îmbunătățiri nu elimină avantajul de închidere al EFT (vezi Tabelul B1/Fig. B1).

Cuvinte-cheie: curbe de rotație; lentilare slabă galaxie–galaxie; test de închidere; EFT; materie întunecată rece; inferență bayesiană

2 Introducere și prezentarea rezultatelor

Curbele de rotație (RC) și lentilarea slabă galaxie–galaxie (GGL) sunt două sonde gravitaționale complementare: RC constrânge potențialul dinamic și relația de accelerație radială (RAR) în planul discului, în timp ce GGL măsoară distribuția de masă proiectată și răspunsul gravitațional la scară de halou. Pentru orice teorie candidată, întrebarea-cheie nu este dacă poate ajusta separat cele două seturi de date, ci dacă le poate explica în mod consistent sub aceeași mapare între date și aceleași constrângeri partajate.

Prin urmare, această lucrare ia «testul de închidere» drept protocol statistic central: mai întâi folosește posteriorul RC-only pentru a prezice înainte GGL, apoi îl compară cu un control negativ în care maparea RC-bin→GGL-bin este permutată/amestecată. Astfel se evaluează transferabilitatea predictivă între date și se exclud semnalele false cauzate de bias de implementare sau de ajustare accidentală.

Poziționare teoretică și domeniu de aplicare: această lucrare nu încearcă să prezinte o derivare microscopică din principii prime a EFT (Teoria Firului de Energie) sau o formulare relativistă completă. În schimb, tratăm EFT ca pe o parametrizare de dimensionalitate joasă, de tip MOND, a unui câmp/răspuns efectiv (descrisă de un nucleu f(x) și de o scară globală ℓ) și îi testăm consistența între date și puterea predictivă transferabilă prin testul de închidere RC→GGL sub un registru strict de parametri.

Program de cercetare și declarație de domeniu: această lucrare face parte dintr-un program observațional P-series aflat în desfășurare. În datele existente la scară galactică, căutăm două posibile contribuții efective de fundal: (i) un «piedestal de gravitație medie» descris printr-un răspuns gravitațional mediu coarse-grained și (ii) un «piedestal stocastic/de zgomot» asociat fluctuațiilor proceselor microscopice. În această lucrare (P1), ne concentrăm numai pe primul: fără a introduce vreo ipoteză despre mecanismele microscopice de producere, folosim testul de închidere RC→GGL pentru a extrage indicații observaționale ale unui piedestal de gravitație medie și pentru a-l compara cu o referință DM auditabilă în cadrul unui protocol de control unificat. Ca imagine fizică euristică, dacă există grade de libertate cu viață scurtă, dezintegrarea/ani­hilarea lor poate converti masa de repaus în energie-impuls purtată de alte grade de libertate, ceea ce corespunde natural, la nivel efectiv, unei descompuneri «contribuție medie + contribuție de fluctuație»; această lucrare însă nu modelează cantitativ această imagine microscopică.

Pentru a evita suprainterpretarea, limitele domeniului acestei lucrări sunt următoarele:
• Ce face această lucrare: sub constrângeri stricte de registru de parametri și mapare partajată, folosește testarea de închidere pentru a măsura transferabilitatea predictivă între date și realizează o comparație reproductibilă între răspunsul de gravitație medie EFT și o referință DM.
• Ce nu face această lucrare: nu discută mecanisme microscopice de producere, abundențe/durate de viață sau constrângeri cosmologice; nu modelează termenul stocastic corespunzător «piedestalului de zgomot».
• Ce nu pretinde această lucrare: nu urmărește să răstoarne materia întunecată; P1 nu livrează un verdict final privind existența unui «piedestal», ci raportează dovezi la nivel de etapă — că, în domeniul robust de măsurare selectat aici, datele favorizează modele care includ un răspuns gravitațional mediu.

În același timp, clarificăm că DM_RAZOR reprezintă doar o referință NFW minimală și auditabilă (c–M fix și fără scatter; fără contracție adiabatică, core de feedback, nesfericitate sau termeni de mediu). Prin urmare, concluzia principală a corpului textului este strict limitată la următorul enunț: sub referința minimală și sub constrângeri stricte de registru de parametri/mapare, EFT arată o consistență mai puternică între date. Pentru a aborda întrebarea comună dacă o referință ΛCDM mai standard și modelarea sistematicilor-cheie de lentilare ar modifica substanțial concluzia, colectăm îmbunătățiri DM mai standard, dar încă de dimensionalitate joasă și auditabile, plus un nuisance pe partea de lentilare, în Anexa B (P1A: test de stres pentru standardizarea referinței DM), păstrând exact aceeași mapare partajată și același protocol de test de închidere ca în textul principal (vezi Tabelul B1/Fig. B1).

2.1 Tab S1a–S1b: rezumatul indicatorilor-cheie (strict)

Tabelul S1a raportează principalii indicatori de comparație pentru ajustarea comună (RC+GGL): logL, ΔlogL, AICc și BIC. Tabelul S1b raportează indicatorii testului de închidere și ai scanărilor de robustețe: închidere, control negativ shuffle și intervalele de scanare σ_int / R_min / cov-shrink. Toate valorile provin din tabelul strict de sinteză master Tab_Z1_master_summary și pot fi urmărite element cu element în pachetul arhivei de publicare.

Tabelul S1a | Indicatori principali ai comparației prin ajustare comună (RC+GGL, strict).

Model (spațiu de lucru)

Nucleu W

k

logL_total comun (cel mai bun)

ΔlogL_total vs DM

AICc

BIC

DM_RAZOR

none

20

-16927.763

0.0

33895.885

34010.811

EFT_BIN

none

21

-15590.552

1337.21

31223.501

31344.155

EFT_WEXP

exponential

21

-15668.83

1258.932

31380.057

31500.711

EFT_WYUK

yukawa

21

-15772.936

1154.827

31588.268

31708.922

EFT_WPOW

powerlaw_tail

21

-15633.321

1294.442

31309.038

31429.692

Tabelul S1b | Indicatori de închidere și robustețe (strict).

Model (spațiu de lucru)

ΔlogL de închidere (true-perm)

ΔlogL după shuffle în control negativ

Interval ΔlogL scanare σ_int

Interval ΔlogL scanare R_min

Interval ΔlogL scanare cov-shrink

DM_RAZOR

126.678

22.725

EFT_BIN

231.611

14.984

459–1548

1243–1289

1337–1351

EFT_WEXP

171.977

6.04

408–1471

1169–1207

1259–1277

EFT_WYUK

179.808

14.688

380–1341

1065–1099

1155–1166

EFT_WPOW

280.513

6.672

457–1500

1203–1247

1294–1308


2.2 Fig. S3: intensitatea închiderii (RC-only → GGL prezis)

Intensitatea închiderii este definită ca ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩: pe eșantioane posterioare RC-only, GGL este prezis înainte și comparat cu un control negativ în care maparea RC-bin→GGL-bin este permutată.

Fig. S3 | Intensitatea închiderii (mai mare este mai bine): avantajul mediu de log-verosimilitate al predicției RC-only → GGL.


2.3 Fig. S4: comparația principală a ajustării comune (RC+GGL)

Avantajul ajustării comune este definit ca ΔlogL_total ≡ logL_total(model) − logL_total(DM_RAZOR). Cu aceleași date, aceeași mapare și aproape aceeași scară a parametrilor, familia EFT obține o log-verosimilitate comună semnificativ mai mare.

Fig. S4 | Avantajul ajustării comune (mai mare este mai bine): cel mai bun logL_total pentru RC+GGL relativ la DM_RAZOR.


2.4 Patru concluzii (direct citabile)

(1) Într-o analiză comună unificată a curbelor de rotație SPARC și a lentilării slabe KiDS-1000, modelul cadrului de gravitație medie EFT depășește sistematic DM_RAZOR sub un protocol strict de control: ΔlogL_total = 1155–1337 relativ la DM_RAZOR.

(2) Testul de închidere RC→GGL arată o consistență predictivă mai puternică pentru EFT: ΔlogL_closure = 172–281, comparativ cu 127 pentru DM_RAZOR. Când gruparea RC-bin→GGL-bin este amestecată aleatoriu, semnalul de închidere se prăbușește la 6–23, indicând că semnalul depinde de maparea corectă între date, nu de ajustare accidentală.

(3) Scanările sistematice ale σ_int, R_min și shrinkage-ului covarianței nu modifică semnul sau scara afirmației «EFT depășește DM_RAZOR», indicând că această concluzie este robustă la perturbații sistematice obișnuite.

(4) Sub același protocol de închidere, Anexa B (P1A) întărește referința DM într-un mod «standardizat și auditabil»: păstrează trei îmbunătățiri cu un singur parametru (SCAT/AC/FB) și adaugă scatter ierarhic c–M + prior, un proxy de core cu un parametru și calibrarea de forfecare m pe partea de lentilare (precum și modelul lor combinat DM_STD). Rezultatele arată că numai ramura feedback/core aduce o mică îmbunătățire netă a intensității închiderii (122,21→129,45, ΔΔlogL_closure≈+7,25); celelalte îmbunătățiri contribuie nesemnificativ sau negativ la intensitatea închiderii. Prin urmare, concluzia principală nu depinde de faptul că DM_RAZOR ar fi o referință excesiv de slabă.

3 Date și preprocesare

Acest studiu folosește două seturi de date publice. În fluxul de lucru ingineresc, descărcarea, verificarea checksum (sha256) și preprocesarea sunt realizate cu scripturi trasabile. Pentru a asigura o comparație echitabilă între modele, toate spațiile de lucru (EFT_BIN / EFT_WEXP / EFT_WYUK / EFT_WPOW / DM_RAZOR) folosesc exact aceleași produse de date și mapări pe binuri.


3.1 Curbe de rotație (RC, SPARC)

Datele RC provin din fișierele Rotmod_LTG ale bazei de date SPARC (175 de fișiere rotmod). După preprocesare, eșantionul de modelare include 104 galaxii și 2.295 de puncte de date (r, V_obs), împărțite în 20 de binuri RC în funcție de masa stelară și criterii conexe. Fiecare punct de date conține raza r (kpc), viteza observată V_obs (km/s), eroarea observațională σ_obs și vitezele componentelor gaz/disc/bulb (V_gas, V_disk, V_bul).


3.2 Lentilare slabă (GGL, KiDS-1000 / Brouwer+2021)

Datele GGL folosesc densitatea de suprafață excedentară ΔΣ(R) din Fig. 3 a lui Brouwer et al. (2021), bazată pe KiDS-1000 (4 binuri de masă stelară, 15 puncte R pe bin), împreună cu covarianța completă furnizată. În fluxul de lucru ingineresc, covarianța originală în format long-form este reconstruită într-o matrice 15×15 pentru fiecare bin, iar auditurile Stage-B verifică rezonabilitatea dimensională și numerică.


3.3 Maparea RC-bin → GGL-bin și dimensiunea totală a eșantionului

Cele 4 binuri de masă GGL și cele 20 de binuri RC sunt conectate printr-o mapare fixă: fiecare bin GGL corespunde la 5 binuri RC, iar contribuțiile RC-bin sunt ponderate cu numărul de galaxii. Această mapare rămâne fixă în toate modelele și este constrângerea centrală pentru comparația echitabilă în testarea închiderii și ajustarea comună. Setul final comun de date conține n_total = 2355 puncte (RC=2295, GGL=60).

4 Modele și metode statistice


4.1 Specificație matematică minimală pentru EFT și DM (auditabilă/testabilă)

Această secțiune oferă specificația matematică minimală care corespunde direct implementării.

(a) Modelul curbelor de rotație (RC)

Pentru fiecare punct de date RC (r, V_obs, σ_obs), folosim suprapunerea componentelor: V_mod²(r) = V_bar²(r) + V_extra²(r). Aici V_bar²(r) = V_gas²(r) + Υ_d·V_disk²(r) + Υ_b·V_bul²(r). Rezultatele principale din această lucrare adoptă Υ_d = Υ_b = 0,5, în acord cu recomandările empirice SPARC și util pentru reducerea gradelor de libertate inutile.

(b) Corecția de gravitație medie EFT (EFT)

Termenul suplimentar EFT este parametrizat sub forma «vitezei medii la pătrat»: V_extra²(r) = V0_bin² · f(r/ℓ). Aici V0_bin este parametrul de amplitudine pentru fiecare bin RC (20 de parametri), ℓ este o scară globală (1 parametru), iar f(x) este o funcție adimensională de formă a nucleului. Formele de nucleu comparate în această lucrare (niciuna nu introduce grade de libertate continue suplimentare) sunt:

Motivație fizică (extinsă): EFT interpretează răspunsul gravitațional suplimentar la scări galactice ca pe un răspuns efectiv obținut prin coarse-graining/mediere pe scară a unor acțiuni mai microscopice pe scări finite. În această lucrare nu presupunem niciun mecanism microscopic specific; în schimb, folosim o parametrizare minimală și auditabilă pentru comparație și testare controlată într-un protocol statistic unificat.

Pentru intuiție, termenul suplimentar poate fi scris în formă de accelerație: a_extra(r)=V_extra²(r)/r=(V0_bin²/r)·f(r/ℓ). Când r≫ℓ, f→1 și V_extra→V0_bin, producând o contribuție suplimentară de viteză aproximativ plată în regiunea externă. Când r≪ℓ și f(x)≈x, poate fi introdusă o scară caracteristică de accelerație a0,bin≈V0_bin²/ℓ (până la un factor O(1) al funcției-nucleu), oferind o intuiție de tip MOND pentru scara tranziției interior–exterior.

Familia discretă de nuclee folosită aici (none/exponential/yukawa/powerlaw_tail) poate fi privită ca un set de proxy-uri de dimensionalitate joasă pentru diferite «pante inițiale / viteze de tranziție / cozi de lungă rază» (de exemplu, ecranare de tip Yukawa versus un răspuns cu coadă mai lungă). Ele sunt folosite pentru testare de robustețe, nu pentru a epuiza spațiul modelelor. În componenta de lentilare slabă, construim din V_avg(r) o masă și o densitate efectivă a învelișului, apoi le proiectăm pentru a obține ΔΣ(R). Această densitate efectivă trebuie înțeleasă ca o descriere efectivă a potențialului de lentilare sub ipotezele simetriei sferice și ale mapării în câmp slab (detaliile complete sunt mutate în Anexa A).

Toate formele de nucleu de mai sus satisfac f(x)→1 când x→∞ (adică saturația V_extra²→V0²), în timp ce dau creștere liniară sau subliniară pentru x≪1: de exemplu, exponential: f≈x; yukawa: f≈0,5x; powerlaw_tail: f≈0,5x. Prin urmare, diferitele forme de nucleu au diferențe observabile în «panta inițială» la raze mici, viteza de tranziție și coada externă și pot fi distinse prin testele comune RC+GGL și de închidere.

Predicția EFT pentru lentilarea slabă ΔΣ(R) este obținută prin inferarea masei și densității învelișului din V_avg(r), urmată de integrale de proiecție: M_enc(r)=r·V_avg²(r)/G, ρ(r)=(1/4πr²)·dM_enc/dr, Σ(R)=2∫_R^∞ ρ(r)·r/√(r²−R²) dr și ΔΣ(R)=Σ̄(<R)−Σ(R). Implementarea numerică folosește o grilă logaritmică și o rafinează adaptiv în cazuri excepționale pentru a asigura stabilitatea și reproductibilitatea.

(c) DM_RAZOR: referința de halou NFW pentru materia întunecată rece

În același timp, clarificăm că DM_RAZOR reprezintă numai o referință NFW minimală și auditabilă (c–M fix și fără scatter; fără contracție adiabatică, core de feedback, nesfericitate sau termeni de mediu). Pentru a reduce riscul unei «referințe strawman», această lucrare nu pretinde că asemenea efecte nu există. În schimb, le încorporează în Anexa B (P1A) ca teste de stres de dimensionalitate joasă și auditabile, incluzând tratarea ierarhică a scatter-ului c–M, un proxy de core și un nuisance de calibrare a forfecării pe partea de lentilare.


4.2 Registrul modelelor și comparația echitabilă (parametri partajați = definiția închiderii)

Numărul de parametri din setul principal de comparație este: DM_RAZOR k=20; familia EFT k=21 (parametrul suplimentar este log ℓ global). Toate modelele partajează aceleași date RC, aceleași date GGL și covarianță, aceeași mapare RC-bin→GGL-bin, aceiași termeni barionici și aceleași conversii de unități. În plus, forma nucleului (none / exponential / yukawa / powerlaw_tail) este o alegere discretă și nu introduce niciun parametru continuu suplimentar, împiedicând obținerea unui avantaj prin «încă un grad de libertate».


4.3 Verosimilitate, priori și sampler

Verosimilitatea RC este gaussiană diagonală: σ_eff² = σ_obs² + σ_int². Rezultatele principale fixează σ_int=5 km/s, iar Run-5 scanează σ_int. Verosimilitatea GGL folosește o gaussiană cu covarianță completă pentru fiecare bin: logL_GGL = Σ_b log 𝒩(ΔΣ_obs^b | ΔΣ_mod^b, C_b). Obiectivul comun este logpost(θ)=logprior(θ)+logL_RC(θ)+logL_GGL(θ). Prioriile codifică în principal limite fizic fezabile (constrângeri de interval pentru log ℓ, log V0 și log M200); când Υ și σ_int libere sunt activate, se folosesc priori slab informative (vezi implementarea și configurația pachetului de publicare pentru detalii).

Samplerul folosește o plimbare aleatoare Metropolis pe blocuri adaptive: fiecare pas actualizează doar un sub-bloc aleatoriu al spațiului parametrilor pentru a îmbunătăți rata de acceptare în dimensiuni înalte, iar mărimea pasului este adaptată ușor prin rata de acceptare pe ferestre (rata-țintă de acceptare este aproximativ 0,25). Rezultatele principale folosesc modul rapid (setări precum n_steps=800), iar fiecare spațiu de lucru produce trase, reziduuri și grafice PPC pentru audituri manuale și scriptate.


4.4 Testul de închidere și controlul negativ (definiție)

Testul de închidere (Run-2) verifică dacă posteriorul RC-only poate prezice GGL fără reajustarea GGL. Mai precis, generează înainte ΔΣ(R) pentru 4 binuri GGL din eșantioane posterioare RC-only și calculează logL_true cu covarianța completă; apoi permută aleatoriu maparea de grup RC-bin→GGL-bin pentru a obține logL_perm. Intensitatea închiderii este definită ca ΔlogL_closure≡⟨logL_true⟩−⟨logL_perm⟩. În plus, Run-10 regrupează aleatoriu cele 20 de binuri RC în 4×5 (shuffle) și recalculează închiderea, testând cât de puternic depinde semnalul de închidere de maparea corectă.

5 Rezultate principale și interpretare


5.1 Rezultatele principale ale ajustării comune (RC+GGL)

Cel mai bun logL_total din ajustarea comună și avantajul relativ ΔlogL_total (relativ la DM_RAZOR) sunt prezentate în Tabelul S1a și Fig. S4. În setul principal de comparație, EFT_BIN are cel mai mare avantaj comun (ΔlogL_total=1337,210), în timp ce celelalte forme de nucleu EFT păstrează și ele avantaje semnificative (1154,827–1294,442). Conform criteriilor informaționale (AICc/BIC), familia EFT depășește de asemenea semnificativ DM_RAZOR, indicând că avantajul nu provine din biasul numărului de parametri.

Notă: principala contribuție la ΔlogL_total≈1337 provine din termenul RC (ΔlogL_RC≈1065 în descompunerea comună, aproximativ 80%). Aceasta poate fi înțeleasă ca o îmbunătățire modestă, de circa Δχ²≈0,90 pe punct, de-a lungul celor N=2295 puncte de date RC, care se acumulează natural la un avantaj de ordinul 10^3 sub o verosimilitate gaussiană diagonală. În același timp, GGL și testul de închidere oferă constrângeri independente între seturi de date, iar ierarhia rămâne stabilă sub testele de stres σ_int, R_min și cov-shrink (vezi secțiunea 6 și Tabelul S1b).


5.2 Rezultatele testului de închidere (RC-only → GGL)

Cantitatea-cheie a testului de închidere, ΔlogL_closure, este raportată în Tabelul S1b și Fig. S3. Familia EFT are intensități de închidere de 171,977–280,513, mai mari decât valoarea 126,678 a DM_RAZOR. Aceasta înseamnă că, fără a permite grade de libertate suplimentare între date, eșantioanele posterioare obținute de EFT din datele RC au o putere predictivă transferabilă mai puternică pentru datele GGL.

Controlul negativ susține suplimentar relevanța fizică a semnalului de închidere: când gruparea RC-bin→GGL-bin este amestecată aleatoriu, intensitatea de închidere a EFT scade la 6–15 (cu mici diferențe între nuclee), în timp ce intensitatea de închidere de bază este de 172–281. Această «prăbușire a semnalului» exclude avantaje false cauzate de implementare numerică, erori de unități sau tratarea necorespunzătoare a covarianței.

Fig. R1 | Control negativ: după gruparea shuffle, semnalul de închidere scade semnificativ (reprezentat din indicatorii Tab_Z1).


5.3 Semnificația și limitele rezultatelor

Concluzia acestui studiu este că «sub acest set de date și acest protocol, corecția de gravitație medie EFT depășește referința testată DM_RAZOR». Trebuie subliniat că partea DM folosește doar o referință NFW minimală cu relație c(M) fixă, fără formare de core, nesfericitate, termeni de mediu sau modele mai complexe de conexiune galaxie–halou. Prin urmare, acest manuscris nu pretinde să excludă toate familiile de modele DM. În schimb, oferă o referință de control reproductibilă, centrată pe testul de închidere, pentru a evalua dacă RC și GGL pot fi explicate consistent prin aceiași parametri și aceeași mapare între date.

Pentru a aborda această preocupare comună, am finalizat un proiect de extensie independent, P1A (vezi Anexa B). Fără a modifica maparea partajată RC-bin→GGL-bin sau cadrul de audit, acesta întărește referința DM într-un mod «standardizat și auditabil»: dincolo de trei îmbunătățiri cu un parametru (SCAT/AC/FB), adaugă (i) scatter ierarhic c–M + prior masă–concentrație (DM_HIER_CMSCAT), (ii) un proxy de core de feedback barionic cu un singur parametru (DM_CORE1P) și (iii) un nuisance de calibrare a forfecării pe partea de lentilare slabă m (DM_RAZOR_M), și raportează un model combinat DM_STD; EFT_BIN este păstrat ca referință de control.

• DM_RAZOR_SCAT (scatter c–M) — introduce parametrul de scatter al concentrației de la halou la halou σ_logc pentru a testa dacă un c(M) fix subestimează sistematic puterea explicativă a DM;
• DM_RAZOR_AC (contracție adiabatică) — folosește un singur parametru α_AC pentru a interpola continuu între «fără contracție» și «contracție standard», captând la cost minim tendința barionilor de a contracta haloul interior;
• DM_RAZOR_FB (feedback/core) — folosește o scară de core (de exemplu, log r_core) pentru a descrie cum formarea unui core interior suprimă curbele de rotație, menținând totodată aproximația NFW la scări de lentilare slabă.

Scoreboard-ul cantitativ P1A este oferit în Anexa B, Tabelul B1 / Fig. B1 (generat automat din Tab_S1_P1A_scoreboard). În indicatorul de închidere, DM_RAZOR_FB oferă o mică îmbunătățire netă (122,21→129,45, +7,25), în timp ce celelalte îmbunătățiri contribuie nesemnificativ sau negativ la intensitatea închiderii. Pe partea ajustării comune, adăugarea unui prior ierarhic de scatter c–M (DM_HIER_CMSCAT) sau a modelului combinat (DM_STD) poate îmbunătăți substanțial logL comun, dar nu îmbunătățește intensitatea închiderii, sugerând că adaugă în principal flexibilitate pentru ajustarea comună, nu transferabilitate între sonde. Prin urmare, concluzia centrală a textului principal trebuie citită astfel: sub constrângeri stricte de mapare partajată și test de închidere, avantajul de consistență între date al EFT nu provine din alegerea unei «referințe prea slabe» pe partea DM. Pachetul de publicare P1A corespunzător Anexei B (tabele/figuri suplimentare și full_fit_runpack) va fi inclus ca fișiere suplimentare sub același Concept DOI Zenodo ca full_fit_runpack pentru această lucrare: https://doi.org/10.5281/zenodo.18526286.

6 Experimente de robustețe și control


6.1 Scanarea σ_int (Run-5)

Scanăm sistematic scatter-ul intrinsec RC σ_int și repetăm inferența comună la fiecare σ_int, calculând ΔlogL_total relativ la DM_RAZOR. Valorile minimă/maximă ale ΔlogL_total pentru fiecare model de-a lungul intervalului scanat sunt raportate în Tabelul S1b.

Fig. R2 | Intervalul ΔlogL_total în scanarea σ_int (mai mare este mai bine).


6.2 Scanarea R_min (Run-6)

Pentru a testa impactul sistematicilor din datele regiunii centrale (precum mișcarea necirculară, rezoluția și modelarea barionică insuficientă), aplicăm tăieri cu prag R_min asupra RC și repetăm inferența comună. Avantajul familiei EFT rămâne pozitiv și stabil ca scară în scanarea R_min.

Fig. R3 | Intervalul ΔlogL_total în scanarea R_min (mai mare este mai bine).


6.3 Scanarea cov-shrink (Run-7)

Pentru a testa incertitudinea covarianței GGL, aplicăm shrinkage matricei de covarianță a fiecărui bin de masă: C_α=(1−α)C+α·diag(C), și scanăm α. Rezultatele arată că avantajul familiei EFT este insensibil la această tratare.

Fig. R4 | Intervalul ΔlogL_total în scanarea cov-shrink (mai mare este mai bine).


6.4 Scara de ablație (Run-8)

În cadrul EFT_BIN, efectuăm ablații imbricate: de la un model minimal (fără parametri liberi), la versiuni care păstrează doar un număr mic de grade de libertate, și în final la modelul complet cu amplitudine pe 20 de binuri + scară globală. AICc/BIC arată că modelul complet EFT_BIN este cerut puternic de date.

Fig. R5 | Scara de ablație EFT_BIN (AICc; mai mic este mai bine).


6.5 Predicție holdout (Run-9)

Executăm suplimentar un test leave-one-bin-out (LOO): dintre cele 4 binuri de masă GGL, câte un bin este lăsat pe dinafară de fiecare dată; inferența este refăcută folosind binurile rămase (și toate datele RC), iar log-verosimilitatea de test este apoi evaluată pe binul reținut. Indicatorii de sinteză sunt dați în tabelul suplimentar Tab_R3_leave_one_bin_out (un produs Run-9; tiparele căilor de fișier sunt listate în lista produselor-cheie din secțiunea 8.2). Familia EFT rămâne clar superioară lui DM_RAZOR chiar și în cel mai slab caz holdout.

Fig. R6 | LOO: distribuția log-verosimilității pentru binul reținut (din produsele Run-9).


6.6 Control negativ: shuffle al binurilor RC (Run-10)

Run-10 regrupează aleatoriu cele 20 de binuri RC în 4×5 și recalculează închiderea, păstrând posteriorul RC-only neschimbat. Rezultatele arată că, față de maparea originală, shuffle-ul reduce semnificativ atât media logL_true a închiderii, cât și ΔlogL_closure (vezi Tabelul S1b și Fig. R1), susținând suplimentar interpretabilitatea semnalului de închidere.

Fig. R7 | Control negativ: maparea shuffle produce o scădere clară a mediei logL_true a închiderii (din produsele Run-10).

7 Trasabilitate și audit de consistență (proveniență)

Toate valorile numerice citate în această lucrare pot fi urmărite element cu element în tabelele stricte de sinteză și în înregistrările de audit ale arhivei de publicare. Pentru a păstra textul principal mai lizibil, lanțul complet de proveniență (lista de etichete, tabelele de audit, lista checksum și metoda de verificare) a fost mutat în Anexa A.

8 Reproductibilitate și arhiva Zenodo

Declarație privind disponibilitatea datelor și codului: datele SPARC privind curbele de rotație și datele KiDS-1000 privind lentilarea slabă folosite în această lucrare sunt seturi de date publice. Raportul la nivel de publicare a fost arhivat pe Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526334), iar pachetul complet de reproducere a fost arhivat pe Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526286). Pașii detaliați de execuție, mediul de dependențe, inventarul arhivei și informațiile de verificare hash sunt oferite în Anexa A; proiectarea, etichetele de rulare și ieșirile testului de stres pentru standardizarea referinței DM (P1A) sunt oferite în Anexa B.

Sub același Concept DOI al pachetului complet de reproducere (https://doi.org/10.5281/zenodo.18526286), oferim două puncte de intrare reproductibile, în funcție de caz de utilizare: • full_fit_runpack P1 (text principal): reproduce analizele RC-only / închidere / comună și scanările de robustețe pentru EFT vs DM_RAZOR și generează materialele textului principal, inclusiv Tabelele S1a/S1b și Fig. S3/S4; • full_fit_runpack P1A (Anexa B): reproduce testul de stres pentru standardizarea referinței DM (SCAT/AC/FB + prior ierarhic de scatter c–M + core1p + lentilare m + DM_STD, inclusiv controlul EFT_BIN) și generează Tabelul B1 și Fig. B1 din anexă. Tabelele/figurile suplimentare P1A și full_fit_runpack vor fi incluse ca fișiere suplimentare sub același Concept DOI pentru a menține un singur punct de intrare arhivistic.

9 Mulțumiri și declarații


9.1 Mulțumiri

Mulțumim echipelor SPARC și KiDS-1000 pentru furnizarea datelor publice și a documentației, precum și participanților la fluxul de reconstrucție și audit al acestui proiect.


9.2 Contribuțiile autorului

Guanglin Tu a fost responsabil pentru propunerea conceptuală, proiectarea studiului, implementarea inginerească, curarea datelor, analiza formală, implementarea și auditul fluxului de reproductibilitate și redactarea manuscrisului.


9.3 Finanțare

Autofinanțat de autor, Guanglin Tu (fără finanțare externă / fără număr de grant).


9.4 Interese concurente

Autorul, Guanglin Tu, este afiliat cu «EFT Working Group, Shenzhen Energy Filament Science Research Co., Ltd. (China)»; nu sunt declarate alte interese concurente.


9.5 Asistență AI

OpenAI GPT-5.2 Pro și Gemini 3 Pro au fost folosite pentru șlefuire lingvistică, editare structurală și organizarea fluxului de reproductibilitate. Nu au fost folosite pentru a genera sau modifica date, rezultate, figuri, tabele ori cod și nici pentru a genera citări. Autorul poartă întreaga responsabilitate pentru conținutul și acuratețea citărilor întregului manuscris.

10 Referințe

Anexa A: detalii de trasabilitate și reproductibilitate

Această anexă sintetizează informațiile de arhivare pe termen lung pentru trasabilitate și reproductibilitate, incluzând etichete de rulare, rezultate de audit, inventare de arhivă și puncte-cheie de verificare, astfel încât cititorii să poată verifica și reproduce lucrarea după necesități.


A.1 Detalii de trasabilitate și audit

Pentru a asigura trasabilitatea pe termen lung, acest proiect folosește etichete cu timestamp pentru fiecare rulare și ieșire și păstrează produsele istorice fără a le suprascrie. Valorile centrale citate în acest manuscris provin din compilația strictă (compile_tag=20260205_035929) și au trecut următoarele audituri de consistență:

• Toate tabelele la nivel de etapă poartă run_tag și etichete de etapă; scriptul de compilație strictă selectează surse canonice de tabel «complete și consistente» din report/tables.

• Valorile din Tab_Z1_master_summary și Tab_Z2_conclusion_highlights sunt comparate element cu element cu tabelele canonice selectate.

• În timpul generării PDF, se efectuează un audit al etichetelor pentru «etichetele de tabele/figuri referențiate», pentru a se asigura că produsele învechite nu sunt amestecate.

Etichete-cheie (pentru localizarea tuturor produselor intermediare): run_tag=20260204_122515; closure_tag=20260204_124721; joint_tag=20260204_152714; sigma_sweep_tag=20260204_161852; rmin_sweep_tag=20260204_195247; covshrink_tag=20260204_203219; ablation_tag=20260204_214642; LOO_tag=20260204_224827; negctrl_tag=20260204_234528; strict_compile_tag=20260205_035929; release_tag=20260205_112442.

Rezultatul auditului de consistență: Tab_AUDIT_checks_strict raportează pass=9, fail=0, skip=0 (vezi pachetul de publicare pentru detalii).


A.2 Pași de execuție pentru reproductibilitate și inventarul arhivei

Acest studiu adoptă un sistem de reproductibilitate alcătuit din «raport la nivel de publicare + supliment de tabele/figuri + pachet de rulare complet rerulabil». Cititorii pot consulta direct Tables & Figures Supplement pentru a verifica toate materialele de tabel/figură citate în lucrare; pentru a reproduce de la zero valorile numerice și lanțul de audit, pot folosi full_fit_runpack pentru a descărca datele și a rerula întregul flux. După finalizare, scriptul de comparație cu tabele de referință încorporat în pachet poate fi folosit pentru a verifica consistența valorilor din tabele.


A.2.1 Pornire rapidă a reproducerii (RUN_FULL, Windows PowerShell)

Această secțiune oferă o cale de reproducere mai scurtă (Windows PowerShell). Pentru verificări rapide, cititorilor li se recomandă să consulte direct Tables & Figures Supplement și să verifice element cu element tabelele și figurile citate. Pentru reproducere end-to-end și generarea tuturor tabelelor, figurilor și produselor de audit, folosiți full_fit_runpack: urmați README/ONE_PAGE_REPRO_CHECKLIST al pachetului pentru a rula verify_checksums.ps1 și RUN_FULL.ps1 (Mode=full recomandat).

Intrare de arhivă Zenodo (Concept DOI): https://doi.org/10.5281/zenodo.18526286.
Etichetele lanțului principal pentru această lucrare: run_tag=20260204_122515; strict compile_tag=20260205_035929; release_tag=20260205_112442.


A.2.2 Materiale de arhivă și puncte-cheie de verificare (pachete și verificări)

Arhiva Zenodo oferă trei categorii complementare de materiale: (1) raport la nivel de publicare (această lucrare, v1.1; inclusiv Anexa B: testul de stres P1A pentru standardizarea referinței DM); (2) Tables & Figures Supplement (tabele și figuri suplimentare care acoperă toate materialele de tabel/figură citate în această lucrare, corespunzătoare separat P1 și P1A); și (3) full_fit_runpack (pachet complet de reproducere: descarcă datele de la zero și rerulează întregul flux, corespunzător separat P1 și P1A). Elementele (1)–(2) sprijină lectura rapidă și verificarea independentă; elementul (3) oferă reproductibilitate completă end-to-end.

Categorie de materiale

Nume fișier (exemplu)

Scop și poziționare (ordinea recomandată de utilizare)

Raport la nivel de publicare (chineză și engleză)

P1_RC_GGL_report_EN_PUBLICATION_V1_1.pdf
P1_RC_GGL_report_CN_PUBLICATION_V1_1.pdf

Raport complet arhivat pe Zenodo; textul principal oferă concluziile centrale și auditurile de robustețe, iar Anexa B oferă P1A (test de stres pentru standardizarea referinței DM).

Tables & Figures Supplement (P1)

P1_RC_GGL_supplement_figs_tables_V1_1.zip

Toate tabelele (CSV) și figurile (PNG) citate în textul principal, inclusiv scripturile de generare și fișierele cu etichete.

Tables & Figures Supplement (P1A)

P1A_supplement_figs_tables_v1.zip

Toate tabelele și figurile citate în Anexa B (P1A), inclusiv Tab_S1_P1A_scoreboard și Fig_S1_P1A_scoreboard.

full_fit_runpack (P1)

P1_RC_GGL_full_fit_runpack_v1_1.zip

Reproducere completă end-to-end: descarcă datele de la zero și rerulează RC-only/închidere/comun și scanările de robustețe.

full_fit_runpack (P1A)

P1A_RC_GGL_full_fit_runpack_v1.zip

Reproducere completă end-to-end (Anexa B): rerulează DM 7+1 + DM_STD (inclusiv controlul EFT_BIN) și generează materialele anexei; pachetul include un script de comparație cu tabel de referință pentru verificarea consistenței valorilor din tabele.

Recomandare de citare: când citați această lucrare sau materialele de reproductibilitate însoțitoare, vă rugăm să citați Concept DOI Zenodo (https://doi.org/10.5281/zenodo.18526334).

Produsele-cheie care ar trebui să apară și să fie comparabile după reproducere includ:

Anexa B: P1A — Test de stres pentru standardizarea referinței DM (DM 7+1 + DM_STD; cu control EFT)

Această anexă documentează un proiect de extensie (P1A) pentru «testarea prin stres a standardizării referinței DM», consistent cu protocolul de închidere din textul principal. Rolul său este să actualizeze referința minimală DM_RAZOR folosită în textul principal (NFW + c–M fix, fără scatter / fără contracție / fără core) într-un set de referințe DM mai apropiat de practica astrofizică și mai rezistent la critici comune, fără a introduce un număr mare de grade de libertate și fără a modifica maparea partajată RC-bin→GGL-bin sau cadrul de audit. P1A acoperă, și este un superset al, testului anterior cu trei ramuri: păstrează SCAT/AC/FB, adăugând scatter ierarhic c–M + prior, un proxy de core cu un singur parametru și un nuisance m de calibrare a forfecării pe partea de lentilare; oferă de asemenea modelul combinat DM_STD. EFT_BIN este păstrat ca referință de control.

Notă suplimentară: intensitățile de închidere și valorile conexe din Anexa B (P1A) folosesc un buget Monte Carlo mai mare (de exemplu, ndraw=400, nperm=24) decât bugetul rapid folosit în textul principal pentru a acoperi întreaga familie de nuclee EFT (de exemplu, ndraw=60, nperm=12). Prin urmare, valorile absolute pot prezenta o derivă de eșantionare de ordin O(10). Totuși, comparațiile model-la-model în cadrul aceluiași buget/tabel sunt echitabile, iar semnul și scara avantajului rămân stabile între bugete.


B.1 Scop și poziționare (de ce P1A și de ce ca anexă)

P1A nu încearcă să epuizeze toate opțiunile posibile de modelare a halo-urilor ΛCDM (precum nesfericitatea, dependența de mediu, conexiuni galaxie–halou complexe sau fizică barionică de înaltă dimensionalitate). În schimb, P1A urmează principiul «dimensionalitate joasă, auditabil, reproductibil»: fiecare modul de îmbunătățire introduce doar ≤1 parametru efectiv-cheie și rămâne supus celor trei constrângeri dure ale acestei lucrări:
(i) Registru de parametri: fiecare parametru nou trebuie înregistrat explicit și raportat împreună cu criteriile informaționale (AICc/BIC);
(ii) Mapare partajată: se folosește în continuare aceeași hartă de grupare RC-bin→GGL-bin; «ajustarea mapării» separat pentru un singur set de date nu este permisă;
(iii) Test de închidere: orice îmbunătățire trebuie să arate un câștig real în predicția de transfer RC→GGL, nu doar o ajustare RC-only mai bună.


B.2 DM 7+1 + DM_STD: definițiile modulelor, parametrii și intrarea în posteriorul comun

Ca runpack independent, P1A oferă 8 spații de lucru DM (DM 7+1) plus 1 control EFT: pornind de la DM_RAZOR ca referință, construiește trei îmbunătățiri legacy cu un parametru (DM_RAZOR_SCAT / DM_RAZOR_AC / DM_RAZOR_FB), adaugă trei module defensive mai standard (DM_HIER_CMSCAT / DM_CORE1P / DM_RAZOR_M) și apoi oferă modelul combinat DM_STD. Scopul comun al acestor module este să acopere cele mai frecvente trei critici, crescând dimensionalitatea cât mai puțin posibil: (a) cum intră scatter-ul c–M și prioriile într-un model ierarhic; (b) dacă efectul principal al feedbackului barionic poate fi captat printr-un proxy de core cu un parametru; și (c) dacă sistematicile-cheie de pe partea de lentilare pot fi confundate cu un semnal fizic.

Spațiu de lucru

dm_model

Parametru(i) nou/noi (≤1)

Motivație fizică (centrală)

Principiu de implementare (audit-friendly)

DM_RAZOR

NFW (c–M fix, fără scatter)

Referință de halou ΛCDM minimală și auditabilă; folosită pentru comparație strictă cu EFT

Mapare partajată fixă; registru strict de parametri; folosită ca baseline numai pentru comparație relativă

DM_RAZOR_SCAT

NFW + scatter c–M (legacy)

σ_logc

Relația c–M are scatter; aproximată printr-un scatter log-normal cu un parametru

≤1 parametru nou; maparea partajată păstrată; câștigul de închidere folosit ca criteriu de acceptare

DM_RAZOR_AC

NFW + contracție adiabatică (legacy)

α_AC

Infall-ul barionic poate induce contracția adiabatică a haloului; aproximată printr-o intensitate cu un parametru

≤1 parametru nou; mapare neschimbată; raportarea modificărilor AICc/BIC și a câștigului de închidere

DM_RAZOR_FB

NFW + feedback core (legacy)

log r_core

Feedbackul poate forma un core în regiunea internă; aproximat printr-o scară de core cu un parametru

≤1 parametru nou; același protocol de închidere/control negativ; îmbunătățirea RC-only nu este singura țintă

DM_HIER_CMSCAT

Scatter ierarhic c–M + prior

σ_logc (hier)

c_i∼logN(c(M_i),σ_logc) ierarhic mai standard; afectează posteriorul comun al RC și GGL

Prior explicit; c_i latent marginalizat; rămâne de dimensionalitate joasă și auditabil

DM_CORE1P

Proxy core cu 1 parametru (inspirat coreNFW/DC14)

log r_core

Folosește un proxy de core cu un parametru pentru efectul principal al feedbackului barionic, evitând detalii de formare stelară de înaltă dimensionalitate

Citează literatura standard; ≤1 parametru nou; legat de testul de închidere

DM_RAZOR_M

NFW + nuisance de calibrare a forfecării de lentilare

m_shear (GGL)

Absoarbe o sistematică-cheie de lentilare slabă ca parametru efectiv, reducând riscul de a confunda sistematicile cu fizica

Nuisance înregistrat explicit; nu poate afecta RC înapoi; rezultatele judecate în principal după robustețea închiderii

DM_STD

Referință DM standardizată (HIER_CMSCAT + CORE1P + m)

σ_logc + log r_core (+ m_shear)

Include cele trei clase cele mai comune de critică într-o referință standard totuși de dimensionalitate joasă

Registru de parametri + criterii informaționale raportate; închiderea este metrica principală; folosit ca cel mai puternic control defensiv DM

Notă: numele parametrilor de mai sus urmează implementarea inginerească (de exemplu, σ_logc, α_AC, log r_core și m_shear). Accentul de proiectare al P1A este să «facă referința DM ceva mai puternică, păstrând-o auditabilă», nu să transforme partea DM într-un ajustor de înaltă dimensionalitate imposibil de controlat. În particular, DM_HIER_CMSCAT introduce scatter c–M ierarhic: concentrația c_i a fiecărui halou primește un scatter log-normal în jurul lui c(M_i), constrâns de σ_logc global și de priorul c(M); această structură ierarhică afectează posteriorul comun atât al RC, cât și al GGL.


B.3 Protocol statistic și convenții de produse consistente cu textul principal

P1A refolosește toate produsele de date, maparea partajată și cadrul de audit din textul principal. Ordinea de execuție și convențiile de produse rămân consistente:
(1) Run‑1: inferență RC-only (produce posterior_samples.npz și metrics.json);
(2) Run‑2: test de închidere RC→GGL (produce closure_summary.json și referința permutată);
(3) Run‑3: ajustare comună RC+GGL (produce joint_summary.json).
Toate numerele citate provin din tabelul compilat automat (Tab_S1_P1A_scoreboard) și pot fi verificate după rerularea întregului flux P1A folosind scriptul de comparație cu tabelul de referință încorporat în P1A full_fit_runpack.


B.4 Rezultate principale, puncte de intrare pentru tabel/figură și plan de arhivare (același DOI)

Această secțiune oferă concluziile cantitative centrale ale P1A. Tabelul B1 sintetizează indicatorii-cheie pentru RC-only, închiderea RC→GGL și ajustarea comună RC+GGL (parantezele dau diferențele relative la referința DM_RAZOR). Intensitatea închiderii este definită ca ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩ (mai mare este mai bine). Fig. B1 vizualizează același scoreboard. Punctele principale sunt următoarele:
• Dintre cele trei ramuri legacy, doar DM_RAZOR_FB (feedback/core) dă o mică îmbunătățire netă a intensității închiderii: 122,21→129,45 (+7,25); SCAT și AC nu oferă nicio îmbunătățire netă;
• DM_HIER_CMSCAT și DM_RAZOR_M, nou adăugate, au efecte foarte mici (~0) asupra intensității închiderii, iar DM_CORE1P nu arată nici el o îmbunătățire netă semnificativă;
• Modelul combinat DM_STD poate îmbunătăți substanțial logL comun (mai aproape de optimul ajustării comune), dar intensitatea sa de închidere scade, sugerând că avantajul său provine în principal din flexibilitatea ajustării comune, nu din transferabilitatea între sonde;
• Ca element de control, EFT_BIN păstrează încă un avantaj clar atât în intensitatea închiderii, cât și în ajustarea comună. Prin urmare, concluzia principală este robustă la introducerea unei «referințe DM mai puternice + nuisance de lentilare».

Pentru comparație directă cu rezultatele textului principal, Tabelele S1a–S1b sintetizează comparația strictă dintre familia EFT și DM_RAZOR: modelele EFT îmbunătățesc ajustarea comună cu ΔlogL_total≈1155–1337 relativ la DM_RAZOR și ating ΔlogL_closure=172–281 în testul de închidere. P1A creează doar un «control mai dur» pe partea DM; scopul său este să reducă preocupări precum «referință strawman» sau «sistematici-ca-fizică», nu să înlocuiască comparația principală.

Tabelul B1 | Scoreboard P1A (mai mare este mai bine; parantezele indică diferențe relative la referința DM_RAZOR).

Ramură de model (spațiu de lucru)

Δk

Cel mai bun logL_RC RC-only (Δ)

Intensitate de închidere ΔlogL_closure (Δ)

Cel mai bun logL_total comun (Δ)

DM_RAZOR

0

-15702.654 (+0.000)

122.205 (+0.000)

-27347.068 (+0.000)

DM_RAZOR_SCAT

1

-15702.294 (+0.361)

121.236 (-0.969)

-23153.311 (+4193.758)

DM_RAZOR_AC

1

-15703.689 (-1.035)

121.531 (-0.674)

-23982.557 (+3364.511)

DM_RAZOR_FB

1

-15496.046 (+206.609)

129.454 (+7.249)

-27478.531 (-131.463)

DM_HIER_CMSCAT

1

-15702.644 (+0.010)

121.978 (-0.227)

-23153.160 (+4193.908)

DM_CORE1P

1

-15723.158 (-20.504)

122.056 (-0.149)

-27336.258 (+10.810)

DM_RAZOR_M

0 (+m)

-15702.654 (+0.000)

122.205 (+0.000)

-27340.451 (+6.617)

DM_STD

2 (+m)

-15832.203 (-129.549)

105.690 (-16.515)

-22984.445 (+4362.623)

EFT_BIN

1

-14631.537 (+1071.117)

204.620 (+82.415)

-19001.142 (+8345.926)

Fig. B1 | Scoreboard P1A: închiderea și ΔlogL comun relativ la referință (mai mare este mai bine).

Etichetele exemplu pentru setul de rulări finalizat corespunzător acestei anexe sunt următoarele (folosite pentru localizarea produselor intermediare și a tabelelor/figurilor P1A):
P1A run_tag = 20260213_151233; P1A closure_tag = 20260213_161731; P1A joint_tag = 20260213_195428.


B.5 Citare sugerată (notă de citare pentru anexă)

Când cititorii trebuie să citeze «testul de stres pentru standardizarea referinței DM» în plus față de concluziile principale ale lucrării, se recomandă să citeze concluzia principală împreună cu următoarea notă: «Vezi Anexa B (P1A) pentru teste de stres standardizate ale referinței DM (legacy SCAT/AC/FB + prior ierarhic de scatter c–M + proxy de core + nuisance de calibrare a forfecării de lentilare), sub același protocol de închidere.»