← Experiment

Explicație pentru public bazată pe P1_RC_GGL: test strict de închidere pentru dinamica galaxiilor și lentilarea slabă (v1.1)

Raport original: Guanglin Tu | Bază de versiune: P1 v1.1 | Statut: text explicativ pentru public / nu este articol evaluat inter pares
Arhive asociate: DOI raport 10.5281/zenodo.18526334 | DOI pachet de reproducere 10.5281/zenodo.18526286

Note de lectură

Acesta este un text explicativ, nu un alt raport academic. Se bazează pe raportul P1 original, păstrează figurile și tabelele-cheie și adaugă la fiecare pas important explicații pentru public despre „ce înseamnă acest lucru”.

Acest articol explică numai concluziile la care ajunge P1 în cadrul seturilor sale de date, al registrului de parametri și al protocolului statistic specificate: în testul comun al curbelor de rotație galactică (RC) și al lentilării slabe galaxie–galaxie (GGL), modelul de răspuns gravitațional mediu al EFT conduce clar în fața bazei minime DM_RAZOR testate aici.

Acest articol nu interpretează P1 ca pe o concluzie că „materia întunecată a fost răsturnată”. P1 este doar primul pas al experimentelor din seria P. El testează un singur strat observabil din EFT — „baza gravitațională medie” — nu întreaga teorie EFT.

I. P1 în cinci minute: ce testează, de fapt, acest studiu?


P1 poate fi citit ca un experiment de validare între sonde observaționale. Nu întreabă doar dacă un model poate potrivi un singur set de date; pune pe aceeași bancă de audit două citiri gravitaționale foarte diferite: curbele de rotație (RC) citesc dinamica din interiorul discurilor galactice, iar lentilarea slabă galaxie–galaxie (GGL) citește răspunsul gravitațional proiectat la scări mai mari.

Ideea centrală a P1

P1 ridică pragul comparației de la „se potrivește bine pe o sondă?” la „se închide între sonde?”. O performanță bună sub maparea corectă, urmată de colapsul semnalului când maparea este amestecată, sugerează că modelul ar fi putut surprinde o structură gravitațională comună pentru RC și GGL.

Tabelul 0 | Numerele-cheie ale P1 și modul lor de citire

Metrică

Cum este citită în P1 / P1A

Lectură în limbaj simplu

Potrivire comună ΔlogL_total

Comparația din textul principal: EFT este cu 1155–1337 peste DM_RAZOR

Diferența de scor total pe cele două seturi de date; mai mare înseamnă o explicație globală mai bună.

Intensitatea închiderii ΔlogL_closure

Comparația din textul principal: EFT este 172–281, iar DM_RAZOR este 127

Capacitatea de a prezice GGL după inferență numai din RC; mai mare înseamnă mai multă autocoerență între sonde.

Shuffle de control negativ

După amestecarea RC-bin→GGL-bin, semnalul de închidere EFT scade la 6–23

Dacă se rupe corespondența corectă, avantajul ar trebui să dispară; cu cât dispare mai mult, cu atât mai multe semnale false sunt excluse.

Test de stres multi-DM P1A

DM 7+1 + DM_STD, cu EFT_BIN păstrat ca termen de comparație

P1A nu privește doar baza minimă DM_RAZOR; el introduce mai multe ramuri DM de îmbunătățire, cu dimensionalitate redusă și auditabile, în același protocol de închidere.

II. De ce a fost nevoie de P1: unde se blochează cosmologia la scara galaxiilor?


Problema la scară galactică rămâne dificilă deoarece nevoia de „gravitație/masă suplimentară” nu este doar un fenomen al curbelor de rotație. Numeroase observații arată o legătură strânsă între materia barionică vizibilă din galaxii și citirile dinamice sau de lentilare efective. Pentru ruta materiei întunecate, aceasta înseamnă că halourile întunecate, feedbackul barionic, istoriile formării galaxiilor și sistematicile observaționale trebuie coordonate cu mare precizie. Pentru rutele gravitaționale fără DM, înseamnă că un model nu poate doar să arate bine pe RC; el trebuie să reziste și în lentilarea slabă, în relațiile de scalare ale populațiilor și în controalele negative.

Aceasta este motivația P1. El nu pornește de la ideea că „materia întunecată este greșită” sau că „EFT trebuie să fie corectă”. El aduce la judecată o afirmație testabilă: poate răspunsul gravitațional mediu al EFT să lase un semnal reproductibil și transferabil în închiderea între sonde RC→GGL?

Context din literatura externă: de ce contează fereastra RC+GGL

McGaugh, Lelli și Schombert (2016) au propus relația accelerației radiale (RAR), arătând o relație strânsă, cu dispersie mică, între accelerația observată trasată de curbele de rotație și accelerația prezisă din materia barionică. Aceasta face din cuplajul barioni–răspuns gravitațional o problemă inevitabilă pentru teoria la scară galactică.

Brouwer et al. (2021) au folosit lentilarea slabă KiDS-1000 pentru a extinde RAR la accelerații mai mici și raze mai mari, comparând MOND, gravitația emergentă Verlinde și modelele LambdaCDM. Ei au remarcat, de asemenea, că diferențele dintre galaxiile de tip timpuriu/târziu, halourile de gaz și conexiunile galaxie–halou rămân probleme explicative-cheie.

Mistele et al. (2024) au folosit mai departe lentilarea slabă pentru a deduce curbe ale vitezei circulare pentru galaxii izolate și au raportat lipsa unui declin clar până la sute de kpc și chiar până la aproximativ 1 Mpc, în acord cu BTFR. Aceasta arată că lentilarea slabă devine o citire externă importantă pentru răspunsul gravitațional la scară galactică.

Prin urmare, valoarea P1 nu stă în faptul că ar fi primul text care discută împreună RC și GGL. Valoarea lui stă în a le așeza într-un protocol auditabil, construit dintr-o mapare fixă, un registru de parametri, închidere RC-only→GGL, controale negative prin shuffle și teste de stres multi-DM în P1A.

III. Ce înseamnă EFT în P1? Nu este teoria câmpului efectiv


Aici, EFT înseamnă Teoria Firului de Energie (Energy Filament Theory, EFT), nu teoria câmpului efectiv (Effective Field Theory), sensul familiar din fizică. În raportul tehnic P1, EFT este folosită foarte prudent: ea nu intră în competiție ca teorie finală completă, ci este mai întâi redusă la o parametrizare observabilă, ajustabilă și falsificabilă a unui „răspuns gravitațional mediu”.

Mai simplu spus, P1 nu încearcă să discute toate sursele microscopice ale gravitației suplimentare și nici să demonstreze dintr-un singur pas întregul cadru EFT. El pune o întrebare mai îngustă și mai dură: dacă la scări galactice există un anumit răspuns gravitațional suplimentar mediu, poate acesta să explice mai întâi RC, iar apoi să se transfere pentru a prezice GGL?

Ce parte din EFT testează P1?

P1 testează „baza gravitațională medie”: o contribuție medie stabilă statistic și transferabilă.

P1 nu tratează încă „baza stochastică / de zgomot”: termenii aleatori, diferențele de la obiect la obiect sau dispersia suplimentară care pot apărea din procese de fluctuație mai microscopice.

P1 nu discută nici mecanismul microscopic complet, abundențele, duratele de viață sau constrângerile cosmologice globale. Este primul pas în experimentele seriei P, nu verdictul final.

IV. Planul seriei P1: de ce primul pas începe cu „baza medie”?


Seria P poate fi înțeleasă ca programul observațional de recuperare al EFT. Ea nu pune toate afirmațiile pe masă dintr-odată. În schimb, izolează piesa cel mai ușor de testat cu date publice. P1 începe cu termenul mediu: dacă răspunsul gravitațional mediu nu se poate închide de la RC la GGL, atunci nu există un punct de intrare solid pentru discutarea termenilor de zgomot mai complecși sau a mecanismelor microscopice.

Tabelul 1 | Poziționarea pe straturi a seriei P

Strat

Întrebare

Loc în P1

P1

Se poate închide răspunsul gravitațional mediu de la RC la GGL?

Întrebarea principală a raportului curent

P1A

Dacă partea DM este întărită, concluzia rămâne stabilă?

Anexa B: test de stres DM 7+1 + DM_STD

Lucrări viitoare ale seriei P

Se poate extinde la mai multe date, mai multe sonde și sistematici mai complexe?

Direcție viitoare

Probleme mai profunde

Cum se leagă termenul mediu, termenul de zgomot și mecanismele microscopice?

În afara domeniului de concluzii al P1

V. Care sunt datele? Ce ne spun separat RC și GGL?


V.I. Curbele de rotație RC: „vitezometrul” din discul galactic

Curbele de rotație înregistrează cât de repede orbitează gazul și stelele la raze diferite față de centrul unei galaxii. Vitezele orbitale mai mari implică o forță centripetă necesară mai puternică și, prin urmare, un răspuns gravitațional efectiv mai puternic. P1 folosește baza de date SPARC; după preprocesare, aceasta include 104 galaxii, 2.295 de puncte de viteză și 20 de binuri RC.

V.II. Lentilarea slabă GGL: „cântarul gravitațional” la scară mai mare

Lentilarea slabă galaxie–galaxie măsoară felul în care galaxiile din prim-plan deviază ușor lumina galaxiilor de fundal. Ea corespunde unui răspuns gravitațional proiectat la scară mai mare, la scara haloului, și nu depinde de detaliile gazodinamice ale discurilor galactice. P1 folosește date GGL publice din KiDS-1000 / Brouwer et al. (2021): patru binuri de masă stelară, câte 15 puncte radiale pe bin, în total 60 de puncte de date, cu covarianța completă.

V.III. Maparea fixă: de ce contează 20 de RC-bin → 4 GGL-bin?

P1 leagă 20 de binuri RC de 4 binuri GGL printr-o regulă fixă: fiecare bin GGL corespunde la cinci binuri RC, mediate cu ponderi date de numărul de galaxii. Această mapare rămâne fixă pentru toate modelele. Ea este o constrângere dură pentru testul de închidere și pentru comparația echitabilă.

De ce să nu reglăm maparea după fapt?

Dacă ar fi permisă alegerea după fapt a binurilor RC care corespund binurilor GGL, un model ar putea fabrica închidere prin rearanjarea corespondenței. P1 blochează în avans maparea 20→4 și o rupe deliberat printr-un control negativ shuffle tocmai pentru a testa dacă semnalul de închidere depinde într-adevăr de o corespondență fizic rezonabilă.

VI. Modele și metodă: ce compară, de fapt, P1?


VI.I. Partea EFT: un răspuns gravitațional mediu cu dimensionalitate redusă

Pe partea EFT, un termen de viteză suplimentară cu dimensionalitate redusă descrie răspunsul gravitațional mediu. Forma termenului suplimentar este controlată de o funcție-nucleu adimensională f(r/ℓ), unde ℓ este o scară globală, iar amplitudinile sunt atribuite pe binuri RC. Nuclee diferite codifică pante inițiale, comportamente de tranziție și cozi de rază lungă diferite, funcționând ca teste de stres pentru robustețe.

VI.II. Partea DM: comparația din textul principal și anexa P1A trebuie citite separat

În comparația din textul principal, DM_RAZOR este o bază NFW minimizată și auditabilă: fixează relația c–M și nu include dispersie de la halo la halo, contracție adiabatică, nucleu de feedback, nesfericitate sau termen de mediu. Avantajul acestui design este controlul gradelor de libertate și reproductibilitatea ușoară; limita lui este că nu reprezintă toate modelele LambdaCDM sau toate modelele de halou de materie întunecată.

De aceea, Anexa B (P1A) transformă partea DM într-un test de stres standardizat. Fără a schimba maparea comună sau protocolul de închidere, ea adaugă treptat ramuri de îmbunătățire cu dimensionalitate redusă, precum SCAT, AC, FB, HIER_CMSCAT, CORE1P, termenul de lentilare m și baza combinată DM_STD, păstrând totodată EFT_BIN ca termen de comparație. O lectură bună a P1A este aceasta: nu compară EFT doar cu o singură bază DM minimă; pune un set de mecanisme DM comune și auditabile sub aceeași „riglă a închiderii”.

Formularea exactă a concluziei folosite aici

Textul principal: familia EFT depășește semnificativ DM_RAZOR minim în comparația principală.

Anexa B / P1A: pe mai multe ramuri DM de îmbunătățire cu dimensionalitate redusă și auditabile, precum și în testul de stres DM_STD, unele potriviri comune DM se îmbunătățesc, dar intensitatea închiderii nu șterge avantajul EFT_BIN.

Afirmația cea mai sigură este așadar: în cadrul datelor, mapării, registrului de parametri și protocolului de închidere din P1/P1A, răspunsul gravitațional mediu al EFT arată o consistență mai puternică între date. Aceasta nu echivalează cu excluderea tuturor modelelor de materie întunecată.

VI.III. Testul de închidere: cea mai importantă logică experimentală a P1

1. Se potrivește numai RC și se obține un set de eșantioane posterioare RC-only.

2. Nu se reajustează pe GGL; posteriorul RC este folosit direct pentru a prezice GGL.

3. Se folosește covarianța completă pentru a calcula scorul de predicție GGL logL_true sub maparea corectă.

4. Se permută aleator corespondența RC-bin→GGL-bin și se calculează scorul de control negativ logL_perm.

5. Diferența dintre cele două dă intensitatea închiderii: ΔlogL_closure = <logL_true> − <logL_perm>.

Analogie în limbaj simplu

Testul de închidere seamănă cu o reexaminare într-o altă sală: modelul învață mai întâi o regulă în sala RC, apoi răspunde în sala GGL. Dacă a învățat o regulă comună, nu un truc local, ar trebui să se descurce bine și în a doua sală; dacă legătura dintre sălile de examen este amestecată deliberat, avantajul ar trebui să dispară.

VI.IV. Înainte de tabelele tehnice: patru puncte de intrare

Tabelul 5.4 | Cum se citesc următoarele tabele tehnice în format peisaj

Punct de intrare

Ce trebuie urmărit

De ce contează

Table S1a

Scorul total al potrivirii comune RC+GGL

Răspunde la întrebarea: „Privind ambele seturi de date, a cui explicație globală este mai puternică?”

Table S1b

Intensitatea închiderii, shuffle, scanări de robustețe

Răspunde la întrebarea: „Se poate transfera către GGL ceea ce a fost învățat din RC?”

Table B0

Definițiile mai multor ramuri DM de îmbunătățire în P1A

Împiedică reducerea P1 la „a comparat doar cu DM_RAZOR minim”.

Table B1

Tabloul P1A pentru închidere și scor comun

Verifică dacă DM îmbunătățit șterge avantajul de închidere.

Notă de paginare

Pagina următoare trece la orientarea peisaj pentru ca tabelele late din raportul original să poată fi păstrate fără ștergerea coloanelor sau comprimarea lor până la ilizibilitate. Textul principal a oferit deja o lectură în limbaj simplu; tabelele tehnice peisaj sunt pentru cititorii care trebuie să verifice numerele și ramurile de model.

Figura 0.1 | Fluxul testului de închidere P1, pe scurt

Notă: lanțul de sus este „testul de închidere” (potrivește numai RC → folosește posteriorul RC pentru a prezice GGL); lanțul de jos este „potrivirea comună” (evaluează împreună RC+GGL). Partea dreaptă compară maparea reală cu mapări amestecate pentru a obține intensitatea închiderii ΔlogL.

VII. Tabele tehnice-cheie: tabelele principale ale raportului și tabelele P1A


Tabelul S1a | Metrici principale ale comparației prin potrivire comună (RC+GGL, Strict; păstrate din raportul original)

Model (workspace)

Nucleu W

k

logL_total comun (cel mai bun)

ΔlogL_total față de DM

AICc

BIC

DM_RAZOR

niciunul

20

-16927.763

0.0

33895.885

34010.811

EFT_BIN

niciunul

21

-15590.552

1337.21

31223.501

31344.155

EFT_WEXP

exponențial

21

-15668.83

1258.932

31380.057

31500.711

EFT_WYUK

Yukawa

21

-15772.936

1154.827

31588.268

31708.922

EFT_WPOW

powerlaw_tail

21

-15633.321

1294.442

31309.038

31429.692

Tabelul S1b | Metrici de închidere și robustețe (Strict; păstrate din raportul original)

Model (workspace)

ΔlogL de închidere (true-perm)

ΔlogL după shuffle de control negativ

Interval ΔlogL în scanarea σ_int

Interval ΔlogL în scanarea R_min

Interval ΔlogL în scanarea cov-shrink

DM_RAZOR

126.678

22.725

EFT_BIN

231.611

14.984

459–1548

1243–1289

1337–1351

EFT_WEXP

171.977

6.04

408–1471

1169–1207

1259–1277

EFT_WYUK

179.808

14.688

380–1341

1065–1099

1155–1166

EFT_WPOW

280.513

6.672

457–1500

1203–1247

1294–1308

Tabelul B0 | Definițiile ramurilor de îmbunătățire DM în P1A (păstrate din Anexa B a raportului original)

Workspace

dm_model

Parametri noi (≤1)

Motivație fizică (nucleu)

Regulă de implementare (prietenoasă cu auditul)

DM_RAZOR

NFW (c–M fix, fără dispersie)

Bază minimă și auditabilă de halou LambdaCDM; folosită ca termen strict de comparație pentru EFT

Mapare comună fixă; registru strict de parametri; folosită ca bază doar pentru comparație relativă

DM_RAZOR_SCAT

NFW + dispersie c–M (legacy)

σ_logc

Relația c–M are dispersie; este aproximată printr-o dispersie log-normală cu un singur parametru

≤1 parametru nou; folosește în continuare maparea comună; câștigul de închidere este criteriul de acceptare

DM_RAZOR_AC

NFW + contracție adiabatică (legacy)

α_AC

Căderea barionică poate induce contracție adiabatică a haloului; este aproximată printr-un singur parametru de intensitate

≤1 parametru nou; maparea rămâne neschimbată; raportează schimbările AICc/BIC și câștigul de închidere

DM_RAZOR_FB

NFW + nucleu de feedback (legacy)

log r_core

Feedbackul poate forma un nucleu în regiunea interioară; este aproximat printr-un singur parametru de scară a nucleului

≤1 parametru nou; același protocol de închidere/control negativ; îmbunătățirea RC-only nu este singura țintă

DM_HIER_CMSCAT

Dispersie c–M ierarhică + prior

σ_logc (ierarhic)

O formulare ierarhică mai standard c_i∼logN(c(M_i), σ_logc); afectează simultan posteriorul comun RC și GGL

Prior explicit; c_i latent marginalizat; rămâne cu dimensionalitate redusă și auditabil

DM_CORE1P

Proxy de nucleu cu 1 parametru (inspirat de coreNFW/DC14)

log r_core

Folosește un proxy de nucleu cu un singur parametru pentru efectul principal al feedbackului barionic, evitând detaliile cu dimensionalitate mare ale formării stelare

Face trimitere la literatura standard; ≤1 parametru nou; legat de testul de închidere

DM_RAZOR_M

NFW + nuisance de calibrare a forfecării în lentilare

m_shear (GGL)

Absoarbe o sistematică-cheie de pe partea lentilării slabe ca parametru efectiv, reducând riscul de a trata sistematicile drept fizică

Nuisance-ul este contabilizat explicit; nu i se permite să se întoarcă în RC; rezultatele sunt evaluate în principal după robustețea închiderii

DM_STD

Bază DM standardizată (HIER_CMSCAT + CORE1P + m)

σ_logc + log r_core (+ m_shear)

Introduce trei clase comune de obiecții într-o bază standardizată care rămâne cu dimensionalitate redusă

Raportează împreună registrul de parametri și criteriile informaționale; închiderea este metrica principală; folosit ca cel mai puternic comparator de apărare DM

Tabelul B1 | Tabloul de scor P1A (mai mare este mai bine; păstrat din Anexa B a raportului original)

Ramură de model (workspace)

Δk

Cel mai bun logL_RC RC-only (Δ)

Intensitatea închiderii ΔlogL_closure (Δ)

Cel mai bun logL_total comun (Δ)

DM_RAZOR

0

-15702.654 (+0.000)

122.205 (+0.000)

-27347.068 (+0.000)

DM_RAZOR_SCAT

1

-15702.294 (+0.361)

121.236 (-0.969)

-23153.311 (+4193.758)

DM_RAZOR_AC

1

-15703.689 (-1.035)

121.531 (-0.674)

-23982.557 (+3364.511)

DM_RAZOR_FB

1

-15496.046 (+206.609)

129.454 (+7.249)

-27478.531 (-131.463)

DM_HIER_CMSCAT

1

-15702.644 (+0.010)

121.978 (-0.227)

-23153.160 (+4193.908)

DM_CORE1P

1

-15723.158 (-20.504)

122.056 (-0.149)

-27336.258 (+10.810)

DM_RAZOR_M

0 (+m)

-15702.654 (+0.000)

122.205 (+0.000)

-27340.451 (+6.617)

DM_STD

2 (+m)

-15832.203 (-129.549)

105.690 (-16.515)

-22984.445 (+4362.623)

EFT_BIN

1

-14631.537 (+1071.117)

204.620 (+82.415)

-19001.142 (+8345.926)

Cum se citește Tabelul B1 (tabloul de scor P1A)

• Δk: grade de libertate adăugate (mai mare înseamnă un model mai complex; mai complex nu înseamnă mai bun).

• Concentrați-vă pe două coloane: intensitatea închiderii ΔlogL_closure(Δ) (mai mare înseamnă mai multă autocoerență a transferului) și cel mai bun logL_total comun (Δ) (scorul total al potrivirii comune).

• (Δ) din paranteză este diferența față de DM_RAZOR, ceea ce face comparația directă mai ușoară.

• Întrebarea principală a acestui tabel este: dacă baza DM este „îmbunătățită rezonabil”, dispare avantajul de închidere?

• Notă de lectură: DM_STD îmbunătățește substanțial scorul comun, dar intensitatea închiderii scade de fapt; EFT_BIN păstrează în continuare o intensitate a închiderii mai mare.

Rezumat într-o frază: în acest interval auditabil și cu dimensionalitate redusă de îmbunătățiri DM, îmbunătățirea potrivirii comune nu produce automat o închidere mai puternică; închiderea (transferabilitatea) rămâne criteriul-cheie.

VIII. Cum trebuie citite rezultatele principale?


VIII.I. Ajustarea comună: privite împreună, cele două seturi de date dau un scor mai mare modelelor EFT din comparația principală

Tabelul S1a și Figura S4 arată că, sub aceleași date, aceeași mapare comună și aproape aceeași scară de parametri, familia EFT are un ΔlogL_total comun de 1155–1337 față de DM_RAZOR. Pentru cititorii generali, aceasta înseamnă că, sub o regulă de scor care combină RC și GGL, modelele EFT din comparația principală primesc un scor total mai mare.

VIII.II. Testul de închidere: accentul principal al P1 este transferabilitatea

O intensitate mare a închiderii înseamnă că un model poate deduce parametri numai din RC și, fără să se uite din nou la GGL, poate prezice GGL mai bine. În raportul P1, EFT are ΔlogL_closure = 172–281, în timp ce DM_RAZOR are 127. Acest lucru contează mai mult decât afirmația că „fiecare potrivire arată bine”, deoarece limitează libertatea modelului pe al doilea set de date.

VIII.III. Control negativ: de ce este „prăbușirea semnalului” un lucru bun?

După ce P1 amestecă aleator corespondența de grupare RC-bin→GGL-bin, semnalul de închidere al EFT scade în intervalul 6–23. Pentru cititorii generali, acesta este un pas anti-trișare: dacă avantajul de închidere ar veni doar din cod, unități, alegeri de covarianță sau un accident de potrivire, atunci corespondențele amestecate ar putea arăta totuși un avantaj. În schimb, avantajul se prăbușește, arătând că depinde de maparea corectă.

Figura S3 | Intensitatea închiderii (mai mare este mai bine): avantajul mediu al log-verosimilității pentru predicția RC-only → GGL.

Cum se citește această figură

Această figură este nucleul P1. Cu cât bara este mai înaltă, cu atât informația învățată de model din RC se transferă mai bine către GGL.

Familia EFT în ansamblu se află deasupra DM_RAZOR, indicând o închidere mai puternică între sonde în experimentul „învață mai întâi RC, apoi prezice GGL”.

Figura S4 | Avantajul potrivirii comune (mai mare este mai bine): cel mai bun logL_total RC+GGL relativ la DM_RAZOR.

Cum se citește această figură

Această figură arată scorul total după combinarea RC și GGL.

Toate variantele EFT se află mult peste 0, arătând că avantajul EFT în comparația principală nu este un efect local într-un singur punct, ci comportamentul global al analizei comune.

Figura R1 | Control negativ: semnalul de închidere scade abrupt după amestecarea grupărilor.

Cum se citește această figură

Această figură arată că, odată ce relația corectă de binare RC↔GGL este amestecată, semnalul de închidere scade abrupt.

Aceasta face ca rezultatul P1 să semene mai mult cu o consistență reală într-o mapare între date decât cu o coincidență numerică obținută sub mapări arbitrare.

IX. Robustețe și controale: cum evită P1 explicația „arată bine doar prin ajustarea parametrilor”?


Un raport tehnic este cel mai vulnerabil la îngrijorarea că avantajul lui poate proveni dintr-o anumită setare de zgomot, din alegerea datelor din regiunea centrală, din tratarea covarianței sau din suprapotrivire. P1 răspunde acestei îngrijorări prin mai multe teste de stres.

Tabelul 2 | Cum se citesc testele de robustețe și controalele negative din P1

Test

Îndoiala pe care încearcă să o elimine

Cum se citește

Scanare σ_int

Dacă RC conține dispersie necunoscută suplimentară, rămâne concluzia stabilă?

După relaxarea erorilor RC, ordinea EFT și scara avantajului rămân stabile.

Scanare R_min

Dacă regiunea centrală a galaxiei nu este pe deplin de încredere, rămâne concluzia stabilă?

După tăierea regiunii centrale, EFT păstrează în continuare un avantaj pozitiv.

Scanare cov-shrink

Dacă estimarea covarianței GGL este incertă, rămâne concluzia stabilă?

După restrângerea covarianței către o matrice diagonală, avantajul nu este sensibil.

Scară de ablație

Forțează EFT o potrivire prin complexitate inutilă?

EFT_BIN complet este necesar sub criteriile informaționale.

Predicție LOO pe binuri reținute

Explică modelul doar date pe care le-a văzut deja?

După ce un bin GGL este lăsat pe dinafară, modelul arată în continuare o generalizare puternică.

Shuffle RC-bin

Provine închiderea din maparea reală?

Închiderea scade după amestecarea grupărilor, susținând dependența de mapare.

Figura R2 | Intervalul ΔlogL_total sub scanarea σ_int (mai mare este mai bine).

Cum se citește această figură

Testează dacă avansul EFT rămâne după modificări ale setării dispersiei intrinseci RC.

Figura R3 | Intervalul ΔlogL_total sub scanarea R_min (mai mare este mai bine).

Cum se citește această figură

Testează dacă avantajul EFT rămâne stabil după tăierea regiunii centrale complexe.

Figura R4 | Intervalul ΔlogL_total sub scanarea cov-shrink (mai mare este mai bine).

Cum se citește această figură

Testează dacă ordonarea este sensibilă la schimbări în tratarea covarianței lentilării slabe.

Figura R5 | Scara de ablație pentru EFT_BIN (AICc; mai mic este mai bine).

Cum se citește această figură

Testează dacă EFT_BIN complet este necesar pentru explicarea datelor, nu doar adaugă parametri.

Figura R6 | LOO: distribuția log-verosimilității pentru binurile lăsate pe dinafară.

Cum se citește această figură

Testează dacă modelul prezice în continuare bine pe un bin GGL nevăzut.

Figura R7 | Control negativ: maparea amestecată produce o scădere clară a mediei logL_true.

Cum se citește această figură

Arată suplimentar, din perspectiva mediei logL_true, că închiderea depinde de maparea corectă între date.

X. P1A: de ce contează multiplele modele DM din anexă?


Această secțiune nu întreabă „a învins EFT doar o singură bază minimă DM_RAZOR?”. Ea întreabă dacă concluziile din testul de închidere și din potrivirea comună se schimbă atunci când baza DM este întărită într-un registru de parametri cu dimensionalitate redusă, reproductibil și clar contabilizat (P1A). Altfel spus, P1A urmărește să reducă obiecția că comparația a folosit o bază DM prea slabă și să mute discuția spre întrebarea dacă performanța de închidere diferă în continuare sub un set de îmbunătățiri DM auditabile.

P1A nu încearcă să epuizeze toate opțiunile posibile de modelare a halourilor LambdaCDM și nici nu transformă partea DM într-o mașină de potrivire cu dimensionalitate mare, imposibil de auditat. Ea selectează îmbunătățiri cu dimensionalitate redusă, reproductibile și clare în registru: dispersia concentrației, contracția adiabatică, nucleul de feedback, priorul ierarhic pentru dispersia c–M, proxy-ul de nucleu cu un singur parametru, parametrul nuisance de calibrare a forfecării în lentilarea slabă și baza combinată DM_STD.

Lectura principală a P1A

Dintre cele trei ramuri legacy, numai feedback/core aduce un mic câștig net în intensitatea închiderii; SCAT și AC nu aduc un câștig net de închidere.

DM_HIER_CMSCAT, DM_RAZOR_M și DM_CORE1P au efect redus asupra intensității închiderii sau nu arată niciun câștig net semnificativ.

DM_STD poate îmbunătăți substanțial logL comun, dar intensitatea închiderii scade, sugerând că el crește în principal flexibilitatea potrivirii comune, nu puterea de predicție prin transfer RC→GGL.

În Tabelul B1 din P1A, EFT_BIN păstrează în continuare o intensitate a închiderii mai mare și un avantaj de potrivire comună. Afirmația centrală a P1 nu trebuie deci simplificată la „a învins doar DM_RAZOR minim”.

Figura B1 | Tabloul de scor P1A: închiderea și ΔlogL comun relativ la bază (mai mare este mai bine).

Cum se citește această figură

Această figură arată performanța mai multor ramuri de îmbunătățire DM față de bază.

Semnificația ei nu este „tot DM este exclus”. Ea arată că, în intervalul de îmbunătățiri DM cu dimensionalitate redusă și auditabile selectat în P1A, DM îmbunătățit nu șterge avantajul de închidere al EFT_BIN.

XI. Sensul experimentului P1: de ce merită făcut?


XI.I. Sens metodologic: așezarea închiderii între sonde deasupra ajustării pe o singură sondă

Teoria la scară galactică se blochează adesea în dispute despre dacă un model poate potrivi un set de curbe de rotație. P1 ridică ștacheta: pot parametrii învățați din RC să prezică lentilarea slabă fără reajustare pe GGL? Astfel, P1 se transformă dintr-un concurs de potrivire într-un test de predicție prin transfer.

XI.II. Sens al transparenței: lanțul reproductibil devine parte din rezultat

O contribuție importantă a P1 este că publică împreună datele, tabelele și figurile, etichetele rulărilor, controalele negative, pachetul de reproducere și urma de audit. Acest lucru contează atât pentru susținători, cât și pentru critici: discuția se poate întoarce la aceleași date publice, aceeași mapare, aceleași scripturi și aceleași metrici, în loc să compare sloganuri.

XI.III. Sens fizic: un test de stres puternic pentru gravitația fără materie întunecată

În direcțiile gravitației fără DM, multe modele pot explica o parte din fenomenologia curbelor de rotație sau a RAR. Sarcina mai grea este să treacă simultan citirile de lentilare slabă și să arate, sub controale negative, că semnalul depinde de maparea corectă. Semnificația P1 este că pune răspunsul gravitațional mediu al EFT într-un protocol asemănător unui examen extern: RC este terenul de antrenament, GGL este terenul de transfer, iar shuffle este terenul anti-trișare.

XI.IV. Este acesta un experiment important pentru domeniul gravitației fără materie întunecată?

Formulat prudent: dacă prelucrarea datelor P1, pachetul de reproducere și protocolul de închidere rezistă la replicare externă, atunci P1 poate fi considerat un experiment de închidere RC+GGL demn de luat în serios în cercetarea gravitației fără DM / a gravitației modificate. Importanța lui nu stă în expresia „materia întunecată a fost răsturnată”, ci în furnizarea unui criteriu între sonde care poate fi copiat, contestat și extins.

Există deja un cadru de predicție-închidere RC+GGL la fel de puternic?

Există deja cadre relevante și tradiții observaționale: MOND/RAR organizează foarte bine un volum mare de fenomene ale curbelor de rotație; lucrările RAR pe lentilarea slabă KiDS-1000 au comparat și MOND, gravitația emergentă Verlinde și modelele LambdaCDM; LambdaCDM poate explica, de asemenea, unele fenomene dinamice sau de lentilare slabă prin conexiuni galaxie–halou, halouri de gaz și modelarea feedbackului.

Însă afirmația exactă a P1 nu este „niciun alt cadru din lume nu poate explica RC+GGL”. Afirmația lui este că, sub propriul protocol public P1 — mapare fixă, închidere RC-only→GGL, control negativ shuffle, registru de parametri și teste de stres multi-DM P1A — EFT raportează o performanță de închidere mai puternică.

Cu alte cuvinte, partea din P1 care merită cel mai mult testare externă este protocolul concret și reproductibil de comparație pe care îl propune. Dacă MOND/RAR, LambdaCDM/HOD, simulările hidrodinamice sau alte cadre de gravitație modificată pot atinge același scor de închidere sau unul mai mare sub același protocol este un pas următor foarte valoros.

XII. Ce poate concluziona P1 și ce nu poate concluziona?


Tabelul 3 | Limitele concluziilor P1

Se poate concluziona

Sub datele RC+GGL ale P1, maparea fixă și protocolul principal de comparație, familia EFT are o potrivire comună și o intensitate a închiderii mai mari decât DM_RAZOR minim.

Se poate concluziona

În intervalul de îmbunătățiri DM cu dimensionalitate redusă și auditabile din P1A, mai multe îmbunătățiri DM nu șterg avantajul de închidere al EFT_BIN.

Se poate concluziona

Controlul negativ shuffle arată că semnalul de închidere depinde de maparea corectă între date, nu de mapări arbitrare.

Nu se poate concluziona

Nu se poate concluziona că P1 a răsturnat toate modelele de materie întunecată. P1A tot nu epuizează nesfericitatea, dependența de mediu, conexiunile complexe galaxie–halou, feedbackul cu dimensionalitate mare sau simulările cosmologice complete.

Nu se poate concluziona

Nu se poate concluziona că teoria EFT completă a fost demonstrată din principii prime. P1 testează doar stratul fenomenologic al răspunsului gravitațional mediu.

Nu se poate concluziona

Nu se poate concluziona că toate sistematicile au fost excluse. P1 oferă dovezi de robustețe doar în cadrul testelor de stres și al intervalului de audit enumerate.

XIII. Întrebări frecvente


Î1: Se spune aici că „materia întunecată nu există”?

Nu. Concluzia P1 trebuie limitată la datele, protocolul și modelele de comparație folosite în acest articol. P1A merge dincolo de baza minimă DM_RAZOR, dar tot nu reprezintă toate modelele posibile de materie întunecată.

Î2: Se spune aici că „EFT a fost deja demonstrată”?

Tot nu. P1 testează EFT ca răspuns gravitațional mediu parametrizat și arată o performanță mai puternică în închiderea RC→GGL; mecanismele microscopice și teoria completă nu sunt concluzii ale P1.

Î3: De ce nu se declară direct o semnificație în σ?

P1 folosește un scor unificat de verosimilitate, criterii informaționale și diferențe de închidere. ΔlogL este un avantaj relativ sub aceeași regulă de scor; nu este același lucru cu o singură valoare σ.

Î4: De ce se amestecă RC-bin→GGL-bin?

Acesta este controlul negativ. Un semnal real între sonde ar trebui să depindă de maparea corectă. Dacă situația amestecată ar rămâne la fel de puternică, aceasta ar sugera mai degrabă o părtinire de implementare sau un fals semnal statistic.

Î5: Ce ar trebui să facă P1 mai departe?

Să extindă același protocol la mai multe date, mai multe controale DM, sistematici mai complexe și mai multe cadre de gravitație modificată, mai ales în moduri care permit echipelor externe să reproducă aceeași metrică de închidere.

XIV. Mic glosar


Tabelul 4 | Mini-glosar

Termen

Explicație într-o frază

Curbă de rotație (RC)

Relația rază–viteză dintr-un disc galactic, folosită pentru a deduce gravitația efectivă din interiorul discului.

Lentilare slabă (GGL)

Măsoară distribuția medie gravitațională/de masă din jurul galaxiilor de prim-plan prin distorsiunea statistică a formelor galaxiilor de fundal.

Test de închidere

Folosește posteriorul RC pentru a prezice GGL și îl compară cu un control negativ prin mapare amestecată.

Control negativ

Rupe deliberat o structură-cheie pentru a vedea dacă semnalul dispare; este folosit pentru a exclude semnalele false.

Halou NFW

Un profil de densitate al haloului de materie întunecată folosit frecvent în modelele de materie întunecată rece.

Relația c–M

Relația dintre concentrația c și masa M a unui halou de materie întunecată; permiterea dispersiei schimbă flexibilitatea modelului.

DM_STD

În P1A, o ramură DM standardizată de test de stres, care combină mai multe îmbunătățiri DM cu dimensionalitate redusă și un nuisance de lentilare.

ΔlogL

Diferența de log-verosimilitate dintre două modele sub aceeași regulă de scor; valorile pozitive indică faptul că primul performează mai bine.

Covarianță

O descriere matricială a corelațiilor dintre punctele de date; datele de lentilare slabă cer, în general, covarianța completă.

XV. Rută de lectură sugerată și puncte de intrare pentru citare


1. Citiți mai întâi secțiunile I–III pentru a stabili întrebarea P1 și rolul prudent atribuit EFT în P1.

2. Apoi consultați Figurile S3 și S4 și Tabelele S1a/S1b pentru a înțelege intensitatea închiderii, potrivirea comună și controalele negative.

3. Dacă vă îngrijorează că baza DM este prea slabă, mergeți direct la secțiunea X și la Tabelul B1 / Figura B1.

4. Pentru replicare tehnică, reveniți la raportul tehnic P1 v1.1, la suplimentul Tables & Figures și la full_fit_runpack.

Puncte principale de intrare în arhivă

Raportul tehnic P1 (nivel publicabil, Concept DOI): 10.5281/zenodo.18526334

Pachetul complet de reproducere P1 (Concept DOI): 10.5281/zenodo.18526286

Baza de cunoștințe structurată EFT (opțional, Concept DOI): 10.5281/zenodo.18853200

Notă de licență: raportul tehnic folosește CC BY-NC-ND 4.0; pachetul complet de reproducere folosește CC BY 4.0 (sub rezerva raportului tehnic și a înregistrărilor din arhiva Zenodo).

XVI. Referințe și context extern


McGaugh, S. S., Lelli, F., & Schombert, J. M. (2016). The Radial Acceleration Relation in Rotationally Supported Galaxies. Physical Review Letters, 117, 201101. DOI: 10.1103/PhysRevLett.117.201101.

Famaey, B., & McGaugh, S. S. (2012). Modified Newtonian Dynamics (MOND): Observational Phenomenology and Relativistic Extensions. Living Reviews in Relativity, 15, 10. DOI: 10.12942/lrr-2012-10.

Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.

Mistele, T., McGaugh, S., Lelli, F., Schombert, J., & Li, P. (2024). Indefinitely Flat Circular Velocities and the Baryonic Tully-Fisher Relation from Weak Lensing. The Astrophysical Journal Letters, 969, L3 / arXiv:2406.09685.

Bullock, J. S., & Boylan-Kolchin, M. (2017). Small-Scale Challenges to the LambdaCDM Paradigm. Annual Review of Astronomy and Astrophysics, 55, 343–387. DOI: 10.1146/annurev-astro-091916-055313.

Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.

Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493.

Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374.