← Experiment

Raportul P1 explicat

De la curbele de rotație la lentilarea slabă: testarea răspunsului gravitațional mediu al EFT

Un ghid pentru public bazat pe P1_RC_GGL: un test strict de închidere al dinamicii galaxiilor și al lentilării slabe (v1.1)

Raport original de Guanglin Tu | Baza versiunii: P1 v1.1 | Statut editorial: proiect explicativ pentru public / nu este un articol evaluat inter pares
Arhive asociate: DOI raport 10.5281/zenodo.18526334 | DOI pachet de reproducere 10.5281/zenodo.18526286

Notă de lectură

Aceasta este o versiune explicativă, nu un raport academic separat. Ea se bazează pe raportul P1 original, păstrează figurile și tabelele cheie și adaugă explicații pe înțelesul tuturor despre semnificația fiecărui pas major.

Acest ghid explică doar ceea ce concluzionează P1 sub seturile sale de date, registrul de parametri și protocolul statistic specificate: în testul comun al curbelor de rotație ale galaxiilor (RC) și al lentilării slabe galaxie–galaxie (GGL), modelul de răspuns gravitațional mediu al EFT depășește clar baza minimală DM_RAZOR testată aici.

Acest ghid nu interpretează P1 ca pe o afirmație că „materia întunecată a fost răsturnată”. P1 este doar primul pas în experimentele seriei P. El testează un strat observabil al EFT — „baza gravitațională medie” — nu întregul conținut al cadrului EFT complet.

0 | Înțelegerea P1 în cinci minute: ce face acest test?

P1 poate fi privit ca un test de consistență între sonde observaționale. El nu întreabă doar dacă un model poate ajusta un singur set de date. În schimb, pune pe aceeași masă de audit două citiri gravitaționale foarte diferite: curbele de rotație (RC) citesc dinamica din interiorul discurilor galactice, iar lentilarea slabă galaxie–galaxie (GGL) citește răspunsul gravitațional proiectat la scări mai mari.

P1 într-o singură propoziție

P1 ridică ștacheta de la „ajustează bine o singură sondă?” la „se închide între sonde?”. Un model are șanse mai mari să fi captat o structură gravitațională comună RC și GGL doar dacă performează bine sub maparea corectă, iar semnalul se prăbușește după amestecarea mapării.

Tabelul 0 | Numerele centrale ale P1 și cum trebuie citite

Metrică

Citire în P1 / P1A

Semnificație pe înțelesul tuturor

ΔlogL_total al ajustării comune

În comparația din textul principal, EFT este cu 1155–1337 peste DM_RAZOR

Diferența totală de scor pe cele două seturi de date; mai mare înseamnă o explicație generală mai bună.

Forța de închidere ΔlogL_closure

În comparația din textul principal, EFT este 172–281, în timp ce DM_RAZOR este 127

Capacitatea de a prezice GGL după inferența doar din RC; mai mare înseamnă o autoconsistență mai puternică între sonde.

Amestecare de control negativ

După amestecarea RC-bin→GGL-bin, semnalul de închidere al EFT scade la 6–23

Dacă se rupe corespondența corectă, avantajul ar trebui să dispară; cu cât colapsul este mai abrupt, cu atât exclude mai bine un semnal fals.

Test de stres multi-DM P1A

DM 7+1 + DM_STD, cu EFT_BIN păstrat ca termen de comparație

P1A nu privește doar baza minimală DM_RAZOR. El introduce mai multe ramuri de îmbunătățire DM, cu dimensionalitate redusă și auditabile, în același protocol de închidere.


1 | De ce este necesar P1? Unde s-a blocat cosmologia la scară galactică?

Problemele la scară galactică au rămas dificile deoarece „cerința de gravitație/masă suplimentară” nu este doar un fenomen al curbelor de rotație. Multe observații arată o legătură strânsă între materia barionică vizibilă din galaxii și citirile dinamice/de lentilare efective. Pentru ruta materiei întunecate, aceasta înseamnă că halourile întunecate, feedbackul barionic, istoria formării galaxiilor și sistematicile observaționale trebuie coordonate cu mare precizie. Pentru rutele gravitaționale fără materie întunecată, înseamnă că un model nu poate doar să arate bine pe RC; el trebuie să reziste și în fața lentilării slabe, a relațiilor de scalare ale populațiilor și a controalelor negative.

Aceasta este motivația P1. El nu pornește de la ideea că „materia întunecată este greșită” sau că „EFT trebuie să fie corectă”. P1 aduce la audit o singură afirmație testabilă: poate răspunsul gravitațional mediu al EFT să lase un semnal reproductibil și transferabil în închiderea între sonde RC→GGL?

Context din literatura externă: de ce contează fereastra RC+GGL

Relația accelerației radiale (RAR) propusă de McGaugh, Lelli și Schombert în 2016 arată o corelație strânsă, cu dispersie redusă, între accelerația observată trasată de curbele de rotație și accelerația prezisă din materia barionică. Aceasta face ca „cuplarea barioni–răspuns gravitațional” să fie inevitabilă pentru teoria la scară galactică.

Brouwer et al. (2021) au folosit lentilarea slabă KiDS-1000 pentru a extinde RAR către accelerații mai mici și raze mai mari, comparând MOND, gravitația emergentă Verlinde și modelele LambdaCDM. Ei au remarcat, de asemenea, că diferențele dintre galaxiile de tip timpuriu și târziu, halourile de gaz și conexiunea galaxie–halo rămân probleme explicative cheie.

Mistele et al. (2024) au folosit în continuare lentilarea slabă pentru a deduce curbe de viteză circulară pentru galaxii izolate, raportând absența unui declin clar până la câteva sute de kpc și chiar până la aproximativ 1 Mpc, în acord cu BTFR. Aceasta arată că lentilarea slabă devine o citire externă importantă pentru testarea răspunsului gravitațional la scară galactică.

Prin urmare, valoarea P1 nu stă în faptul că ar fi „primul care discută împreună RC și GGL”. Valoarea lui constă în faptul că le așază într-un protocol auditabil, construit dintr-o mapare fixă, un registru al parametrilor, închidere RC-only→GGL, controale negative prin amestecare și teste de stres multi-DM în P1A.


2 | Ce înseamnă EFT în P1? Nu este teoria câmpului efectiv

Aici, EFT desemnează Teoria Firului de Energie (Energy Filament Theory, EFT), nu teoria câmpului efectiv folosită frecvent în fizică. În raportul tehnic P1, EFT este folosită cu reținere: ea nu intră în comparație ca teorie finală completă, ci este mai întâi comprimată într-o parametrizare observabilă, gata de ajustare și falsificabilă a „răspunsului gravitațional mediu”.

Pe înțelesul tuturor, P1 nu începe prin a discuta fiecare sursă microscopică a gravitației suplimentare și nu încearcă să dovedească dintr-odată întregul cadru EFT. El pune o întrebare mai îngustă și mai dură: dacă la scări galactice există un anumit răspuns gravitațional suplimentar mediu, poate acesta să explice mai întâi RC și apoi să fie transferat pentru a prezice GGL?

Ce parte din EFT testează P1?

P1 vizează „baza gravitațională medie”: o contribuție medie stabilă statistic, care se poate transfera între eșantioane.

P1 nu tratează încă „baza stochastică/de zgomot”: termenii aleatori, diferențele individuale sau dispersia suplimentară pe care ar putea să o introducă procese de fluctuație mai microscopice.

P1 nu abordează nici mecanismul microscopic complet, abundența, durata de viață sau constrângerile cosmologice globale. Este primul pas în experimentele seriei P, nu un verdict final.


3 | Planul seriei P1: de ce să începem cu „baza medie”?

Seria P poate fi înțeleasă ca programul de recuperare observațională al EFT. Ea nu expune toate afirmațiile deodată; în schimb, izolează partea care poate fi testată cel mai direct cu date publice. Strategia P1 este să testeze mai întâi termenul mediu: dacă răspunsul gravitațional mediu nici măcar nu se poate închide de la RC la GGL, atunci discuția despre termeni de zgomot mai complecși sau despre mecanisme microscopice nu are un punct de intrare adecvat.

Tabelul 1 | Poziționarea pe straturi a seriei P

Strat

Întrebare pusă

Rol în P1

P1

Se poate închide răspunsul gravitațional mediu în RC→GGL?

Întrebarea principală a raportului de față

P1A

Dacă partea DM este întărită, rămâne concluzia stabilă?

Anexa B: test de stres DM 7+1 + DM_STD

Lucrări ulterioare ale seriei P

Poate fi extins protocolul la mai multe date, mai multe sonde și sistematici mai complexe?

Direcție pentru lucrări viitoare

Întrebări de nivel mai profund

Cum se conectează termenul mediu, termenul de zgomot și mecanismul microscopic?

În afara sferei concluziilor P1


4 | Care sunt datele? Ce ne spun RC și GGL?


4.1 Curbele de rotație (RC): „indicatorul de viteză” din interiorul discurilor galactice

Curbele de rotație înregistrează cât de repede orbitează gazul și stelele în jurul centrului unei galaxii la diferite raze. Cu cât rotația este mai rapidă, cu atât forța centripetă necesară la acea rază este mai mare — și, prin urmare, cu atât gravitația efectivă este mai puternică. P1 folosește baza de date SPARC, cu o preprocesare care include 104 galaxii și 2.295 de puncte de viteză, împărțite în 20 de bin-uri RC.


4.2 Lentilarea slabă (GGL): un „cântar gravitațional” la scară mai mare

Lentilarea slabă galaxie–galaxie măsoară felul în care galaxiile din prim-plan curbează ușor lumina galaxiilor de fundal. Ea corespunde răspunsului gravitațional proiectat la raze mai mari, la scară de halo, și nu depinde de detaliile dinamicii gazului din interiorul unei galaxii. P1 folosește datele publice GGL din KiDS-1000 / Brouwer et al. (2021): 4 bin-uri de masă stelară, 15 puncte radiale pe bin, 60 de puncte de date în total, folosind covarianța completă.


4.3 Mapare fixă: de ce contează 20 de bin-uri RC → 4 bin-uri GGL

P1 conectează cele 20 de bin-uri RC la cele 4 bin-uri GGL printr-o regulă fixă: fiecare bin GGL corespunde la 5 bin-uri RC, combinate prin mediere ponderată cu numărul de galaxii. Această mapare rămâne neschimbată pentru toate modelele și funcționează ca o constrângere dură pentru testul de închidere și pentru comparația echitabilă.

De ce să nu reglăm maparea ulterior?

Dacă s-ar putea alege după fapt „care bin-uri RC corespund căror bin-uri GGL”, un model ar putea fabrica închiderea prin rearanjarea corespondenței. P1 blochează dinainte maparea 20→4 și o rupe deliberat printr-un control negativ de amestecare tocmai pentru a judeca dacă semnalul de închidere depinde cu adevărat de o corespondență fizic rezonabilă.


5 | Modele și metode: ce compară exact P1?


5.1 Partea EFT: răspuns gravitațional mediu cu dimensionalitate redusă

Pe partea EFT, se folosește un termen suplimentar de viteză, cu dimensionalitate redusă, pentru a descrie răspunsul gravitațional mediu. Forma termenului suplimentar este controlată de o funcție nucleu adimensională f(r/ℓ), unde ℓ este scara globală, iar amplitudinea este atribuită pe bin RC. Diferitele nuclee reprezintă pante inițiale, viteze de tranziție și cozi de rază lungă diferite și sunt folosite în testele de stres pentru robustețe.


5.2 Partea DM: comparația din textul principal și anexa P1A trebuie citite separat

În comparația din textul principal, DM_RAZOR este o bază NFW minimizată și auditabilă: folosește o relație c–M fixă și nu include dispersie de la halo la halo, contracție adiabatică, nuclee de feedback, nesfericitate sau termeni de mediu. Punctul forte al acestui design este controlul gradelor de libertate și reproductibilitatea ușoară; punctul său slab este că nu poate reprezenta fiecare model LambdaCDM sau fiecare model de halo de materie întunecată.

Prin urmare, în Anexa B (P1A), partea DM este transformată într-un set de „teste de stres standardizate”. Fără a modifica maparea comună sau protocolul de închidere, P1A adaugă treptat ramuri de îmbunătățire cu dimensionalitate redusă, precum SCAT, AC, FB, HIER_CMSCAT, CORE1P, m de lentilare și baza combinată DM_STD, păstrând EFT_BIN ca termen de comparație. Pe scurt, P1A nu este o comparație cu o singură bază DM minimală; ea măsoară un set de mecanisme DM comune și auditabile cu aceeași „riglă de închidere”.

Încadrarea precisă a concluziei folosită aici

Textul principal: familia EFT depășește substanțial DM_RAZOR minimal în comparația principală.

Anexa B / P1A: sub mai multe ramuri de îmbunătățire DM cu dimensionalitate redusă și auditabile, precum și sub testul de stres DM_STD, unele ajustări comune DM se îmbunătățesc, dar forța de închidere nu elimină avantajul EFT_BIN.

Prin urmare, formularea cea mai sigură este: în limitele datelor, mapării, registrului de parametri și protocolului de închidere P1/P1A, răspunsul gravitațional mediu al EFT arată o consistență mai puternică între date; aceasta nu este același lucru cu excluderea tuturor modelelor de materie întunecată.


5.3 Testarea închiderii: cea mai importantă sintaxă experimentală a P1

1. Se ajustează folosind doar RC pentru a obține un set de eșantioane posterioare RC-only.

2. Nu se reoptimizează cu GGL; se folosește direct posteriorul RC pentru a prezice GGL.

3. Se folosește covarianța completă pentru a calcula scorul predicției GGL sub maparea corectă, logL_true.

4. Se permută aleator corespondența RC-bin→GGL-bin pentru a calcula scorul controlului negativ, logL_perm.

5. Se scad cele două valori pentru a obține forța de închidere: ΔlogL_closure = <logL_true> − <logL_perm>.

Analogie pe înțelesul tuturor

Un test de închidere seamănă cu o reexaminare încrucișată. Modelul învață mai întâi tipare în sala de examen RC, apoi răspunde în sala de examen GGL. Dacă a învățat o regulă comună și nu un truc local, ar trebui să răspundă bine și după schimbarea sălii; dacă corespondența dintre sălile de examen este amestecată deliberat, avantajul ar trebui să dispară.


5.4 Înainte de a citi tabelele tehnice: patru puncte de intrare

Tabelul 5.4 | Traseu de lectură pentru următorul set de tabele tehnice în format orizontal

Punct de intrare

La ce să vă uitați

De ce contează

Table S1a

Scorul total al ajustării comune RC+GGL

Răspunde la întrebarea: „Când cele două seturi de date sunt privite împreună, a cui explicație generală este mai puternică?”

Table S1b

Forța de închidere, amestecarea și scanările de robustețe

Răspunde la întrebarea: „Se poate transfera către GGL ceea ce a fost învățat din RC?”

Table B0

Definițiile mai multor ramuri de îmbunătățire DM în P1A

Împiedică reducerea P1 la „doar o comparație cu DM_RAZOR minimal”.

Table B1

Tabloul de scor al închiderii și al ajustării comune P1A

Verifică dacă avantajul de închidere dispare după întărirea DM.

Notă de machetare

Paginile în format orizontal încep pe pagina următoare, astfel încât tabelele late din raportul original să poată fi păstrate intacte, fără ștergerea coloanelor sau comprimarea lor până la ilizibilitate. Textul principal a oferit deja o lectură pe înțelesul tuturor; tabelele tehnice în format orizontal sunt pentru cititorii care trebuie să verifice valorile și ramurile de model.

Figura 0.1 | Fluxul testului de închidere P1 într-o singură diagramă

Notă: lanțul de sus este „testul de închidere” (ajustare doar pe RC → folosirea posteriorului RC pentru a prezice GGL); lanțul de jos este „ajustarea comună” (scor RC+GGL împreună). În dreapta, maparea reală este comparată cu maparea amestecată pentru a obține forța de închidere ΔlogL.


6 | Tabele tehnice cheie: tabelele principale din raportul original și tabelele P1A

Tabelul S1a | Metrici principale ale comparației de ajustare comună (RC+GGL, strict; păstrate din raportul original)

Model (spațiu de lucru)

Nucleu W

k

logL_total comun (cel mai bun)

ΔlogL_total față de DM

AICc

BIC

DM_RAZOR

niciunul

20

-16927.763

0.0

33895.885

34010.811

EFT_BIN

niciunul

21

-15590.552

1337.21

31223.501

31344.155

EFT_WEXP

exponențial

21

-15668.83

1258.932

31380.057

31500.711

EFT_WYUK

Yukawa

21

-15772.936

1154.827

31588.268

31708.922

EFT_WPOW

powerlaw_tail

21

-15633.321

1294.442

31309.038

31429.692

Tabelul S1b | Metrici de închidere și robustețe (strict; păstrate din raportul original)

Model (spațiu de lucru)

ΔlogL de închidere (true-perm)

ΔlogL după amestecarea de control negativ

Interval ΔlogL în scanarea σ_int

Interval ΔlogL în scanarea R_min

Interval ΔlogL în scanarea cov-shrink

DM_RAZOR

126.678

22.725

EFT_BIN

231.611

14.984

459–1548

1243–1289

1337–1351

EFT_WEXP

171.977

6.04

408–1471

1169–1207

1259–1277

EFT_WYUK

179.808

14.688

380–1341

1065–1099

1155–1166

EFT_WPOW

280.513

6.672

457–1500

1203–1247

1294–1308

Tabelul B0 | Definițiile ramurilor de îmbunătățire DM din P1A (păstrate din Anexa B a raportului original)

Spațiu de lucru

dm_model

Parametru nou (≤1)

Motivație fizică (nucleu)

Principiu de implementare (ușor de auditat)

DM_RAZOR

NFW (c–M fix, fără dispersie)

Bază minimală și auditabilă de halo LambdaCDM; folosită ca o comparație strictă cu EFT

Mapare comună fixă; registru strict al parametrilor; folosită doar ca bază de comparație relativă

DM_RAZOR_SCAT

NFW + dispersie c–M(legacy)

σ_logc

Relația c–M are dispersie; este aproximată printr-o dispersie log-normală cu un parametru

≤1 parametru nou; folosește în continuare maparea comună; câștigul de închidere este criteriul de acceptare

DM_RAZOR_AC

NFW + contracție adiabatică(legacy)

α_AC

Căderea barionică spre interior poate produce contracție adiabatică a haloului; este aproximată printr-o intensitate cu un parametru

≤1 parametru nou; maparea rămâne neschimbată; raportează schimbările AICc/BIC și câștigul de închidere

DM_RAZOR_FB

NFW + nucleu de feedback(legacy)

log r_core

Feedbackul poate crea un nucleu interior; este aproximat printr-o scară de nucleu cu un parametru

≤1 parametru nou; aceeași încadrare de închidere/control negativ; îmbunătățirea RC-only nu este singurul obiectiv

DM_HIER_CMSCAT

Dispersie c–M ierarhică + prior

σ_logc(hier)

O formă ierarhică mai standard c_i∼logN(c(M_i),σ_logc); afectează posteriorul comun RC și GGL

Prior explicit; c_i latent marginalizat; rămâne cu dimensionalitate redusă și auditabil

DM_CORE1P

Proxy de nucleu cu 1 parametru (inspirat de coreNFW/DC14)

log r_core

Folosește un proxy de nucleu cu un parametru pentru efectul principal al feedbackului barionic, evitând detaliile de mare dimensionalitate ale formării stelare

Citează literatura standard; ≤1 parametru nou; legat de testul de închidere

DM_RAZOR_M

NFW + termen nuisance de calibrare a forfecării de lentilare

m_shear(GGL)

Absoarbe o sistematică-cheie de pe partea lentilării slabe cu un parametru efectiv, reducând riscul de a trata sistematicile ca fizică

Termenul nuisance este înregistrat explicit; nu i se permite să reacționeze înapoi asupra RC; rezultatele sunt judecate în principal după robustețea închiderii

DM_STD

Bază DM standardizată (HIER_CMSCAT + CORE1P + m)

σ_logc + log r_core (+ m_shear)

Aduce cele trei obiecții cele mai comune într-o singură bază standardizată, încă de dimensionalitate redusă

Raportează împreună registrul parametrilor și criteriile informaționale; închiderea este metrica principală; este folosită ca cea mai puternică comparație de apărare DM

Tabelul B1 | Tabloul de scor P1A (mai mare este mai bine; păstrat din Anexa B a raportului original)

Ramură de model (spațiu de lucru)

Δk

Cel mai bun logL_RC RC-only (Δ)

Forța de închidere ΔlogL_closure (Δ)

Cel mai bun logL_total comun (Δ)

DM_RAZOR

0

-15702.654 (+0.000)

122.205 (+0.000)

-27347.068 (+0.000)

DM_RAZOR_SCAT

1

-15702.294 (+0.361)

121.236 (-0.969)

-23153.311 (+4193.758)

DM_RAZOR_AC

1

-15703.689 (-1.035)

121.531 (-0.674)

-23982.557 (+3364.511)

DM_RAZOR_FB

1

-15496.046 (+206.609)

129.454 (+7.249)

-27478.531 (-131.463)

DM_HIER_CMSCAT

1

-15702.644 (+0.010)

121.978 (-0.227)

-23153.160 (+4193.908)

DM_CORE1P

1

-15723.158 (-20.504)

122.056 (-0.149)

-27336.258 (+10.810)

DM_RAZOR_M

0 (+m)

-15702.654 (+0.000)

122.205 (+0.000)

-27340.451 (+6.617)

DM_STD

2 (+m)

-15832.203 (-129.549)

105.690 (-16.515)

-22984.445 (+4362.623)

EFT_BIN

1

-14631.537 (+1071.117)

204.620 (+82.415)

-19001.142 (+8345.926)

Cum se citește Tabelul B1 (tabloul de scor P1A)

• Δk: grade de libertate nou adăugate (mai mare înseamnă un model mai complex; mai complex nu înseamnă automat mai bun).

• Concentrați-vă pe două coloane: forța de închidere ΔlogL_closure(Δ) (mai mare înseamnă mai multă autoconsistență a transferului) și cel mai bun logL_total comun (Δ) (scorul total al ajustării comune).

• Valoarea din paranteze, (Δ), este diferența față de DM_RAZOR, ceea ce face comparația directă mai ușoară.

• Întrebarea principală a acestui tabel este dacă avantajul de închidere dispare după ce baza DM este „întărită rezonabil”.

• Sfat de lectură: DM_STD îmbunătățește clar scorul comun, dar forța sa de închidere scade; EFT_BIN rămâne totuși mai sus ca forță de închidere.

Într-o propoziție: în acest set de îmbunătățiri DM cu dimensionalitate redusă și auditabil, îmbunătățirea ajustării comune nu produce automat o închidere mai puternică; închiderea, adică transferabilitatea, rămâne criteriul cheie.


7 | Cum trebuie citite rezultatele principale?

7.1 Ajustarea comună: privit pe ambele seturi de date, scorul comparației principale EFT este mai mare

Tabelul S1a și Figura S4 arată că, sub aceleași date, aceeași mapare comună și aproximativ aceeași scară a parametrilor, familia EFT are un ΔlogL_total comun de 1155–1337 față de DM_RAZOR. Un cititor general poate înțelege astfel: sub aceeași regulă de scor aplicată împreună pe RC și GGL, modelele EFT din comparația principală primesc un scor total mai mare.

7.2 Testul de închidere: ceea ce P1 vrea să sublinieze cel mai mult este „transferabilitatea”

O forță mare de închidere înseamnă că parametrii deduși doar din RC pot prezice mai bine GGL fără a privi din nou datele GGL. În raportul P1, ΔlogL_closure al EFT este 172–281, în timp ce DM_RAZOR este 127. Acest rezultat contează mai mult decât afirmația că „fiecare model își ajustează bine propriile date”, deoarece restrânge libertatea modelului pe al doilea set de date.


7.3 Controlul negativ: de ce este „colapsul semnalului” un lucru bun?

După ce P1 amestecă aleator corespondența grupării RC-bin→GGL-bin, semnalul de închidere al EFT scade în intervalul 6–23. Pentru un cititor general, acest pas seamănă cu o verificare anti-trișare: dacă avantajul de închidere ar fi fost produs doar de cod, unități, tratarea covarianței sau întâmplarea ajustării, avantajul ar putea rămâne chiar și sub o corespondență amestecată. În schimb, avantajul real se prăbușește, arătând că depinde de maparea corectă.

Figura S3 | Forța de închidere (mai mare este mai bine): avantajul mediu al log-verosimilității pentru predicția RC-only → GGL.

Cum se citește această figură

Această figură este nucleul P1. Cu cât bara este mai înaltă, cu atât informația învățată din RC se transferă mai bine către GGL.

Familia EFT este în ansamblu mai sus decât DM_RAZOR, indicând o închidere între sonde mai puternică pentru EFT în experimentul „învață mai întâi RC, apoi prezice GGL”.

Figura S4 | Avantajul ajustării comune (mai mare este mai bine): cel mai bun logL_total RC+GGL față de DM_RAZOR.

Cum se citește această figură

Această figură arată scorul total după combinarea RC și GGL.

Toate modelele EFT sunt mult peste 0, indicând că avantajul EFT în comparația principală nu este un efect local al unui singur punct, ci un tipar general în analiza comună.

Figura R1 | Control negativ: semnalul de închidere scade brusc după amestecarea grupării.

Cum se citește această figură

Această figură arată că, odată ce relația corectă de binning RC↔GGL este perturbată, semnalul de închidere scade brusc.

Aceasta face ca rezultatul P1 să semene mai mult cu o consistență reală în maparea între date, nu cu o coincidență numerică obținută sub mapări arbitrare.


8 | Robustețe și controale: cum evită P1 să fie „doar o ajustare care arată bine”?

Cea mai ușoară obiecție împotriva unui raport tehnic este întrebarea dacă avantajul provine dintr-o singură setare de zgomot, o singură tăiere a datelor din regiunea centrală, o singură tratare a covarianței sau din supraajustare. P1 răspunde la aceasta prin mai multe teste de stres.

Tabelul 2 | Cum trebuie citite testele de robustețe și controalele negative ale P1

Test

Preocuparea pe care încearcă să o elimine

Cum se citește

Scanare σ_int

Dacă RC conține dispersie necunoscută suplimentară, rămâne concluzia stabilă?

După relaxarea erorilor RC, ierarhia EFT și scala avantajului rămân stabile.

Scanare R_min

Dacă regiunile centrale ale galaxiilor nu sunt considerate complet de încredere, rămâne concluzia stabilă?

După eliminarea regiunilor centrale, EFT menține în continuare un avantaj pozitiv.

Scanare cov-shrink

Dacă estimarea covarianței GGL este incertă, rămâne concluzia stabilă?

După contracția covarianței spre diagonală, avantajul nu este sensibil.

Scară de ablație

Se bazează EFT pe complexitate inutilă pentru a forța o ajustare?

EFT_BIN complet este susținut de criteriile informaționale.

Predicție LOO pe date reținute

Explică modelul doar datele pe care le-a văzut deja?

După reținerea unui bin GGL, modelul arată în continuare o performanță puternică de generalizare.

Amestecare RC-bin

Provine închiderea din maparea reală?

Închiderea scade după amestecarea grupării, susținând dependența de mapare.

Figura R2 | Intervalul ΔlogL_total sub scanarea σ_int (mai mare este mai bine).

Cum se citește această figură

Testează dacă avansul EFT rămâne după modificări ale dispersiei intrinseci RC presupuse.

Figura R3 | Intervalul ΔlogL_total sub scanarea R_min (mai mare este mai bine).

Cum se citește această figură

Testează dacă avantajul EFT rămâne stabil după eliminarea regiunilor centrale complexe.

Figura R4 | Intervalul ΔlogL_total sub scanarea cov-shrink (mai mare este mai bine).

Cum se citește această figură

Testează dacă ierarhia este sensibilă la schimbări în tratarea covarianței lentilării slabe.

Figura R5 | Scara de ablație EFT_BIN (AICc, mai mic este mai bine).

Cum se citește această figură

Testează dacă EFT_BIN complet este necesar pentru explicarea datelor, nu doar pentru adăugarea unor parametri inutili.

Figura R6 | LOO: distribuția log-verosimilității pentru bin-urile reținute.

Cum se citește această figură

Testează dacă modelul mai are performanță predictivă pe bin-uri GGL nevăzute.

Figura R7 | Control negativ: maparea amestecată produce o scădere clară a mediei de închidere logL_true.

Cum se citește această figură

Arată în plus, din perspectiva mediei logL_true, că închiderea depinde de maparea corectă între date.


9 | P1A: de ce „mai multe modele DM în anexă” este o corecție cheie

Această secțiune nu întreabă: „A depășit EFT doar o singură bază minimală DM_RAZOR?” Ea întreabă dacă concluziile testului de închidere și ale ajustării comune se schimbă atunci când baza DM este întărită într-un registru de parametri cu dimensionalitate redusă, reproductibil și clar consemnat (P1A). Cu alte cuvinte, P1A urmărește să reducă obiecția că „ați ales doar o bază DM prea slabă” și mută discuția spre întrebarea dacă comportamentul de închidere rămâne diferit sub un set de îmbunătățiri DM auditabile.

P1A nu este conceput pentru a epuiza toate modelările posibile ale halourilor LambdaCDM și nici nu transformă partea DM într-un ajustor de mare dimensionalitate, imposibil de auditat. El selectează îmbunătățiri cu dimensionalitate redusă și reproductibile, cu un registru clar al parametrilor: dispersia concentrației, contracția adiabatică, nucleul de feedback, priorul ierarhic pentru dispersia c–M, proxy-ul de nucleu cu un parametru, termenul nuisance de calibrare a forfecării în lentilarea slabă și baza combinată DM_STD.

Lectura principală a P1A

Dintre cele trei ramuri legacy, doar feedback/core produce o mică creștere netă a forței de închidere; SCAT și AC nu produc câștiguri nete de închidere.

DM_HIER_CMSCAT, DM_RAZOR_M și DM_CORE1P au un efect foarte mic asupra forței de închidere sau nu arată o îmbunătățire netă semnificativă.

DM_STD poate îmbunătăți substanțial logL comun, dar forța sa de închidere scade, sugerând că îmbunătățește în principal flexibilitatea ajustării comune, nu puterea de predicție prin transfer RC→GGL.

EFT_BIN păstrează în continuare o forță de închidere mai mare și un avantaj de ajustare comună în Tabelul B1 din P1A; prin urmare, afirmația centrală a P1 nu trebuie redusă la „a depășit doar DM_RAZOR minimal”.

Figura B1 | Tabloul de scor P1A: închidere și ΔlogL comun față de bază (mai mare este mai bine).

Cum se citește această figură

Această figură arată performanța mai multor ramuri de îmbunătățire DM față de bază.

Sensul ei nu este „toată DM este exclusă”, ci acesta: în cadrul îmbunătățirilor DM cu dimensionalitate redusă și auditabile selectate de P1A, întărirea DM nu elimină avantajul de închidere al EFT_BIN.


10 | De ce contează experimentul P1

10.1 Semnificație metodologică: plasarea „închiderii între sonde” deasupra „ajustării pe o singură sondă”

Teoria la scară galactică se poate bloca ușor în întrebarea dacă un model poate ajusta un anumit set de curbe de rotație. P1 ridică întrebarea cu un nivel: pot parametrii învățați din RC să prezică lentilarea slabă fără reoptimizare pe GGL? Aceasta transformă P1 dintr-un „concurs de ajustare” într-un „test de predicție prin transfer”.

10.2 Semnificație pentru transparență: tratarea lanțului de reproductibilitate ca parte a rezultatului

O contribuție importantă a P1 este că publică împreună datele, tabelele și figurile, etichetele rulărilor, controalele negative, pachetul de reproducere și lanțul de audit. Acest lucru contează atât pentru susținători, cât și pentru critici: discuția se poate întoarce la aceleași date publice, aceeași mapare, aceleași scripturi și aceleași metrici, în loc să compare slogane.

10.3 Semnificație fizică: un test de stres puternic pentru direcțiile de „gravitație fără materie întunecată”

În direcțiile de gravitație fără materie întunecată, multe modele pot explica o parte din curbele de rotație sau din RAR. Sarcina mai dificilă este să treacă și citirile de lentilare slabă și să arate, sub controale negative, că semnalul depinde de maparea corectă. P1 contează deoarece așază răspunsul gravitațional mediu al EFT într-un protocol asemănător unui examen extern: RC este terenul de antrenament, GGL este terenul de transfer, iar amestecarea este terenul anti-trișare.

10.4 Este acesta un experiment important pentru domeniul „gravitației fără materie întunecată”?

Formulat cu prudență: dacă procesarea datelor, pachetul de reproducere și protocolul de închidere ale P1 rezistă unei evaluări externe, atunci P1 poate fi privit ca un experiment de închidere RC+GGL care merită luat în serios în direcțiile de gravitație fără materie întunecată / gravitație modificată. Importanța lui nu stă în sloganul „materia întunecată a fost răsturnată”, ci în oferirea unui criteriu între sonde care poate fi replicat, contestat și extins.

Există deja cadre de predicție-închidere RC+GGL la același nivel?

Există cadre și tradiții observaționale relevante: MOND/RAR organizează bine multe fenomene ale curbelor de rotație; lucrarea KiDS-1000 asupra RAR prin lentilare slabă a comparat, de asemenea, MOND, gravitația emergentă Verlinde și modelele LambdaCDM; LambdaCDM poate explica și unele fenomene de lentilare slabă/dinamice prin conexiuni galaxie–halo, halouri de gaz și modelare de feedback.

Dar afirmația precisă a P1 nu este că „niciun alt cadru din lume nu poate explica RC+GGL”. Mai degrabă, sub propriul protocol public al P1 — mapare fixă, închidere RC-only→GGL, controale negative prin amestecare, registru de parametri și teste de stres multi-DM în P1A — EFT raportează o performanță de închidere mai puternică.

Cu alte cuvinte, partea din P1 care merită cel mai mult testare externă este protocolul său concret și reproductibil de comparație. Un pas următor foarte valoros este să se vadă dacă MOND/RAR, LambdaCDM/HOD, simulările hidrodinamice sau alte cadre de gravitație modificată pot atinge scoruri de închidere egale sau mai mari sub același protocol.


11 | Ce poate concluziona P1 și ce nu poate concluziona?

Tabelul 3 | Limitele concluziilor P1

Se poate concluziona

Sub datele RC+GGL, maparea fixă și protocolul principal de comparație ale P1, familia EFT are scoruri de ajustare comună și forță de închidere mai mari decât DM_RAZOR minimal.

Se poate concluziona

În intervalul de îmbunătățiri DM cu dimensionalitate redusă și auditabil al P1A, mai multe îmbunătățiri DM nu elimină avantajul de închidere al EFT_BIN.

Se poate concluziona

Controlul negativ prin amestecare arată că semnalul de închidere depinde de maparea corectă între date și nu poate fi obținut sub mapări arbitrare.

Nu se poate concluziona

Nu se poate spune că P1 a răsturnat toate modelele de materie întunecată. P1A încă nu epuizează nesfericitatea, dependența de mediu, conexiunile complexe galaxie–halo, feedbackul de mare dimensionalitate sau simulările cosmologice complete.

Nu se poate concluziona

Nu se poate spune că întregul cadru EFT a fost dovedit din principii prime. P1 testează doar stratul fenomenologic al răspunsului gravitațional mediu.

Nu se poate concluziona

Nu se poate spune că toate sistematicile au fost excluse. P1 oferă dovezi de robustețe doar în limitele testelor de stres enumerate și ale sferei de audit.


12 | Întrebări frecvente ale cititorilor generali

Î1: Spune aceasta că „materia întunecată nu există”?

Nu. Concluziile P1 trebuie limitate la datele, protocolul și modelele de comparație folosite aici. P1A trece dincolo de DM_RAZOR minimal, dar tot nu reprezintă toate modelele posibile de materie întunecată.

Î2: Spune aceasta că „EFT a fost dovedită”?

Tot nu. P1 testează EFT ca parametrizare a răspunsului gravitațional mediu și arată o performanță mai puternică în închiderea RC→GGL; mecanismul microscopic și teoria completă nu fac parte din concluzia P1.

Î3: De ce nu se raportează direct o valoare de semnificație în σ?

P1 folosește scoruri unificate de verosimilitate, criterii informaționale și diferențe de închidere. ΔlogL este un avantaj relativ sub aceeași regulă de scor; nu este echivalent cu o singură valoare σ.

Î4: De ce se amestecă RC-bin→GGL-bin?

Acesta este un control negativ. Un semnal real între sonde ar trebui să depindă de maparea corectă; dacă rămâne la fel de puternic după amestecare, aceasta ar sugera mai degrabă o posibilă părtinire de implementare sau un semnal statistic fals.

Î5: Ce ar trebui să facă P1 în continuare?

Să extindă același protocol la mai multe date, mai multe comparații DM, sistematici mai complexe și mai multe cadre de gravitație modificată — mai ales în moduri care permit echipelor externe să retesteze sub aceeași metrică de închidere.


13 | Mini-glosar

Tabelul 4 | Mini-glosar

Termen

Explicație într-o propoziție

Curbă de rotație (RC)

Relația rază–viteză de rotație într-un disc galactic, folosită pentru a deduce gravitația efectivă din interiorul discului.

Lentilare slabă (GGL)

O măsură a distribuției gravitaționale/de masă medii din jurul galaxiilor de prim-plan, obținută prin distorsiunea statistică a formelor galaxiilor de fundal.

Test de închidere

Folosește posteriorul RC pentru a prezice GGL, apoi îl compară cu controlul negativ produs de maparea amestecată.

Control negativ

Rupe deliberat o structură cheie pentru a vedea dacă semnalul dispare; este folosit pentru a exclude semnalele false.

Halo NFW

Un profil de densitate al haloului de materie întunecată folosit frecvent în modelele de materie întunecată rece.

Relația c–M

Relația dintre concentrația c a haloului de materie întunecată și masa M; faptul că se permite sau nu dispersie afectează flexibilitatea modelului.

DM_STD

Ramura standardizată de test de stres DM din P1A care combină mai multe îmbunătățiri DM cu dimensionalitate redusă și un termen nuisance de lentilare.

ΔlogL

Diferența de log-verosimilitate dintre două modele sub aceeași regulă de scor; o valoare pozitivă înseamnă că primul este mai bun.

Covarianță

O descriere matricială a corelațiilor dintre punctele de date; datele de lentilare slabă necesită de obicei covarianța completă.


14 | Traseu de lectură sugerat și puncte de intrare pentru citare

1. Citiți mai întâi secțiunile 0–2 ale acestui ghid pentru a stabili întrebarea P1 și rolul deliberat restrâns al EFT în P1.

2. Apoi citiți Figura S3, Figura S4 și Tabelele S1a/S1b pentru a înțelege forța de închidere, ajustarea comună și controalele negative.

3. Dacă vă preocupă faptul că „baza DM este prea slabă”, mergeți direct la Secțiunea 9 și la Tabelul B1 / Figura B1.

4. Pentru verificare tehnică, reveniți la raportul tehnic P1 v1.1, la suplimentul de tabele și figuri și la full_fit_runpack.

Puncte principale de intrare în arhivă

Raport tehnic P1 (nivel de lansare, Concept DOI): 10.5281/zenodo.18526334

Pachet complet de reproducere P1 (Concept DOI): 10.5281/zenodo.18526286

Baza de cunoștințe structurată EFT (opțional, Concept DOI): 10.5281/zenodo.18853200

Notă privind licența: raportul tehnic folosește CC BY-NC-ND 4.0; pachetul complet de reproducere folosește CC BY 4.0 (consultați raportul tehnic și arhivele Zenodo ca surse authoritative).


15 | Referințe și context extern

McGaugh, S. S., Lelli, F., & Schombert, J. M. (2016). The Radial Acceleration Relation in Rotationally Supported Galaxies. Physical Review Letters, 117, 201101. DOI: 10.1103/PhysRevLett.117.201101.

Famaey, B., & McGaugh, S. S. (2012). Modified Newtonian Dynamics (MOND): Observational Phenomenology and Relativistic Extensions. Living Reviews in Relativity, 15, 10. DOI: 10.12942/lrr-2012-10.

Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.

Mistele, T., McGaugh, S., Lelli, F., Schombert, J., & Li, P. (2024). Indefinitely Flat Circular Velocities and the Baryonic Tully-Fisher Relation from Weak Lensing. The Astrophysical Journal Letters, 969, L3 / arXiv:2406.09685.

Bullock, J. S., & Boylan-Kolchin, M. (2017). Small-Scale Challenges to the LambdaCDM Paradigm. Annual Review of Astronomy and Astrophysics, 55, 343–387. DOI: 10.1146/annurev-astro-091916-055313.

Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.

Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493.

Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374.