Küsimus:
Kas juhuslikud vead on tingimata Gaussi?
Meep
2018-04-19 20:00:13 UTC
view on stackexchange narkive permalink

Olen näinud, et juhuslikud vead on määratletud kui need, mis keskmiselt 0-ni, kui mõõtmiste arv läheb lõpmatusse, ja et viga on võrdselt tõenäoline ka positiivne või negatiivne.Selleks on vaja ainult sümmeetrilist tõenäosuse jaotust nulli ümber.Kuid sisestades selle küsimuse Google'i, ei leidnud ma ühtegi allikat, mis viitas juhuslikele vigadele, mis võiks olla midagi muud kui gaussian.Miks peavad juhuslikud vead olema gaussilised?

See matemaatiliste virnade vahetamise küsimus võib huvi pakkuda: https://math.stackexchange.com/questions/2379271/why-do-bell-curves-appear-everywhere
Kommentaarid pole pikendatud arutelu jaoks;see vestlus on [vestlusesse teisaldatud] (https://chat.stackexchange.com/rooms/76300/discussion-on-question-by-21joanna12-are-random-errors-necessially-gaussian).
Tere.Kuigi minu vastus sai palju hääli, olen ma mures, et see ei pruugi ilmselgelt seda küsimust lahendada.Palun andke meile teada, kui vajate lisateavet.
Juhuslikud vead pole * kunagi * Gaussi.[Kõik statistilised mudelid on valed] (https://et.wikipedia.org/wiki/All_models_are_wrong), kuid mõned neist on kasulikud.Vigade modelleerimine Gaussianina on enamasti kasulik.
Võite proovida guugeldada "mitte-Gaussi müra"
Seitse vastused:
DanielSank
2018-04-19 21:39:11 UTC
view on stackexchange narkive permalink

Kas juhuslikud vead on tingimata gaussilised?

Vead on väga sageli Gaussi, kuid mitte alati. Siin on mõned füüsikalised süsteemid, kus juhuslikud kõikumised (või "vead", kui olete muutuva asjaga seotud kontekstis, on viga) ei ole Gaussi:

  1. Valguse käes oleva fotodetektori klikkide vaheliste aegade jaotus on eksponentsiaaljaotus. $ ^ {[a]} $

  2. Fotodetektori kindla aja jooksul klõpsamiste arv on Poissoni jaotus.

  3. Ühtlaselt jaotatud nurga vigade tõttu nurgast sihtmärki tabava valgusvihu asukoha nihe on Cauchy jaotus.

Olen näinud, et juhuslikud vead on määratletud kui sellised, mis keskmiselt 0-ni, kui mõõtmiste arv läheb lõpmatusse, ja et viga on võrdselt tõenäoline ka positiivne või negatiivne. Selleks on vaja ainult sümmeetrilist tõenäosuse jaotust umbes nulli kohta.

On jaotusi, mille positiivne ja negatiivne külg on võrdse kaaluga, kuid pole sümmeetrilised. Näide: $$ P (x) = \ vasakule \ {\ algab {massiiv} {ll} 1/2 & x = 1 \\ 1/4 & x = -1 \\ 1/4 & x = -2 \,. \ end {array} \ right. $$

Kuid selle küsimuse Google'i sisestades ei leidnud ma ühtegi allikat, mis pakuks, et juhuslikud vead võiksid olla midagi muud kui gaussian. Miks peavad juhuslikud vead olema gaussilised?

Asjaolu, et viiteid mitte-Gaussi juhuslikele vigadele pole lihtne leida, ei tähenda, et kõik juhuslikud vead oleksid Gaussi-tüüpi :-)

Nagu teistes vastustes mainitud, on paljud jaotused looduses Gaussi keskse piirteoreema tõttu. Keskne piirteoreem ütleb, et antud juhusliku muutuja $ x $ järgi, mis on jaotatud vastavalt funktsioonile $ X (x) $, kui $ X (x) $ on piiratud teine ​​hetk, siis antakse veel üks juhuslik muutuja $ y $ määratletakse paljude $ x $ esinemiste keskmisena, st $$ y \ equiv \ frac {1} {N} \ sum_ {i = 1} ^ N x_i \,, $$ jaotus $ Y (y) $ on Gaussi.

Asi on selles, et paljud füüsikalised protsessid on väiksemate protsesside summad. Näiteks on takisti kõikuv pinge paljude üksikute elektronide pingete summa. Seega, kui mõõdate pinget, saate aluseks oleva "staatilise" väärtuse, millele lisandub mõni juhuslik viga, mille tekitavad mürarikkad elektronid, mis keskse piirteoreemi tõttu on jaotatud Gaussi järgi. Teisisõnu, Gaussi jaotused on väga levinud , sest nii paljud looduse juhuslikud asjad pärinevad paljude väikeste panuste summast.

Siiski

  1. On palju juhtumeid, kus aluseks oleva veamehhanismi komponentidel on jaotus, millel puudub lõplik teine ​​hetk; Cauchy jaotus on kõige tavalisem näide.

  2. On ka palju juhtumeid, kus viga pole lihtsalt paljude väikeste aluseks olevate panuste summa.

Mõlemad neist juhtudest toovad kaasa mitte-Gaussi vead.

$ [a] $: vaadake seda teist Stack Exchange'i postitust.

Tõsi, need mõõtmised ei ole jaotatud Gaussi järgi;ma pole siiski kindel, kas OP neid vigadeks peaks, kuna need pole nullkesksed.
Fotodetektori ajamõõtmistes võite näha juhuslikke (Gaussi) vigu (jaotises (1)), nii et mõõdetud vahejuhtumid ei ilmunud _ täpselt_ eksponentsiaalselt jaotatuna.Ma arvan, et see oli pigem selline asi, mille kohta OP küsis.
@HelloGoodbye Kõike saab muuta nullkeskseks, lahutades keskmise, mis, muide, võibki olla põhjuseks, miks mõned neist kogustest võivad osutuda "vigadeks".Kui mul on mingi footondetektori keskmine vool, siis sellel keskmisel "veal" on tuvastatud üksikute footonite Poissoni statistika tõttu nn lasumürast pärit komponent.
@EthanBolker Võib-olla.Tahaksin OP-lt teada saada, kas nad tahavad rohkem arutleda konkreetsete juhtumite üle, kus stohhastiline kogus näeb välja nagu "viga".
@EthanBolker teine asi on see, et ma võiksin teilt küsida * miks * on ajastuse mõõtmistes Gaussi vead ja vastus taandub mõnele muule füüsilisele protsessile, millel on Gaussi statistika, nagu selles vastuses kirjeldatud Johnsoni müra.
Lisan, et väga sageli eeldame *, et juhuslikud vead on gaussilised (või väga lähedased gaussilikkusele), kuna oleme võimelised saadud analüüsi ja integraale väga hästi manipuleerima.Sageli on jaotused, mis viga paremini iseloomustavad, samuti liiga keerulised, et saaksime analüütiliselt uurida
Oluline erinevus: juhuslikud asjad looduses tulenevad paljude väikeste * enamasti sõltumatute * panuste summast.Lõpliku dispersiooni eeldus on enamasti matemaatiline tehnilisus, kuid panuste sõltumatus või halvimal juhul nõrk sõltuvus on olukorra väga füüsiline aspekt.
Tere- OP siin - aitäh kõigi vastuste eest.Mulle tundub, et eksperimentaalsete mõõtmiste puhul on asja tuum keskne piirteoreem.Kuid ma arvan, et J.G tõi välja huvitava punkti;Ma ei olnud varem mõelnud eksperimentaalse parameetri väärtuse jaotuse ja eksperimentaalse vea eristamise peale.Tegelikult pole erinevus mulle veel 100% selge.Ma arvan, et see puudutab peamiselt seda, kas me püüame leida koguse keskmist väärtust, millel on mõned olulised kõikumised (Johnsoni müra, löögimüra jne) või
kas proovime leida jaotust eksperimentaalsele veale, mis võib tõesti kaasa aidata kvantiteedist endast, millel on põhimõtteline kõikumine, kuid kogusel võib olla ka kindel väärtus, on need vead täielikult pärit muudest allikatest, mille võiks põhimõtteliselt kõrvaldada.Tõsi, enamikul suurustest, mida me proovime mõõta, on tõenäoliselt oma panus mõlemasse ja jaotuse lähedus Gaussile tuleneb sellest, kui palju meil on veaallikaid ja nende enda jaotusi - st keskne piirteoreem.
lmr
2018-04-19 20:08:09 UTC
view on stackexchange narkive permalink

Põhjus on tõenäoliselt keskpiiri teoreem: kui lisate palju sõltumatuid juhuslikke muutujaid, moodustab nende summa normaaljaotuse, sõltumata nende individuaalsetest tõenäosuse jaotustest.See teeb tavalistest jaotustest üsna hea oletuse, kui teil pole teavet vea päritolu kohta või kui teil on mitu veaallikat.Lisaks esinevad reaalprotsessides sageli normaalsed jaotused.

Muidugi, kuid mitte kõigil jaotustel pole lõplikku teist momenti, nii et kõik juhuslike muutujate summad pole Gaussi.Lisaks on palju juhtumeid, kus juhuslikud vead ei tulene väiksemate vigade summast.Seega, kuigi Gaussi jaotused on levinud, pole neil alati õigus.Ma saan aru, et see vastus ütleb, et Gaussi jaotused on hea oletus ja see on tavaliselt * tõsi, kuid mitte alati.
Täpsemalt, kui viga on sõltumatute muutujate summa, nii et igal muutujal on dispersioon, mis on väike osa kogu dispersioonist, on summa lähedane normaaljaotusele.Kui teil on tuhat sõltumatut muutujat ja üks nende variatsioonidest on tuhat korda suurem kui teised, pole see Gaussi, kui see muutuja pole juba Gaussi.
Teil on oma selgitustes õigus, kuid nagu DanielSank märkis - see on tavaliselt hea oletus.Võib-olla liialdas 21joanna12 pisut, kui väitis, et pole olemas ühtegi juhuslikke vigu omavat allikat;) Kuid looduslikult esinevate nähtuste valdav mass järgib Gaussi jaotust.
Selle kontrollimine üldise andmekogumi jaoks on tühine.Paljud inimesed ignoreerivad kõrgemaid hetki.
J.G.
2018-04-19 22:28:59 UTC
view on stackexchange narkive permalink

Siinsed vastused on üldiselt käsitlenud erinevat küsimust, kas empiirilised muutujad peaksid olema Gaussi, kuid 21joanna12 küsis eksperimentaalsete vigade kohta, mis tunnistavad täiesti erinevat analüüsi. Parim ressurss selle küsimuse kohta, mida oskan soovitada, on E T Jaynes'i Tõenäosusteooria: Teaduse loogika 7. peatükk. Lühidalt öeldes on mõjuvaid põhjusi, miks vead on Gaussi (kuigi mitte sõna otseses mõttes alati):

  • Sec. 7.2 võtab arvesse Herschel-Maxwelli tuletust , mis näitab, et dimensiooni $ \ ge 2 $ vektori väärtusega viga koos korreleerimata vigadega ortogonaalses ristkülikus komponentidel ja sfääriliselt sümmeetrilisel jaotusel peab olema Gaussi moodul. (Noh, tegelikult kontrollib raamat sõnaselgelt ainult $ 2 $ -dimensioonilist juhtumit, kuid argumenti saab hõlpsasti laiendada.
  • Sec. 7.3 leiab, et Gaussi tuletis , mis näitab, et Gaussi jaotus on ainus viis, kuidas asukoha parameetri MLE võrdub andmete aritmeetilise keskmega. Tähistus eeldab $ 1 $ -mõõtmelisi andmeid, kuid arvan, et argument üldistub tingimusel, et vea ristkülikukujulised koordinaadid pole korrelatsioonis.
  • Sec. 7.5 arvestab Landau tuletusega , mis esitab Taylori-seeria argumendi, et 1D vea $ e $ lõpliku dispersiooni ja nullkeskmise korral on pdf , öelge $ p $ , mis vastab difusioonivõrrandile $ \ osaline _ {\ sigma ^ 2} p = \ frac {1} {2} \ partial_e ^ 2 p $ dispersioonparameetriga $ \ sigma ^ 2 $ . Nõue, et $ \ sigma ^ 2 = 0 \ viitab p (e) = \ delta (e) $ , tähendab siis, et lahendus on Gaussi.
  • Sec.7.9 näitab, et ilma eelneva teabeta on 1D vea jaotusel järgmine omadus, kui see pole Gaussi: ainulaadne valik $ w_i \ ge 0 $ koos $ \ sum_i w_i = 1 $ , mis minimeerib valimi keskmise prognoosija variatsiooni $ \ sum_i w_i x_i $ ja $ x_i $ meie $ n $ empiirilised andmed on $ w_i= n ^ {- 1} $ .
  • Seotud punkt, mida käsitletakse peatükis Sec.7.11 on see, et antud lõpliku keskmise ja dispersiooni viga maksimeerib selle entroopia tingimusel, et teave, kui selle jaotus on Gaussi.Jaynes väidab, et mis tahes entroopiat maksimeerimata mudel liialdab, kui palju võime järeldada oma piiratud teadmistest.

Lühike Sec.7.12 (mille ma täielikult reprodutseerin) toob näiteid, kus me ei oota Gaussi vigu:

Kui oleme mõistnud Gaussi järelduse edukuse põhjuseid, võime näha ka väga haruldasi erijuhtumeid, kus erinev valimijaotus väljendaks paremini meie teadmisi. Näiteks kui me teame, et vead tekivad mõne väikese objekti vältimatu ja kontrollimatu pööramise teel, nii et kui see on nurga all $ \ theta $ span >, viga on $ e = \ alpha \ cos \ theta $ , kuid tegelik nurk pole teada, väike analüüs näitab, et eelnev tõenäosuse omistamine $ p (e | t) = (\ pi \ sqrt {\ alpha ^ 2-e ^ 2}) ^ {- 1}, \, e ^ 2< \ alpha ^ 2 $ , kirjeldab õigesti meie teadmisi vea kohta. Seetõttu tuleks seda kasutada Gaussi jaotuse asemel; kuna sellel on terav ülemine piir, võib see anda tunduvalt paremaid hinnanguid kui Gaussi hinnang - isegi kui $ \ alpha $ pole teada ja seetõttu tuleb seda hinnata andmete põhjal ( või võib-olla on see huvipakkuv parameeter, mida tuleb hinnata).

Või kui vea teadaolevalt on vorm $ e = \ alpha \ tan \ theta $ , kuid $ \ theta $ pole teada, leiame, et eelnev tõenäosus on Cauchy jaotus $ p (e | I) = \ pi ^ {- 1} \ alpha / (\ alfa ^ 2 + e ^ 2) $ . Kuigi see juhtum on haruldane, leiame, et see on õpetlik analüüs Cauchy valimi põhjal järelduste analüüsimiseks levitamine, sest võib juhtuda kvalitatiivselt erinevaid asju. Õigeusk peab seda kui patoloogilist, erandlikku juhtumit, nagu üks kohtunik ütles, kuid see ei tekita Bayesi analüüsis raskusi, mis võimaldab meil sellest aru saada.

Pange tähele, et nendes näidetes kasutatakse samu Bayesi võtteid nagu Sec. 7.11.

Ma pole nii kindel, et mõõtmisvigadel ja füüsikaliste suuruste kõikumistel on vahe.Mõõteaparaadid on ju füüsikalised süsteemid.
@DanielSank üsna.Kuid paljud sellel lehel käsitletud muutujad ei kuulu sellisesse kategooriasse.
Kas saaksite tuua näite?
@DanielSank Klikkide arv.
Mis võimalikus mõttes pole klikkide arv aluseks oleva füüsilise protsessi tulemus?
Mõistan, et teatud algebralised toimingud toovad eelistatavalt Gaussi jaotusi isegi paljude erinevate sisendite ulatuses.Ma arvan, et teised vastused osutavad sellele oma viidetes kesksele piirteoreemule, mis on samas vaimus kui selle vastuse viide nt.Herschel-Maxwelli tuletis.Selle vastuse puhul on jutumärkide kasutamine teiste vastuste nimetamisel "vastused" põhjendamatu ja see aitab ainult seda, et see postitus kõlaks tarbetult vastandlikult ja ei tooks lugejale mingit kasu.
@DanielSank Olen need eemaldanud.Ma ei tahtnud öelda, et loendused pole füüsilised;Ma mõtlesin, et need ei kuulu kumbagi kategooriasse, mis teie sõnul palju ei erine.Esialgne küsimus puudutas, kas statistilised vead on Gaussi omad.Klikkide arv pole viga.
JohnS
2018-04-19 20:30:34 UTC
view on stackexchange narkive permalink

On palju näiteid füüsikalistest nähtustest, mida näib reguleerivat mitte Gaussi statistika.Näiteks Levy jaotus tekib valguse mitmekordsel hajutamisel häguses keskkonnas, kus footoni raja pikkus järgib seda jaotust.

Ma arvan, et igal ajal, kui teil on haruldasi, kuid olulisi sündmusi, näete statistikat, mis ei ole Gauss, näiteks päikeseplekkide jaotuse, geomagnetiliste pöörete vahelise aja jne kohta. Gaussian on tore, kuna see viib suhteliselt lihtsate analüütiliste tulemusteniarvutused (lisaks juba toodud põhjustele).Dünaamilistes süsteemides reguleeritakse energia tasemevahesid (universaalselt) Poasoni statistikaga mittekaootiliste süsteemide korral ja Wigneri tüüpi statistikat kaootiliste süsteemide puhul.

Kogu Levy lendude ala on tohutu.Eriti laserjahutuses.See raamat on suurepärane: Lévy statistika ja laserjahutus: kuidas haruldased sündmused toovad aatomid puhkama

Michael Hardy
2018-04-19 23:12:01 UTC
view on stackexchange narkive permalink

Siin ilmuvad erinevad vastused; Lisan midagi, mida siin veel pole.

Esiteks, selleks, et juhuslike vigade väärtus oleks eeldatavalt 0 $ ja nende positiivne või negatiivne tõenäosus oleks võrdne, pole ka vajalik, et nende jaotus oleks sümmeetriline umbes 0 dollarit. $ Palju on lihtne leida vastunäiteid sellele.

Oletame nüüd $$ Y_i = \ alpha_0 + \ alpha_1 x_ {1, i} + \ cdots + \ alpha_p x_ {p, i} + \ varepsilon_i \ text {for} i = 1, \ ldots, n. $$ Eeldame
  • Vead $ \ varepsilon_i $ on juhuslikud; terminid $ \ alpha_0 + \ alpha_1 x_ {1, i} + \ cdots + \ alpha_p x_ {p, i} $ ei ole. "Juhuslik" tähendab tegelikult iga kord, kui võtate uue valimi $ (Y_1, \ ldots, Y_n) $, siis muutuvad vead $ n $, sõltumata sellest, mis need olid varasemate $ n $ vaatluste proovide korral. Kuid $ n \ korda p $ numbrid $ x_ {1, i}, \ ldots, x_ {p, i} $ for $ i = 1, \ ldots, n $ ei muutu; seega pole need juhuslikud.

  • Iga vea eeldatav väärtus on $ 0. $

  • Kõigil vigadel on sama dispersioon $ \ sigma ^ 2. $
  • Vead pole omavahel korrelatsioonis.

Siin on mõned asjad, mida me ei eeldame:

  • Eeldame, et vead on tavapäraselt jaotatud või kui soovite, siis "Gaussi".
  • Me ei eelda, et kõigil vigadel on sama jaotus.
  • Me eeldame, et vead pole sõltumatud. Korrelatsioon on nõrgem eeldus.

Pange tähele, et $ \ widehat \ alpha_k $ väärtusest $ \ alpha_k $ on lineaarne kombinatsioon $$ c_1 Y_1 + \ cdots + c_n Y_n, \ tag 1 $$, kus koefitsiendid $ c_1, \ ldots, c_n $ sõltub $ n \ korda p $ numbritest $ x_ {1, i}, \ ldots, x_ {p, i} $ for $ i = 1, \ ldots, n. $

Nende eelduste kohaselt võime näidata, et kõigi lineaarsete kombinatsioonide $ (1) $ seas, mis on $ \ alpha_k erapooletud hinnangud, annab $ kõige väiksema ruudu hinnangu see, kellel on väikseim keskmine ruutu hinnanguviga .

See on Gaussi – Markovi teoreem.

Seega pole selle järelduse saamiseks vaja Gaussi jaotust.

user121330
2018-04-23 00:33:40 UTC
view on stackexchange narkive permalink

Gaussi jaotused on sageli ligikaudsed, mis töötavad piisavalt hästi.Positiivne on see, et nende mediaan, keskmine ja režiimid on sümmeetriliselt ühesugused ning dispersiooni leidmise algoritmid ja kõik muud olulised üksikasjad on keskkooli, bakalaureuse ja vähem matemaatikale orienteeritud teadlaste jaoks piisavalt lihtsad.

Allpool on Gaussi jaotuse domeeniks kõik arvud.See on problemaatiline, kui arvestada, et paljud katsed ei saa kunagi anda väärtusi väljaspool teatud vahemikku - nii negatiivseid väärtusi absoluutsete ühikutega (kõrgused, alad, ajad, temperatuurid jne ...) kui ka efektiivsust ja muid ühikuta väärtusi väljaspool $ [0,1] $ on sageli absurdsed.Gausslastel puudub ka mehhanism, mis seletaks viltust või kurtoosi.Me pääseme neist, sest dispersioon on sageli piisavalt madal, et need probleemid ei mõjutaks suuremaid järeldusi.

Juhuslikke vigu ei kirjeldata tavaliselt Gaussi jaotuses, kuid need on sageli piisavalt head.

Steve Byrnes
2018-10-12 18:03:59 UTC
view on stackexchange narkive permalink

Kvantimisvead on levinud praktiline näide ühtlaselt jaotatud juhuslikust veast.

Näiteks on teil digitaalne skaala, mis loetakse täpsusega 0,1 grammi.Selle sisse panite 2,5376 grammi pulbrit ja seal on kiri "2,5".Siis paned peale 3,6264 grammi pulbrit ja seal on kiri "3,6".Ja nii edasi.Teie lugemistel on viga, mis on sel juhul ühtlaselt jaotatud juhuslik arv vahemikus -0,05 kuni +0,05 iga kord.Muidugi pole see sõna otseses mõttes juhuslik - see on sisendi deterministlik funktsioon -, kuid paljudel juhtudel võib seda käsitleda juhuslikult.

(Muidugi, nagu alati, kui arvutada palju kvantimisvigu, läheneb see Gaussianile keskse piirteoreemi järgi.)



See küsimus ja vastus tõlgiti automaatselt inglise keelest.Algne sisu on saadaval stackexchange-is, mida täname cc by-sa 3.0-litsentsi eest, mille all seda levitatakse.
Loading...