Vjerovatni statistički matematički modeli. Teorijski materijal

Pošaljite svoj dobar rad u bazu znanja je jednostavno. Koristite obrazac ispod

Studenti, postdiplomci, mladi naučnici koji koriste bazu znanja u svom studiranju i radu biće vam veoma zahvalni.

Objavljeno na http://www.allbest.ru/

MINISTARSTVO PROSVETE I NAUKERUSIJA

Savezna državna autonomna obrazovna
ustanova visokog stručnog obrazovanja
"Južni federalni univerzitet"

Odsjek za informatičku i mjernu opremu i tehnologiju

Specijalitet

230201 Informacioni sistemi i tehnologije

ESSAY

Predmet: "Organizacija istraživanja i razvoja"

Na temu: "Metode matematičkog modeliranja u statistici"

Završio student: Strotsev Vasily Andreevich

Predavač: Gusenko Tamara Grigorijevna

1. Elementi matematičke statistike

Matematička statistika je grana matematike koja se bavi matematičkim metodama sistematizacije, obrade i upotrebe statističkih podataka za naučne i praktične zaključke. Pod statističkim podacima se ovdje podrazumijeva podatak o broju objekata u bilo kojoj manje ili više obimnoj zbirci koji imaju određene karakteristike.

Glavni cilj matematičke statistike je dobijanje smislenih, naučno zasnovanih zaključaka iz podataka koji su predmet slučajnog raspršivanja. U isto vrijeme, fenomen koji se proučava koji generiše ove podatke često je previše složen da bi se mogao sastaviti njegov puni opis, odražavajući sve detalje. Stoga se statistički zaključci izvode na osnovu nekog matematičkog probabilističkog modela realne slučajne pojave, koji treba da reprodukuje njene bitne karakteristike i isključi one za koje se pretpostavlja da su beznačajne. Metode matematičke statistike omogućavaju određivanje vjerovatnoća karakteristika slučajnih varijabli koje učestvuju u matematičkom modelu koji opisuje ovaj fenomen posmatranjem fenomena koji se proučava.

Zadatak matematičke statistike - uspostavljanje obrazaca kojima su podložni masovni slučajni fenomeni, zasniva se na proučavanju statističkih podataka, rezultata posmatranja, metodama teorije vjerovatnoće. Statistički podaci su podaci dobijeni kao rezultat ispitivanja velikog broja objekata ili pojava; prema tome, matematička statistika se bavi masovnim fenomenima.

Prvi zadatak matematičke statistike je da ukaže na metode prikupljanja i grupisanja statističkih informacija dobijenih kao rezultat posmatranja ili kao rezultat posebno osmišljenih eksperimenata.

Drugi zadatak matematičke statistike je razvoj metoda za analizu statističkih podataka u zavisnosti od ciljeva istraživanja.

Savremena matematička statistika razvija načine za određivanje broja potrebnih testova prije početka studija, tokom studija i rješava mnoge druge probleme. Savremena matematička statistika se definiše kao nauka o donošenju odluka u uslovima neizvesnosti.

Zadatak matematičke statistike je stvaranje metoda za prikupljanje i obradu statističkih podataka za dobijanje naučnih i praktičnih zaključaka.

1.1 Opšti i uzorak skup statističkih podataka

Neka se zahtijeva proučavanje skupa homogenih objekata s obzirom na neku kvalitativnu ili kvantitativnu osobinu koja karakterizira te objekte.

Predmet ili ima ili ne posjeduje kvalitativne karakteristike. Oni nisu direktno mjerljivi (na primjer, sportska specijalizacija, kvalifikacije, nacionalnost, teritorijalna pripadnost, itd.).

Kvantitativne karakteristike su rezultati brojanja ili mjerenja. Shodno tome, dijele se na diskretne i kontinuirane.

Ponekad se radi kompletan pregled, tj. ispitati svaki od objekata populacije s obzirom na obilježje za koje su zainteresovani. U praksi se kontinuirano istraživanje koristi relativno rijetko. Na primjer, ako populacija sadrži vrlo veliki broj objekata, onda je fizički nemoguće provesti kompletnu anketu. U takvim slučajevima, ograničen broj objekata se nasumično bira iz cijele populacije i podvrgava proučavanju. Razlikovati opštu i uzorkovanu populaciju.

Skup uzoraka (uzorak) je skup nasumično odabranih objekata.

Opšti (glavni) skup je skup objekata od kojih je napravljen uzorak.

Obim populacije (uzorak ili opći) je broj objekata u ovoj populaciji. Na primjer, ako se od 1000 dijelova odabere 100 dijelova za ispitivanje, tada je volumen opće populacije N = 1000, a veličina uzorka n = 100. Broj objekata u općoj populaciji N značajno premašuje veličinu uzorka n.

1.2 Metode uzorkovanja

Prilikom sastavljanja uzorka može se postupiti na dva načina: nakon što se objekt odabere i nad njim se izvrši opservacija, on se može vratiti ili ne vratiti općoj populaciji. U skladu sa navedenim, uzorci se dijele na ponovljene i neponovljene.

Ponovljeni uzorak je onaj u kojem se odabrani objekt (prije odabira sljedećeg) vraća općoj populaciji.

Uzorak koji se ne ponavlja je onaj u kojem se odabrani objekt ne vraća općoj populaciji.

Da bi podaci uzorka mogli sa dovoljno pouzdanosti suditi o osobini od interesa u opštoj populaciji, potrebno je da je objekti uzorka ispravno predstavljaju (uzorak mora ispravno predstavljati proporcije opšte populacije). ) - uzorak mora biti reprezentativan (reprezentativan).

Uzorak će biti reprezentativan ako:

Svaki objekat uzorka se bira nasumično iz opšte populacije;

Svi objekti imaju istu vjerovatnoću da budu uključeni u uzorak.

1.3 Načini grupisanja statistike

1.3.1 Diskretna varijantna serija

Obično su dobijeni posmatrani podaci skup nasumično raspoređenih brojeva. Gledajući kroz ovaj skup brojeva, teško je identifikovati bilo kakvu pravilnost u njihovoj varijaciji (promjeni). Za proučavanje obrazaca varijacije u vrijednostima slučajne varijable, obrađuju se eksperimentalni podaci.

Primjer 1. Navedena su zapažanja o broju X ocjene koje su studenti dobili na ispitima. Posmatranja u roku od sat vremena dala su sljedeće rezultate: 3; 4; 3; 5; 4; 2; 2; 4; 4; 3; 5; 2; 4; 5; 4; 3; 4; 3; 3; 4; 4; 2; 2; 5; 5; 4; 5; 2; 3; 4; 4; 3; 4; 5; 2; 5; 5; 4; 3; 3; 4; 2; 4; 4; 5; 4; 3; 5; 3; 5; 4; 4; 5; 4; 4; 5; 4; 5; 5; 5. Evo broja X je diskretna slučajna varijabla, a dobijene informacije o njoj su statistički (posmatrani) podaci.

Raspoređivanjem gore navedenih podataka u neopadajućem redoslijedu i grupiranjem tako da vrijednosti slučajne varijable u svakoj pojedinačnoj grupi budu iste, dobija se rangirana serija opservacijskih podataka.

U primjeru 1 imamo četiri grupe sa sljedećim vrijednostima slučajne varijable: 2; 3; 4; 5. Vrijednost slučajne varijable koja odgovara posebnoj grupi grupisanog niza posmatranih podataka naziva se varijanta, a promjena ove vrijednosti naziva se varijacija.

Varijante su označene malim slovima latinice sa indeksima koji odgovaraju serijskom broju grupe - xi. Broj koji pokazuje koliko puta se odgovarajuća varijanta pojavljuje u nizu opažanja naziva se frekvencija varijante i označava se u skladu s tim - ni.

Zbir svih frekvencija u seriji je veličina uzorka. Odnos frekvencije varijante i veličine uzorka ni/n=wi naziva se relativna frekvencija.

Statistička distribucija uzorka je lista opcija i njihovih odgovarajućih frekvencija ili relativnih frekvencija (Tabela 1, Tabela 2).

Primjer 2. S obzirom na frekvencijsku distribuciju volumenskog uzorka n=20:

Tabela 1

Kontrola: 0,15 + 0,50 + 0, 35 = 1.

Statistička distribucija se takođe može specificirati kao niz intervala i njihovih odgovarajućih frekvencija (učestalost koja odgovara intervalu uzima se kao zbir frekvencija unutar ovog intervala).

Diskretna varijaciona distributivna serija je skup varijanti u rasponu xi sa njihovim odgovarajućim frekvencijama ni ili relativne frekvencije wi.

Za gornji primjer 1, diskretni varijacioni niz ima oblik:

Tabela 3

Kontrola: zbir svih frekvencija serije varijacija (zbir vrijednosti drugog reda tabele 3) je veličina uzorka (u primjeru 1 n=60 ); zbir relativnih frekvencija serije varijacija trebao bi biti jednak 1 (zbir vrijednosti trećeg reda tabele 3)

1.3.2 Serija varijacija intervala

Ako je slučajna varijabla koja se proučava kontinuirana, tada nam rangiranje i grupiranje promatranih vrijednosti često ne dopuštaju da istaknemo karakteristične značajke varijacije njegovih vrijednosti. To se objašnjava činjenicom da se pojedinačne vrijednosti slučajne varijable mogu međusobno razlikovati koliko god se želi, pa se stoga u ukupnosti posmatranih podataka rijetko mogu pojaviti iste vrijednosti veličine, a frekvencije varijanti se malo razlikuju jedna od druge.

Također je nepraktično konstruirati diskretnu seriju za diskretnu slučajnu varijablu, čiji je broj mogućih vrijednosti velik. U takvim slučajevima potrebno je izgraditi intervalnu varijantnu seriju distribucije.

Da bi se izgradio takav niz, cijeli interval varijacije promatranih vrijednosti slučajne varijable dijeli se na nekoliko parcijalnih intervala i izračunava se učestalost pogađanja vrijednosti količine u svakom parcijalnom intervalu.

Intervalni varijacioni niz je uređeni skup intervala varijacije vrijednosti slučajne varijable s odgovarajućim frekvencijama ili relativnim frekvencijama vrijednosti veličine koje spadaju u svaku od njih.

Da biste napravili intervalnu seriju, potrebno vam je:

1. odrediti vrijednost parcijalnih intervala;

2. odrediti širinu intervala;

3. postaviti za svaki interval gornju i donju granicu;

4. grupirati rezultate posmatranja.

1. Pitanje izbora broja i širine intervala grupisanja mora se odlučiti u svakom konkretnom slučaju na osnovu ciljeva studija, veličina uzorka i stepen varijacije osobine u uzorku.

Približan broj intervala k može se procijeniti samo iz veličine uzorka n na jedan od sljedećih načina:

· prema formuli Sturges: k = 1 + 3,32 log n;

koristeći tabelu 1.

Tabela 1

2. Općenito se preferiraju intervali iste širine. Za određivanje širine intervala h izračunati:

raspon varijacija R- vrijednosti uzorka: R = xmax - xmin, gdje xmax I xmin- maksimalne i minimalne opcije uzorka;

širina svakog intervala h određena sljedećom formulom: h = R/k.

3. Donja granica prvog intervala xh1 se bira tako da je minimalna varijanta uzorka xmin pada otprilike u sredini ovog intervala: xh1 = xmin - 0,5 h.

Srednji intervali se dobijaju dodavanjem dužine parcijalnog intervala na kraj prethodnog intervala h:

xhi = xhi-1 +h.

Izgradnja skale intervala na osnovu izračunavanja granica intervala nastavlja se do vrijednosti xhi zadovoljava relaciju:

xhi< xmax + 0,5·h .

4. U skladu sa skalom intervala, vrijednosti atributa se grupišu - za svaki parcijalni interval izračunava se zbir frekvencija ni varijanta uhvaćena i-th interval. U ovom slučaju, interval uključuje vrijednosti slučajne varijable veće ili jednake donjoj granici i manje od gornje granice intervala.

1.4 Poligon i histogram

Radi jasnoće, napravljeni su različiti grafikoni statističke distribucije. Na osnovu podataka diskretnih varijacionih nizova gradi se poligon frekvencija ili relativnih frekvencija.

Poligon frekvencija naziva se izlomljena linija, čiji segmenti spajaju tačke ( x1; n1), (x2; n2),..., (xk; nk). Za izgradnju poligona frekvencija na osi apscise, opcije su ostavljene po strani xi, a na y-osi - odgovarajuće frekvencije ni. Poeni ( xi; ni) povezani su segmentima pravih linija i dobija se frekvencijski poligon (slika 1).

Poligon relativnih frekvencija naziva se izlomljena linija, čiji segmenti spajaju tačke ( x1; W1), (x2; W2),..., (xk; wk). Da biste izgradili poligon relativnih frekvencija na apscisi, odbacite opcije xi, a na y-osi - relativne frekvencije koje im odgovaraju Wi. Poeni ( xi; Wi) su povezani segmentima pravih linija i dobija se poligon relativnih frekvencija. U slučaju kontinuirane karakteristike, preporučljivo je napraviti histogram.

Histogram frekvencije je stepenasta figura koja se sastoji od pravokutnika čije su osnove djelomične dužine h, a visine su jednake omjeru ni/h(gustina frekvencije).

Da bi se napravio histogram frekvencija, parcijalni intervali se iscrtavaju na osi apscise, a segmenti se crtaju iznad njih paralelno sa osom apscise na udaljenosti ni/h.

Područje i hni/h=ni- opcija sume frekvencija i - th interval; dakle, površina histograma frekvencije jednaka je zbiru svih frekvencija, tj. veličina uzorka.

Histogram relativnih frekvencija je stepenasta figura koja se sastoji od pravokutnika čije su osnove djelomični intervali dužine h, a visine su jednake omjeru Wi/h(relativna gustina frekvencije).

Da bi se konstruirao histogram relativnih frekvencija, parcijalni intervali se iscrtavaju na osi apscise, a segmenti se crtaju iznad njih paralelno sa osom apscise na udaljenosti Wi/h(Sl. 2).

Područje i -th parcijalni pravougaonik je jednak hWi / h = Wi- relativna učestalost uhvaćene varijante i-th interval. Dakle, površina histograma relativnih frekvencija jednaka je zbiru svih relativnih frekvencija, tj. jedinica.

1.5 Procjena parametara populacije

Glavni parametri opće populacije su matematičko očekivanje (opći prosjek) M(X) i standardna devijacija s. To su konstante koje se mogu procijeniti iz podataka uzorka. Procjena općeg parametra, izražena jednim brojem, naziva se tačka procjenom.

Tačkasta procjena opće srednje vrijednosti je srednja vrijednost uzorka.

Srednja vrijednost uzorka je aritmetička sredina karakteristike uzorka.

Ako sve vrijednosti x1, x2,..., xn karakteristike uzorka su različite (ili ako podaci nisu grupirani), tada:

x1, x2,..., xn n1, n2,...,nk, i n1 + n2 +...+ nk = n(ili ako je srednja vrijednost uzorka izračunata iz varijacione serije), tada

U slučaju kada su statistički podaci prikazani u obliku intervalne serije varijacije, pri izračunavanju srednje vrijednosti uzorka, vrijednosti varijanti se smatraju sredinom intervala.

Srednja vrijednost uzorka je glavna karakteristika položaja, pokazuje centar distribucije populacije, omogućava vam da okarakterizirate populaciju koja se proučava jednim brojem, pratite trend razvoja, uporedite različite populacije (srednja vrijednost uzorka je tačka, zbir odstupanja posmatranja od kojih je jednaka 0).

Za stopu od stepen disperzije (odstupanja) nekog indikatora od njegove prosječne vrijednosti, uz maksimalne i minimalne vrijednosti, koriste se koncepti disperzije i standardne devijacije.

Varijanca uzorka ili varijansa uzorka (od engleskog variance) je mjera varijabilnosti varijable. Pojam je prvi uveo Fischer 1918.

Varijanca uzorka Dv je aritmetička sredina kvadrata odstupanja posmatranih vrijednosti obilježja od njihove srednje vrijednosti.

Ako sve vrijednosti x1, x2,..., xn karakteristika volumenskog uzorkovanja n drugačije, onda:

Ako su sve vrijednosti atributa x1, x2,..., xn imaju odgovarajuće frekvencije n1, n2,...,nk, i n1 + n2 +...+ nk = n, onda

Disperzija varira od nule do beskonačnosti. Ekstremna vrijednost 0 znači da nema varijabilnosti kada su vrijednosti varijable konstantne.

Standardna devijacija (standardna devijacija), (od engleske standardne devijacije) se izračunava kao kvadratni korijen varijanse.

Što je veća varijansa ili standardna devijacija, to su vrijednosti varijable više raspršene u odnosu na srednju vrijednost.

Neparametarske karakteristike pozicije su mod i medijan.

Moda Mo naziva se varijanta koja ima najveću frekvenciju ili relativnu frekvenciju.

Medijan Ja naziva se varijanta koja dijeli varijantni niz na dva dijela jednaka broju varijanti.

Sa neparnim brojem, opcija (n=2k+1)

Me = xk+1,

a za paran broj opcija (n=2k)

Me = (xk + xk+1)/2.

2. Korelaciona i regresiona analiza

2.1 Analiza korelacije

matematičko statističko grupiranje korelacije

Korelaciona analiza uključuje uspostavljanje statističke veze između slučajnih varijabli. Može se koristiti u pedagoškim istraživanjima za procjenu utjecaja nekih faktora na druge i uspostavljanje odnosa između njih u sprezi s drugim parametrima – matematičkim očekivanjima i standardnim devijacijama. Korelaciona analiza se ne može direktno primeniti na identifikaciju uzročno-posledičnih veza između slučajnih procesa. On samo uspostavlja vezu između statističkih karakteristika povezanih slučajnih procesa.

Neka postoje dvije slučajne varijable X i Y sa matematičkim očekivanjima mx i my. korelacioni momenat

Kxy =M((X-mx)(Y-my))

će karakterizirati odnos između vrijednosti X i Y. Radi lakšeg korištenja, korelacijski momenti su normalizirani formulom

gdje su yx i yy standardne devijacije vrijednosti X i Y. Vrijednost Kk se naziva koeficijent korelacije vrijednosti X i Y.

Za diskretne slučajne varijable s kojima imamo posla, procjena koeficijenta korelacije se izračunava po formuli

Formula za izračunavanje koeficijenta korelacije je važeća pod uslovom da je odnos između slučajnih varijabli linearan i da je svaka od ovih varijabli podložna normalnom zakonu.

Ocijeniti statističku vezu između nivoa školske spreme i napretka učenika prve godine u disciplini „Informatika“ Školska priprema se ocjenjuje testiranjem pri upisu na fakultet (vrijednost X). Uspjeh studenata ocjenjuje se rezultatima ispita nakon prvog semestra (Y vrijednost). Studentski broj je označen kao N.

Početni podaci za proračun su sažeti u tabeli

Zamjenom podataka iz tabele u izraz (1) dobijamo Kk=0,78.

Vidimo da su statističke karakteristike X i Y bliske jedna drugoj.

2.2 Regresiona analiza

Regresiona analiza ima za cilj statističko proučavanje odnosa između zavisne varijable i nezavisne varijable (regresora ili prediktora). U najjednostavnijem slučaju, pretpostavlja se da je ova zavisnost linearna. Rešava se problem konstruisanja linearne zavisnosti oblika y=ax+b, gde su hi i yi nezavisne, odnosno zavisne varijable (i=1,2,3,…). Rješenje se nalazi metodom najmanjih kvadrata. Vrijednost je minimizirana

min su koeficijenti a i b.

Formule izračuna su sljedeće:

U suštini, skup eksperimentalno dobijenih tačaka je približno zamijenjen analitičkom zavisnošću y=ax+b. Takva zamjena uvelike pojednostavljuje matematičke transformacije i može se koristiti u konstrukciji analitičkih modela. U opštem slučaju, ne samo linearna, već i bilo koja druga funkcija može se izabrati za izgradnju zavisnosti regresije. Naravno, formule za izračunavanje potrebnih parametara postaju složenije.

3. Matematičke metode za optimizaciju eksperimenata

3.1 Metoda jednostavne optimizacije

Simpleks je pravilan poliedar koji ima n+1 vrh, gdje P - broj faktora koji utiču na proces. Dakle, na primjer, ako postoje dva faktora, tada je pravilan trokut simpleks.

Rice. 1 Optimizacija simpleks metodom

Početna serija eksperimenata odgovara vrhovima originalnog simpleksa (tačke 1, 2 i 3). Uslovi ovih prvih eksperimenata uzeti su iz raspona vrijednosti faktora koji odgovaraju najpovoljnijem od poznatih načina procesa koji se optimizira. Upoređujući rezultate eksperimenata u tačkama 1, 2 i 3, među njima pronaći onaj „najlošiji“, u smislu izabranog kriterijuma optimalnosti. Neka, na primjer, eksperiment u tački 1. Ovo iskustvo je isključeno iz razmatranja, a umjesto njega, iskustvo u tački se uvodi u simpleks 4, koji je simetričan tački 1 u odnosu na suprotnu stranu trougla koji povezuje tačke 2 I 3.

Zatim se rezultati eksperimenata na vrhovima novog simpleksa međusobno uspoređuju, najuspješniji od njih se odbacuje i odgovarajući vrh simpleksa se prenosi u tačku 5. Zatim se razmatrani postupak ponavlja tokom čitavog procesa optimizacije.

Ako se postigne ekstremum kriterija optimalnosti, daljnje kretanje simpleksa se zaustavlja. To znači da novi korak vraća istraživača na prethodnu tačku u faktorskom prostoru.

Ako postoji nekoliko ekstrema kriterijuma optimalnosti, onda ova metoda omogućava da se pronađe onaj koji je bliži tačkama originalnog simpleksa. Stoga, ako postoji sumnja na postojanje nekoliko ekstrema kriterija optimalnosti, potrebno ih je tražiti, svaki put počevši od optimizacije iz nove regije faktorskog prostora. Zatim treba uporediti pronađene optimalne uslove među sobom i izabrati najbolji od svih opcija.

Optimizacija mora uzeti u obzir ograničenja nametnuta faktorima utjecaja i funkcijama odgovora.

Važno je napomenuti da kada se koristi simpleks metoda nije potrebno dupli eksperimenti. Činjenica je da greška u jednom eksperimentu može samo malo usporiti optimizaciju. Ako se naknadni eksperimenti izvode besprijekorno, onda se nastavlja kretanje ka optimizmu.

Matrica eksperimenata originalnog simpleksa u kodiranim varijablama data je u tabeli 11.

Vrijednosti uključene u ovu tabelu izračunate su pomoću sljedećih formula:

Ovdje je i broj faktora u matrici planiranja. Simbol 0 označava koordinate centra plana, odnosno glavnog nivoa.

Tabela 11

Matrica originalnog simpleksa

Broj iskustva	X2	Funkcija odgovora
	K2
	K2

Eksperimenti prikazani u tabeli. 11 odgovaraju vrhovima simpleksa čija je stranica jednaka jedinici i čiji centar se poklapa sa ishodištem (u kodiranim varijablama).

Rezultati proračuna izvedeni na osnovu tabele. 11 i formule (*) date su u tabeli. 12.

Tabela 12

Uvjeti za početnu seriju eksperimenata

Broj iskustva

Očigledno je da se najveći broj eksperimenata mora izvesti na početku eksperimenta. Zatim se u svakom koraku optimizacije izvodi samo jedan eksperiment.

Za početak optimizacije potrebno je koristiti tabelu. 11 ili 12 izračunajte matricu početne serije eksperimenata u fizičkim varijablama, koristeći formulu

Ubuduće se sve operacije izvode samo sa fizičkim1. varijable.

Uslovi svakog novog iskustva izračunavaju se po formuli:

gdje P-- broj faktora u matrici planiranja;

j -- broj iskustva;

broj i-faktora;

Vrijednost i-tog faktora u "najneuspješnijem" iskustvu prethodnog simpleksa.

Treba napomenuti da se u bilo kom koraku optimizacije koji se izvodi simpleks metodom može uključiti u program istraživanja novi faktor , koji do tada nije uzet u obzir, ali je ostao na konstantnom nivou.

U ovom slučaju, vrijednosti svih prethodno razmatranih faktora izračunavaju se po formuli:

gdje je 1= 1, 2,..., P, to jest, oni su aritmetička sredina odgovarajućih koordinata prethodnog simpleksa.

Vrijednost novouvedenog faktora određena je formulom:

gdje je x0(n+1) glavni nivo ovog faktora;

Dxn+1--odabrani korak varijacije za ovaj faktor;

Rn+1, kn+1 --vrijednosti izračunate po formulama (*).

Imajte na umu da je dodavanje novog faktora punom "faktorskom eksperimentu" praćeno udvostručenjem broja eksperimenata. . U tom smislu, simpleks metoda ima očiglednu prednost. .

Primjer 3.2. Neka je potrebno korištenjem simpleks metode za optimizaciju prinosa ciljnog proizvoda at(%), koji se dobija interakcijom dva reagensa sa koncentracijama x1 i x2 () na temperaturi x3 (°C).

Odabiremo glavne nivoe i korake varijacije faktora i sumiramo ih u tabeli. trinaest.

Tabela 13

Vrijednosti nivoa faktora i koraka varijacije

	Glavni nivo	Korak varijacije

Koristeći formulu (3.5) i tab. 12, izračunajte uslove za prva četiri eksperimenta i rezimirajte rezultate u tabeli. 14. Tako, na primjer, za treće iskustvo

x31=1+0,1*0==1; x32== 1,50 +0,2 (--0,578) == 1,38; x33=60+5*0,204==61.

Tabela 14

Optimizacija simpleks metodom

Broj iskustva				Funkcija odgovora

Upoređujući rezultate prva četiri eksperimenta, vidimo da je najmanji prinos ciljnog proizvoda postignut u trećem eksperimentu. Ovo iskustvo treba isključiti iz daljeg razmatranja.

Zamenimo ga iskustvom 5, uslove za koje ćemo izračunati prema formuli (**):

U novom simpleksu koji su formirali eksperimenti 1, 2, 4 i 5, eksperiment 4 je „najneuspješniji“ Zamijenimo ga eksperimentom 6 čije ćemo uslove pronaći pomoću iste formule (**).

Razmotrimo sada pitanje kako uključiti još jedan faktor u program istraživanja, na primjer, brzinu rotacije miješalice. Do sada neka bude konstantan i jednak 500 rpm Sada ćemo ovu vrijednost smatrati faktorom x4 i za nju uzeti korak varijacije Dx4 == 100 o/min.

Prethodni simpleks za tri faktora (vidi tabelu 14) sastoji se od eksperimenata 1, 2, 5 i 6. Da bismo iz njega dobili novi simpleks za četiri faktora, uvodimo eksperiment 7 (tabela 15).

Tabela 15

Dodavanje novog faktora u program optimizacije

Broj iskustva					Funkcija odgovora

Naći ćemo uslove za izvođenje 7. eksperimenta koristeći formule (3.7) i (3.8):

Hostirano na Allbest.ru

...

Slični dokumenti

Matematičke metode sistematizacije i upotrebe statističkih podataka za naučne i praktične zaključke. Zakon distribucije diskretne slučajne varijable. Koncept opće populacije. Zadaci statističkih posmatranja. Selektivna distribucija.

sažetak, dodan 12.10.2010

Koncept matematičke statistike kao nauke o matematičkim metodama sistematizacije i upotrebe statističkih podataka za naučne i praktične zaključke. Tačkaste procjene parametara statističkih distribucija. Analiza izračunavanja prosjeka.

seminarski rad, dodan 13.12.2014

Matematička statistika kao nauka o matematičkim metodama sistematizacije statističkih podataka, njenih indikatora. Kompilacija integralnih statističkih distribucija populacije uzorka, izrada histograma. Izračunavanje tačkastih procjena parametara.

seminarski rad, dodan 04.10.2011

Primarna analiza i glavne karakteristike statističkih podataka. Tačkaste procjene parametara distribucije. Intervali povjerenja za nepoznato matematičko očekivanje i za standardnu devijaciju. Testiranje statističkih hipoteza.

rad, dodato 18.01.2016

Statistika je nauka o masovnim pojavama u prirodi i društvu; pribavljanje, obrada, analiza podataka. Demografska statistika, prognoza stanovništva za Rusiju. Metode statističke obrade podataka: elementi logike, kombinatorika, teorija vjerovatnoće.

prezentacija, dodano 19.12.2012

Primena specifičnih metoda u statistici u zavisnosti od zadataka. Metode masovnih posmatranja, grupisanja, sumirajući indikatori, vremenske serije, indeksna metoda. Analiza korelacije i disperzije. Proračun prosječnih statističkih vrijednosti.

test, dodano 21.09.2009

Dobijanje statističkih podataka za generalizovani opis stanja i razvoja pojave. Vrste, metode i organizacioni oblici statističkog posmatranja. Statistički oblik, sažetak i grupisanje podataka. Statističke tabele i grafikoni.

sažetak, dodan 12.11.2009

Određivanje matematičkog očekivanja i standardne devijacije u cilju odabira zakona raspodjele za uzorak statističkih podataka o kvarovima elemenata vozila. Pronalaženje broja događaja u datom intervalu; izračunavanje vrijednosti Pearsonovog kriterija.

test, dodano 01.04.2014

Tabelarni način prikaza podataka pravne statistike. Apsolutni i opšti pokazatelji. Relativne vrijednosti, njihove glavne vrste i primjena. Geometrijska sredina, mod i medijan. Metoda selektivnog posmatranja. Klasifikacija serija dinamike.

test, dodano 29.03.2013

Primarna obrada statističkih podataka o broju registrovanih mobilnih pretplatničkih terminala za 2008. godinu na 1000 stanovnika u regionima Rusije. Intervalna procjena parametara. Hipoteza o vrsti distribucije. Regresiona analiza.

4.1.1. statistički model. U statističkom (stohastičkom) modeliranju, glavni objekti modeliranja su slučajni događaji, slučajne varijable i slučajne funkcije.

Prilikom provođenja eksperimenata, istraživač fiksira pojavu ili nepostojanje događaja od interesa, a također mjeri vrijednosti parametara koji su nasumične prirode i, u suštini, su vrijednosti realizacije neke slučajne varijable.

Statističko modeliranje omogućava da se, bez sprovođenja stvarnih eksperimenata na objektu koji se proučava (što u većini slučajeva zahtijeva velike materijalne i finansijske troškove), dobiju relevantne informacije o nastanku ili nepostojanju određenih događaja koji se dešavaju u stvarnom objektu. o uzorku vrijednosti slučajnih varijabli na osnovu dostupnih vjerojatnosnih karakteristika simuliranih događaja i slučajnih varijabli. Ova vrsta modeliranja uključuje preliminarno prikupljanje informacija o simuliranim indikatorima i dalju statističku obradu dobijenih rezultata u cilju dobijanja razumnih statističkih procjena potrebnih za modeliranje vjerovatnostnih karakteristika.

Stohastički modeli se uglavnom koriste u dva slučaja:

1) predmet modeliranja je slabo shvaćen - ne postoje dobro razvijeni kvantitativni obrasci koji opisuju procese i pojave koje se razmatraju, a ne postoji ni način da se pronađe prihvatljivo analitičko rješenje za ovaj problem;

2) simulirani objekat je prilično dobro proučen na deterministički način, ali bez uzimanja u obzir slučajnih faktora koji utiču na procese i pojave koje se proučavaju.

U prvom slučaju, na osnovu verbalnog opisa objekta koji se proučava, odabiru se kvantitativni indikatori sa proračunom njihove fizičke dimenzije, koji se sastoje od dvije grupe. Jedna od grupa se smatra ulaznim vrijednostima modela, a druga - izlaznim vrijednostima. Nadalje, primjenom naučno-teorijskih rezultata drugih istraživača u ovoj oblasti i eventualnom primjenom niza potrebnih pretpostavki, kao i eventualno već dostupnih eksperimentalnih podataka o ulaznim i izlaznim veličinama (na primjer, o njihovim zakonima raspodjele), uspostavljaju se deterministički ili stohastički odnosi između ulaznih izlaznih veličina modela . Skup dobijenih odnosa između ulaznih i izlaznih veličina (obično napisan u obliku jednačina) naziva se statistički model.

Prilikom implementacije statističkog modela, na osnovu odabranih zakona distribucije slučajnih varijabli i odabranih vjerovatnoća simuliranih događaja, metodama matematičke statistike određuju se selektivne eksperimentalne vrijednosti slučajnih varijabli i kvaziempirijskih sekvenci pojavljivanja ili nepostojanja. -izgled simuliranih događaja. Nadalje, prema jednadžbi modela, određuju se odgovarajuće vrijednosti uzorka njegovih izlaznih vrijednosti. A višestruka implementacija konstruisanog modela omogućava istraživaču da izgradi modelski uzorak njegovih izlaznih vrednosti, koji se ponovo podvrgava statističkoj analizi (korelacija, regresija, disperzija, spektralna) kako bi se dobile procene karakteristika izlaznih parametara modelirati ili testirati postavljene hipoteze. Na osnovu dobijenih rezultata donose se zaključci o objektu proučavanja, kao i opravdanja za praktičnu primenu konstruisanog modela.

Metode statističkog modeliranja se široko koriste u rješavanju problema čekanja, teoriji optimizacije, teoriji upravljanja, teorijskoj fizici itd.

Teorijska osnova metode statističkog modeliranja na računaru su granične teoreme teorije vjerovatnoće.

4.1.2. Čebiševljeva nejednakost. Za nenegativnu funkciju slučajne varijable i, nejednakost

4.1.3. Bernulijeva teorema. Ako se provode nezavisna ispitivanja, u svakom od kojih se neki događaj javlja sa vjerovatnoćom , tada relativna čistoća nastanka događaja (broj povoljnih ishoda ispitivanja) pri konvergira vjerovatnoćom na , tj. at

4.1.4. Poissonova teorema. Ako se provode nezavisna ispitivanja i vjerovatnoća da će se događaj desiti u tom ispitivanju je jednaka at

4.1.5. Čebiševljeva teorema. Ako se vrijednosti slučajne varijable promatraju u nezavisnim testovima, tada pri , aritmetička sredina vrijednosti slučajne varijable konvergira po vjerovatnoći njenom matematičkom očekivanju, tj. at

4.1.6. Generalizovana Čebiševljeva teorema. Ako su nezavisne slučajne varijable s matematičkim očekivanjima i varijacijama ograničene odozgo istim brojem, tada za aritmetičku sredinu vrijednosti slučajne varijable konvergira po vjerovatnoći s aritmetičkom sredinom njihovih matematičkih očekivanja

4.1.7. Markova teorema.. Čebiševljev teorem će također vrijediti za zavisne slučajne varijable ako

4.1.8. Centralna granična teorema. Ako su nezavisne identično raspoređene slučajne varijable sa matematičkim očekivanjem i varijansom , tada se za zakon distribucije suma neograničeno približava normalnom zakonu distribucije

gdje je Laplaceova funkcija

4.1.9. Laplaceov teorem. Ako se u svakom nezavisnom ogledu događaj dogodi s vjerovatnoćom , tada

Statističke i probabilističke metode čine metodološku osnovu istoimenog tipa modeliranja. Na ovom nivou formalizacije modela još ne govorimo o otkrivanju zakona koji osigurava eliminaciju neizvjesnosti pri donošenju odluke, ali postoji određeni niz zapažanja ovog sistema ili njegovog analoga, koji nam omogućavaju da izvučemo neke zaključke o prošlom/sadašnjem/budućem stanju sistema, na osnovu hipoteze o nepromjenjivosti njegovog ponašanja.

Kao i uvek, hajde da formulišemo definiciju... Statistički ili probabilistički model (stohastički model) je model koji uzima u obzir uticaj slučajnih faktora u procesu rada sistema, zasnovan na primeni statističke ili probabilističke metodologije u odnosu na pojave koje se ponavljaju.. Ovaj model operiše kvantitativnim kriterijumima pri vrednovanju repetitivnih pojava i omogućava uzimanje u obzir njihove nelinearnosti, dinamike i slučajnih poremećaja postavljanjem hipoteza o prirodi distribucije nekih slučajnih varijabli koje utiču na ponašanje sistema na osnovu analize opservacionih rezultate.

U suštini, probabilistički i statistički modeli se razlikuju po nivou nesigurnosti znanja o modeliranom sistemu koji postoji u trenutku sinteze modela. U slučaju kada su ideje o sistemu više teorijske prirode i zasnivaju se isključivo na hipotezama o prirodi sistema i ometajućim uticajima koji nisu potkrijepljeni rezultatima opservacija, vjerojatnostni model je jedini mogući. Kada u fazi sinteze modela već postoje podaci dobijeni empirijski, postaje moguće pojačati hipoteze zbog njihove statističke obrade. Ovo postaje očigledno ako razmotrimo vezu između metoda matematičke statistike i teorije vjerovatnoće. Matematička statistika je nauka koja proučava metode za otkrivanje obrazaca svojstvenih velikim skupovima homogenih objekata ili događaja, na osnovu njihovog uzorkovanja (ili velikih skupova podataka dobijenih kao rezultat posmatranja istog objekta tokom dovoljno dugog vremenskog perioda). Teorija vjerovatnoće, s druge strane, proučava kvantitativne obrasce praćene slučajnim fenomenima ako su te pojave određene događajima poznate vjerovatnoće. Shodno tome, matematička statistika je veza između teorije vjerovatnoće i fenomena stvarnog svijeta, jer omogućava da se na osnovu analize statističkih podataka formulišu procjene vjerovatnoće određenih događaja.

Može se tvrditi da su statistički modeli posebna vrsta matematičkih modela koji kao ulazne podatke koriste ne samo stvarne podatke o trenutnom stanju objekta, već i podatke koji karakteriziraju stanje bilo drugih objekata ove klase ili ovog objekta, ali na drugačiji trenutak u vremenu. Statistički modeli su primjenjivi za proučavanje masovnih pojava bilo koje prirode, uključujući i one koje ne pripadaju kategoriji vjerovatno određenih (matematička statistika je također pogodna za rješavanje determinističkih problema). Prilikom modeliranja potonjeg, statistički proces se umjetno uvodi u model kako bi se dobile statističke procjene numeričkog rješenja (na primjer, tačnost mjerenja parametara determinističkog procesa).

Metode matematičke statistike i teorije vjerovatnoće mogu se, između ostalog, uvesti u logičke i logičko-lingvističke modele, kao što je navedeno u prethodnom pododjeljku. Na primjer, mogu se razmotriti metode za integraciju statističkih rezultata u modele semantičkih odnosa kako bi se dale različite težine lukovima koji povezuju pojedinačne vrhove. Statističke evaluacije se također mogu uvesti u sisteme prezentacije tezaura kako bi se riješile situacije polisemije bez pribjegavanja procedurama analize konteksta. Drugim riječima, statističke metode mogu činiti osnovu modela i koristiti za modificiranje drugih tipova modela.

Za obradu rezultata opservacija koriste se metode korelacije, regresije, faktorske, klasterske i druge vrste analiza koje operišu sa statističkim hipotezama. Ovdje je dodijeljena posebna uloga statistička metoda ispitivanja (Monte Carlo metoda ). Ovo je metoda za numeričko rješavanje matematičkih problema zasnovana na višestrukom vjerojatnosnom i statističkom modeliranju slučajnih varijabli ili procesa u cilju izgradnje statističkih procjena za željene veličine. Suština metode se sastoji u implementaciji višestruke simulacije slučajnog fenomena pomoću određene procedure koja daje slučajni rezultat. Da bi se to postiglo, uz pomoć računara, kreira se određeni skup implementacija slučajnih procesa koji simuliraju uznemirujuće efekte na predmet ili proces koji se proučava, nakon čega se ovaj proces ili objekt simulira pod uslovima određenim dobijenim slučajnim efektima. Rezultati ovakvog modeliranja obrađuju se metodama matematičke statistike. U ovom slučaju, tip i parametri distribucije slučajne varijable mogu varirati.

Implementacija slučajnog procesa metodom Monte Carlo je niz izvlačenja pojedinačnih žrijeba, isprepletenih konvencionalnim proračunima, tokom kojih se utvrđuje rezultat uznemirujućeg efekta na objekt ili proces, na ishod operacije.

Kako je teško utvrditi adekvatnost modela za distribuciju slučajnih efekata u opštem slučaju, zadatak modeliranja Monte Karlo metodom je da obezbedi robusnost dobijenih rješenja (otpornost na promjene parametara zakona raspodjele slučajnih varijabli i početnih uslova modeliranja). Ukoliko rezultat simulacije nije robustan (značajno zavisi od parametara zakona distribucije i parametara modela), onda to ukazuje na prisustvo visokog rizika pri donošenju odluke u ovoj implementaciji simuliranog sistema.

Važnu ulogu u statističkim modelima imaju hipoteze o prirodi procesa promjene stanja u sistemu koji se modelira. Na primjer, vrlo zanimljiv slučaj je hipoteza o " Markovian » procesi (nazvani u čast ruskog naučnika A.A. Markova - početak 20. vijeka). Markovljevi procesi su slučaj procesa sa determinističkim verovatnoćama, za koji rana istorija promene stanja sistema u nekom prethodnom vremenskom intervalu nije bitna za utvrđivanje verovatnoće sledećeg događaja - glavni značaj se pridaje njegovom trenutna drzava. Ako postoji povjerenje u markovsku prirodu procesa, to značajno mijenja koncept sistema (može se smatrati „inercijalnim“, u velikoj mjeri u zavisnosti od njegovog trenutnog stanja i prirode perturbirajućeg efekta). Markovianski princip je otkriven u analizi tekstova na prirodnim jezicima, gde se verovatnoća pojave sledećeg znaka može predvideti na osnovu statističke analize tekstualnih nizova na određenom jeziku.

Statističko modeliranje je usko povezano sa simulacijskim modeliranjem , pri čemu je objektni model često „uronjen u probabilističko (statističko) okruženje“, u kojem se igraju različite situacije i načini rada modela/objekta. Međutim, simulacijski modeli se također mogu implementirati u determinističkim okruženjima.

Metode statističkog modeliranja se široko koriste u oblasti strateškog planiranja i upravljanja. Visok radni intenzitet procesa modeliranja onemogućava široku upotrebu metoda statističkog modeliranja u oblasti operativnog upravljanja. Ovo je uglavnom zbog potrebe za dubokim matematičkim proučavanjem modela i visokih zahtjeva za matematičkim znanjem korisnika.

Statističko modeliranje

numeričkom metodom za rješavanje matematičkih problema, u kojoj su željene vrijednosti vjerojatnosne karakteristike slučajnog fenomena, modelira se ovaj fenomen, nakon čega se željene karakteristike približno određuju statističkom obradom „zapažanja“ modela. Na primjer, potrebno je izračunati toplinske tokove u zagrijanoj tankoj metalnoj ploči, na čijim rubovima se održava nulta temperatura. Distribucija topline je opisana istom jednačinom kao i širenje mrlje boje u tekućem sloju (vidi Toplotna provodljivost, difuzija). Dakle, modelirano je ravno Brownovo kretanje čestica “boje” na ploči, prateći njihov položaj u momentima kτ, k= 0, 1, 2,... Približno se pretpostavlja da se za mali interval τ čestica kreće za korak h podjednako vjerovatno u svim pravcima. Svaki put smjer se bira nasumično, bez obzira na sve prethodno. Odnos između τ i h određena koeficijentom toplotne provodljivosti. Kretanje počinje u izvoru topline i završava se kada se prvi put dosegne ivica (primjećuje se lijepljenje “boje” za rub). Protok Q (C) topline kroz dio C granice mjeri se količinom prilijepljene boje. Sa ukupnim brojem Nčestice prema zakonu velikih brojeva y takva procjena daje slučajnu relativnu grešku reda h zbog diskretnosti odabranog modela).

Željena vrijednost je predstavljena matematičkim očekivanjem (vidi Matematičko očekivanje) numeričke funkcije f iz slučajnog ishoda ω fenomena: , tj. integral nad mjerom vjerovatnoće P (vidi Mjera skupa). Za evaluaciju , gdje ω 1 ,..., ω N -simulirani ishodi, mogu se posmatrati kao kvadraturna formula za naznačeni integral sa slučajnim čvorovima ω k i slučajna greška R N se obično prihvata , smatrajući veliku grešku zanemarljivo malo vjerovatnom; Disperzija Df može se proceniti tokom posmatranja (vidi Teoriju grešaka).

U gornjem primjeru f(ω)= 1 , kada trajektorija završava na C; inače f(ω) = 0. Disperzija

Provođenje svakog "eksperimenta" podijeljeno je na dva dijela: "crtanje" slučajnog ishoda ω i naknadno izračunavanje funkcije f(ω). Kada su prostor svih ishoda i mera verovatnoće P previše složeni, izvlačenje se vrši uzastopno u nekoliko faza (vidi primer). Slučajni odabir u svakoj fazi se provodi pomoću nasumičnih brojeva, na primjer, generiranih od strane neke vrste fizičkog senzora; njihova aritmetička imitacija je takođe uobičajena - pseudoslučajni brojevi (vidi Slučajni i pseudoslučajni brojevi). Slične procedure slučajnog odabira koriste se u matematičkoj statistici i teoriji igara.

S. merači se široko koriste za rješavanje integralnih jednačina na računaru, na primjer, u proučavanju velikih sistema. Pogodni su zbog svoje svestranosti, u pravilu ne zahtijevaju veliku količinu memorije. Nedostatak su velike slučajne greške, koje se presporo smanjuju s povećanjem broja eksperimenata. Stoga su razvijene tehnike transformacije modela koje omogućavaju smanjenje raspršenosti promatranih vrijednosti i volumena modelskog eksperimenta.

Lit.: Metoda statističkih ispitivanja (Monte Carlo metoda), M., 1962; Ermakov S. M., Monte Carlo metoda i srodna pitanja, M., 1971.

N. N. Čencov.

Velika sovjetska enciklopedija. - M.: Sovjetska enciklopedija. 1969-1978 .

Pogledajte šta je "Statističko modeliranje" u drugim rječnicima:

Statističko i ekonometrijsko modeliranje proučavanja objekata znanja na njihovim statističkim modelima; izgradnja i proučavanje modela stvarnih objekata, procesa ili pojava (na primjer: ekonomski procesi u ... ... Wikipedia

Statističko modeliranje- način proučavanja procesa ponašanja probabilističkih sistema u uslovima kada su unutrašnje interakcije u ovim sistemima nepoznate. Sastoji se od mašinske imitacije procesa koji se proučava, a koji se, takoreći, kopira na ... ... Ekonomsko-matematički rječnik

Metoda primenjene i računarske matematike, koja se sastoji u implementaciji na računaru posebno razvijene stohastike. modeli proučavanih pojava ili objekata. Širenje obima S. m. povezano je sa brzim razvojem tehnologije i posebno ... ... Mathematical Encyclopedia

Modeliranje situacija korištenjem statističkih obrazaca svojstvenih fenomenu koji se razmatra. Rječnik poslovnih pojmova. Akademik.ru. 2001 ... Pojmovnik poslovnih pojmova

Modeliranje proučavanja objekata znanja na njihovim modelima; izgradnja i proučavanje modela stvarnih objekata, procesa ili pojava u cilju dobijanja objašnjenja ovih fenomena, kao i predviđanja fenomena od interesa ... ... Wikipedia

SIMULACIJSKO MODELIRANJE u sociologiji- vrsta matematičkog modeliranja, koja se sastoji u reprodukciji na kompjuteru društvenog procesa ili funkcionisanja društvenog sistema. Gotovo uvijek uključuje reprodukciju nasumičnih faktora koji utiču na fenomen koji se proučava, i, kao rezultat, ... ... Sociologija: Enciklopedija

SIMULACIJSKI, STATISTIČKI- razvoj različitih modela koji odražavaju statističke obrasce opisanog objekta, fenomena. Zajednička specifičnost ovih modela je uključivanje slučajnih perturbacija ili devijacija. Objekti S.m. različiti su... Veliki ekonomski rječnik

SIMULATION STATISTICAL- predstavljanje ili opis određene pojave ili sistema odnosa između pojava kroz skup varijabli (pokazatelja, karakteristika) i statističkih odnosa među njima. Svrha M.S. (kao i svaka druga simulacija) zamislite… … Sociologija: Enciklopedija

Želite li poboljšati ovaj članak?: Ispravite članak prema stilskim pravilima Wikipedije. Simulacijsko modeliranje (situacijsko ... Wikipedia

SIMULACIJSKO MODELIRANJE- (... od franc. modele sample) metoda za proučavanje bilo kojih pojava i procesa metodom statističkih testova (Monte Carlo metoda) pomoću računara. Metoda se zasniva na crtanju (imitaciji) uticaja slučajnih faktora na fenomen koji se proučava ili ... ... Enciklopedijski rečnik psihologije i pedagogije

Knjige

Statističko modeliranje. Monte Carlo metode. Udžbenik za osnovne i postdiplomske studije, Mihailov G.A.. Priručnik je posvećen karakteristikama modeliranja slučajnih varijabli, procesa i polja. Posebna pažnja je posvećena numeričkoj integraciji, posebno Monte Carlo metodi. Odluka je doneta...

Matematička statistika je grana matematike koja razvija metode za snimanje, opisivanje i analizu opservacijskih i eksperimentalnih podataka u cilju izgradnje vjerojatnosnih modela slučajnih pojava i procesa. U zavisnosti od matematičke prirode konkretnih rezultata posmatranja, matematička statistika se deli na statistiku brojeva, multivarijantnu statističku analizu, analizu funkcija (procesa) i vremenskih serija i statistiku nenumeričkih objekata. Matematička statistika kombinuje različite metode statističke analize zasnovane na upotrebi statističkih obrazaca ili njihovih karakteristika.

Istorija statistike se obično smatra počevši od problema oporavka zavisnosti, od trenutka kada ju je razvio K. Gauss 1794. (prema drugim izvorima - 1795. godine) metoda najmanjih kvadrata. Razvoj metoda za aproksimaciju podataka i smanjenje dimenzije opisa započeo je prije više od 100 godina, kada je K. Pearson stvorio metoda glavne komponente. Kasnije razvijeno faktorska analiza, razne metode gradnje (klaster analiza), analiza i upotreba (diskriminantna analiza) klasifikacije (tipologije) i dr. Početkom 20. vijeka. teoriju matematičke statistike razvio je A. A. Chuprov. A. A. Markov, E. E. Slutsky, A. N. Kolmogorov, A. Ya. Khinčin i drugi dali su značajan doprinos teoriji slučajnih procesa. tzv. teorija analize podataka parametarska statistika, budući da su njen glavni predmet proučavanja uzorci iz distribucija opisanih jednim ili malim brojem parametara. Najopštija je porodica Pearsonovih krivulja definisanih sa četiri parametra. Najpopularnija je bila normalna distribucija. Za testiranje hipoteza korišteni su kriterijumi Pearson, Student i Fisher. Predložena je metoda maksimalne vjerovatnoće, analiza varijanse i formulirane glavne ideje za planiranje eksperimenta.

Godine 1954. akademik Akademije nauka Ukrajinske SSR B. V. Gnedenko dao je sljedeću definiciju: „Statistika se sastoji od tri odjeljka:

1) prikupljanje statističkih informacija, tj. informacije koje karakterišu pojedinačne jedinice bilo koje mase agregata;
2) statistička studija dobijenih podataka, koja se sastoji u razjašnjavanju onih obrazaca koji se mogu utvrditi na osnovu podataka masovnog posmatranja;
3) razvoj tehnika za statističko posmatranje i analizu statističkih podataka.

Posljednji odjeljak, zapravo, je sadržaj matematičke statistike.

Prema stepenu specifičnosti metoda koje su povezane sa uranjanjem u specifične probleme, postoje tri vrste naučnih i primenjenih aktivnosti u oblasti statističkih metoda analize podataka:

a) razvoj i istraživanje metoda opšte namene, bez uzimanja u obzir specifičnosti oblasti primene;
b) razvoj i proučavanje statističkih modela realnih pojava i procesa u skladu sa potrebama određene oblasti delatnosti;
c) primjena statističkih metoda i modela za statističku analizu specifičnih podataka.

Najčešće metode statističke analize su:

regresiona analiza (bazirana na poređenju matematičkih očekivanja);
analiza varijanse (na osnovu poređenja varijansi);
analiza korelacije (uzima u obzir matematička očekivanja, varijanse i karakteristike veza između događaja ili procesa);
faktorska analiza (statistička obrada multifaktorskog eksperimenta);
rang korelacija (kombinacija korelacije i faktorske analize).

Primjenom različitih metoda matematičke statistike statističke pravilnosti ili njihove karakteristike dobijaju se na različite načine: posmatranjem i ispitivanjem uzoraka, korištenjem aproksimativnih metoda zasnovanih na različitim metodama pretvaranja ili cijepanja uzorka u oblik varijacionog niza, cijepanjem uzoraka u tokove. , rezovi, nasumični vremenski intervali itd.

Matematička statistika se koristi u različitim oblastima menadžmenta.

Termin "statistika" prvobitno je korišten za opisivanje ekonomskog i političkog stanja države ili njenog dijela. Na primjer, definicija se odnosi na 1792. godinu: "statistika opisuje stanje države u sadašnjem trenutku ili u nekom poznatom trenutku u prošlosti." I trenutno se aktivnosti državnih statističkih službi dobro uklapaju u ovu definiciju. Statistika je definisana kao grana znanja koja ocrtava opšta pitanja prikupljanja, merenja i analize masivnih statističkih (kvantitativnih ili kvalitativnih) podataka; proučavanje kvantitativne strane masovnih društvenih pojava u numeričkom obliku.

Reč "statistika" dolazi od latinskog status- stanje stvari. Termin "statistika" je u nauku uveo njemački naučnik Gottfried Achenwall 1746. godine, koji je predložio da se naziv predmeta "Državne studije" koji se predaje na njemačkim univerzitetima zamijeni sa "Statistika", čime je postavljen temelj za razvoj statistike kao naučna i akademska disciplina.

U statistici se koristi posebna metodologija istraživanja i obrade materijala: masovna statistička posmatranja, metoda grupisanja, prosjeka, indeksa, bilansna metoda, metoda grafičkih slika i druge metode analize statističkih podataka.

Razvoj računarske tehnologije imao je značajan uticaj na statistiku. Ranije su statistički modeli bili predstavljeni uglavnom linearnim modelima. Povećanje brzine računara i razvoj odgovarajućih numeričkih algoritama izazvali su povećano interesovanje za nelinearne modele kao što su veštačke neuronske mreže, i dovelo do razvoja složenih statističkih modela, kao što su generalizovani linearni model i hijerarhijski model. Računske metode zasnovane na resamplingu postale su široko rasprostranjene. Trenutno se razvija računarska statistika, postoji niz statističkih softvera za opšte i specijalizovane svrhe. Statističke metode se koriste u pravcu koji se zove "Razbijanje podataka" (vidi Poglavlje 8).