Model matematika statistik probabilistik. Materi teori

Langganan
Bergabunglah dengan komunitas “koon.ru”!
Berhubungan dengan:

Mengirimkan karya bagus Anda ke basis pengetahuan itu sederhana. Gunakan formulir di bawah ini

Pelajar, mahasiswa pascasarjana, ilmuwan muda yang menggunakan basis pengetahuan dalam studi dan pekerjaan mereka akan sangat berterima kasih kepada Anda.

Diposting pada http://www.allbest.ru/

KEMENTERIAN PENDIDIKANRUSIA

Pendidikan Otonomi Negara Bagian Federal
lembaga pendidikan profesi tinggi
"Universitas Federal Selatan"

Departemen Peralatan dan Teknologi Informasi dan Pengukuran

Khusus

230201 Sistem dan teknologi informasi

ABSTRAK

Subjek: "Organisasi penelitian dan pengembangan"

Pada topik: “Metode pemodelan matematika dalam statistik”

Diselesaikan oleh siswa: Strotsev Vasily Andreevich

Guru: Gusenko Tamara Grigorievna

1. Unsur statistik matematika

Statistik matematika adalah cabang matematika yang dikhususkan untuk metode matematika sistematisasi, pengolahan dan penggunaan data statistik untuk kesimpulan ilmiah dan praktis. Data statistik di sini dipahami sebagai informasi tentang jumlah benda dalam suatu kumpulan yang kurang lebih luas yang mempunyai ciri-ciri tertentu.

Tujuan utama statistik matematika adalah untuk memperoleh kesimpulan yang bermakna dan berdasarkan ilmiah dari data yang tersebar secara acak. Pada saat yang sama, fenomena yang sedang dipelajari itu sendiri, yang menghasilkan data ini, seringkali terlalu rumit untuk dapat membuat deskripsi lengkap yang mencerminkan semua detailnya. Oleh karena itu, kesimpulan statistik dibuat berdasarkan beberapa model probabilistik matematis dari fenomena acak nyata, yang harus mereproduksi ciri-ciri esensialnya dan mengecualikan ciri-ciri yang dianggap tidak penting. Metode statistik matematika memungkinkan, berdasarkan pengamatan terhadap fenomena yang diteliti, untuk menentukan karakteristik probabilistik dari variabel acak yang berpartisipasi dalam model matematika yang menggambarkan fenomena tersebut.

Tugas statistik matematika - pembentukan pola yang menjadi subjek fenomena acak massa - didasarkan pada studi data statistik - hasil pengamatan - dengan menggunakan metode teori probabilitas. Data statistik adalah data yang diperoleh dari hasil survei terhadap sejumlah besar objek atau fenomena; oleh karena itu, statistik matematika berhubungan dengan fenomena massa.

Tugas pertama statistik matematika adalah menunjukkan cara mengumpulkan dan mengelompokkan informasi statistik yang diperoleh sebagai hasil observasi atau sebagai hasil eksperimen yang dirancang khusus.

Tugas kedua statistik matematika adalah mengembangkan metode untuk menganalisis data statistik tergantung pada tujuan penelitian.

Statistik matematika modern mengembangkan metode untuk menentukan jumlah tes yang diperlukan sebelum memulai suatu penelitian, selama penelitian, dan memecahkan banyak masalah lainnya. Statistik matematika modern didefinisikan sebagai ilmu pengambilan keputusan dalam kondisi ketidakpastian.

Tugas statistik matematika adalah menciptakan metode pengumpulan dan pengolahan data statistik untuk memperoleh kesimpulan ilmiah dan praktis.

1.1 Data statistik umum dan sampel

Biarlah perlu mempelajari sekumpulan objek yang homogen sehubungan dengan beberapa ciri kualitatif atau kuantitatif yang menjadi ciri objek tersebut.

Suatu objek mempunyai atau tidak mempunyai ciri-ciri kualitatif. Hal ini tidak dapat diukur secara langsung (misalnya, spesialisasi olahraga, kualifikasi, kewarganegaraan, afiliasi teritorial, dll.).

Karakteristik kuantitatif mewakili hasil penghitungan atau pengukuran. Sesuai dengan ini, mereka dibagi menjadi diskrit dan kontinu.

Terkadang pemeriksaan lengkap dilakukan, mis. memeriksa setiap objek dalam populasi mengenai karakteristik yang mereka minati. Dalam praktiknya, pemeriksaan berkelanjutan relatif jarang digunakan. Misalnya, jika suatu populasi berisi objek dalam jumlah yang sangat besar, maka secara fisik tidak mungkin dilakukan survei menyeluruh. Dalam kasus seperti itu, sejumlah objek dipilih secara acak dari seluruh populasi dan dijadikan sasaran penelitian. Ada populasi umum dan sampel.

Populasi sampel (sampel) adalah kumpulan objek yang dipilih secara acak.

Populasi umum (utama) adalah sekumpulan objek yang dijadikan sampel.

Volume suatu populasi (sampel atau umum) adalah banyaknya objek dalam populasi tersebut. Misalnya, jika dari 1000 bagian, dipilih 100 bagian untuk diperiksa, maka ukuran populasinya adalah N = 1000, dan ukuran sampelnya adalah n = 100. Jumlah objek dalam populasi N secara signifikan melebihi ukuran sampel n.

1.2 Metode pengambilan sampel

Saat mengumpulkan sampel, ada dua cara untuk melanjutkan: setelah suatu objek dipilih dan diamati, objek tersebut dapat dikembalikan ke populasi atau tidak. Sesuai dengan hal di atas, sampel dibagi menjadi berulang dan tidak berulang.

Pengambilan sampel berulang adalah pengambilan sampel dimana objek yang dipilih (sebelum memilih objek berikutnya) dikembalikan ke populasi.

Nonrepetitive sampling adalah pengambilan sampel yang objek yang dipilih tidak dikembalikan ke populasi.

Agar data sampel cukup andal untuk menilai karakteristik populasi yang diminati, objek sampel harus mewakilinya dengan benar (sampel harus mewakili proporsi populasi dengan benar) - sampel harus representatif (mewakili ).

Sampel akan representatif jika:

· setiap objek sampel dipilih secara acak dari populasi umum;

· semua objek mempunyai peluang yang sama untuk dimasukkan ke dalam sampel.

1.3 Metode pengelompokan statistik

1.3.1 Deret variasi diskrit

Biasanya data observasi yang diperoleh adalah sekumpulan angka yang disusun secara acak. Melihat rangkaian angka ini, sulit untuk mengidentifikasi pola variasi (perubahannya). Untuk mempelajari pola variasi nilai suatu variabel acak, data eksperimen diolah.

Contoh 1. Pengamatan dilakukan terhadap bilangan tersebut X nilai yang diterima oleh mahasiswa pada ujian. Pengamatan dalam waktu satu jam memberikan hasil sebagai berikut: 3; 4; 3; 5; 4; 2; 2; 4; 4; 3; 5; 2; 4; 5; 4; 3; 4; 3; 3; 4; 4; 2; 2; 5; 5; 4; 5; 2; 3; 4; 4; 3; 4; 5; 2; 5; 5; 4; 3; 3; 4; 2; 4; 4; 5; 4; 3; 5; 3; 5; 4; 4; 5; 4; 4; 5; 4; 5; 5; 5. Ini nomornya X adalah variabel acak diskrit, dan informasi yang diperoleh tentangnya mewakili data statistik (yang dapat diamati).

Dengan menyusun data-data di atas secara berurutan dan mengelompokkannya sedemikian rupa sehingga pada setiap kelompok individu nilai-nilai variabel acaknya sama, maka diperoleh serangkaian data observasi yang diberi peringkat.

Dalam contoh 1 kita mempunyai empat kelompok dengan nilai variabel acak berikut: 2; 3; 4; 5. Nilai suatu variabel acak yang bersesuaian dengan kelompok terpisah dari serangkaian kelompok data yang diamati disebut varian, dan perubahan nilai ini disebut variasi.

Opsi dilambangkan dengan huruf kecil alfabet Latin dengan indeks yang sesuai dengan nomor seri grup - xi. Angka yang menunjukkan berapa kali varian yang bersesuaian muncul dalam sejumlah pengamatan disebut frekuensi varian dan ditetapkan sesuai dengan itu - ni.

Jumlah seluruh frekuensi rangkaian adalah ukuran sampel. Rasio frekuensi varian terhadap ukuran sampel ni/n = wi disebut frekuensi relatif.

Distribusi statistik suatu sampel adalah daftar pilihan dan frekuensi yang sesuai atau frekuensi relatifnya (Tabel 1, Tabel 2).

Contoh 2. Distribusi frekuensi pengambilan sampel volume ditentukan n = 20:

Tabel 1

Kontrol: 0,15 + 0,50 + 0, 35 = 1.

Distribusi statistik juga dapat ditentukan sebagai urutan interval dan frekuensi yang sesuai dengannya (jumlah frekuensi yang termasuk dalam interval ini diambil sebagai frekuensi yang sesuai dengan interval tersebut).

Rangkaian variasi diskrit dari suatu distribusi adalah serangkaian opsi yang diberi peringkat xi dengan frekuensi yang sesuai ni atau frekuensi relatif wi.

Misalnya 1 yang dibahas di atas, deret variasi diskrit berbentuk:

Tabel 3

Kontrol: jumlah seluruh frekuensi deret variasi (jumlah nilai pada baris kedua Tabel 3) adalah ukuran sampel (pada contoh 1 n = 60 ); jumlah frekuensi relatif deret variasi harus sama dengan 1 (jumlah nilai baris ketiga Tabel 3)

1.3.2 Deret variasi interval

Jika variabel acak yang diteliti bersifat kontinu, maka pemeringkatan dan pengelompokan nilai-nilai yang diamati seringkali tidak memungkinkan untuk mengidentifikasi ciri-ciri variasi nilainya. Hal ini dijelaskan oleh fakta bahwa nilai individu dari suatu variabel acak dapat berbeda satu sama lain sesedikit yang diinginkan, dan oleh karena itu, dalam totalitas data yang diamati, nilai besaran yang identik jarang dapat muncul, dan frekuensinya varian sedikit berbeda satu sama lain.

Juga tidak praktis untuk membuat deret diskrit untuk variabel acak diskrit, yang jumlah nilai kemungkinannya besar. Dalam kasus seperti itu, deret distribusi variasi interval harus dibuat.

Untuk membangun deret seperti itu, seluruh interval variasi nilai observasi suatu variabel acak dibagi menjadi beberapa interval parsial dan frekuensi kemunculan nilai variabel pada setiap interval parsial dihitung.

Deret variasi interval adalah himpunan interval nilai-nilai yang bervariasi dari suatu variabel acak dengan frekuensi yang sesuai atau frekuensi relatif dari nilai-nilai variabel yang termasuk dalam masing-masing variabel tersebut.

Untuk membuat deret interval, Anda memerlukan:

1. menentukan ukuran interval parsial;

2. menentukan lebar interval;

3. menetapkan batas atas dan bawahnya untuk setiap interval;

4. mengelompokkan hasil observasi.

1. Pertanyaan memilih jumlah dan lebar interval pengelompokan harus diputuskan dalam setiap kasus berdasarkan tujuan penelitian, ukuran sampel dan derajat variasi karakteristik sampel.

Kira-kira jumlah interval k dapat diperkirakan hanya berdasarkan ukuran sampel N dengan salah satu cara berikut:

· sesuai rumus Sturges: k = 1 + 3,32 catatan n;

menggunakan tabel 1.

Tabel 1

2. Ruang dengan lebar yang sama umumnya lebih disukai. Untuk menentukan lebar interval H menghitung:

· rentang variasi R- nilai sampel: R = xmaks - xmin, Di mana xmax Dan xmin- opsi pengambilan sampel maksimum dan minimum;

· lebar setiap interval H ditentukan dengan rumus berikut: H = R/k.

3. Batas bawah interval pertama xh1 dipilih sehingga opsi sampel minimum xmin jatuh kira-kira di tengah-tengah interval ini: xh1 = xmin - 0,5 jam.

Interval perantara diperoleh dengan menambahkan panjang interval parsial ke akhir interval sebelumnya H:

xhi = xhi-1 +h.

Pembangunan skala interval berdasarkan perhitungan batas interval berlanjut hingga nilainya xhi memenuhi relasi:

xhi< xmax + 0,5·h .

4. Sesuai dengan skala interval, nilai karakteristik dikelompokkan - untuk setiap interval parsial jumlah frekuensi dihitung ni opsi yang disertakan di dalamnya Saya interval ke-th. Dalam hal ini interval mencakup nilai variabel acak yang lebih besar atau sama dengan batas bawah dan lebih kecil dari batas atas interval.

1.4 Poligon dan histogram

Untuk kejelasan, berbagai grafik distribusi statistik dibuat. Berdasarkan data deret variasi diskrit, dibuat poligon frekuensi atau frekuensi relatif.

Poligon frekuensi adalah garis putus-putus yang ruas-ruasnya menghubungkan titik-titik ( x1; n1), (x2; n2),..., (xk; tidak). Untuk membuat poligon frekuensi, opsi diplot pada sumbu absis. xi, dan pada ordinat - frekuensi yang sesuai ni. Poin ( xi; ni) dihubungkan oleh segmen lurus dan diperoleh poligon frekuensi (Gbr. 1).

Poligon frekuensi relatif adalah garis putus-putus yang segmen-segmennya menghubungkan titik-titik ( x1; W1), (x2; W2),..., (xk; Minggu). Untuk membuat poligon frekuensi relatif, opsi diplot pada sumbu absis xi, dan pada ordinat - frekuensi relatif yang sesuai Wi. Poin ( xi; Wi) dihubungkan oleh segmen lurus dan diperoleh poligon frekuensi relatif. Dalam kasus karakteristik kontinu, disarankan untuk membuat histogram.

Histogram frekuensi adalah gambar langkah yang terdiri dari persegi panjang, yang alasnya merupakan interval parsial panjangnya H, dan tingginya sama dengan rasio nih/jam(kepadatan frekuensi).

Untuk membuat histogram frekuensi, interval parsial diletakkan pada sumbu absis, dan segmen yang sejajar dengan sumbu absis digambar di atasnya pada jarak tertentu. nih/jam.

Persegi Saya hni / jam = ni- jumlah opsi frekuensi Saya - interval ke-; oleh karena itu, luas histogram frekuensi sama dengan jumlah semua frekuensi, yaitu. ukuran sampel.

Histogram frekuensi relatif adalah gambar langkah yang terdiri dari persegi panjang, yang alasnya merupakan interval parsial panjangnya H, dan tingginya sama dengan rasio Dengan / jam(kepadatan frekuensi relatif).

Untuk membuat histogram frekuensi relatif, interval parsial diletakkan pada sumbu absis, dan segmen yang sejajar dengan sumbu absis digambar di atasnya pada jarak tertentu. Dengan / jam(Gbr. 2).

Persegi Saya -persegi panjang parsial sama dengan hWi/jam = Wi- frekuensi relatif varian yang tertangkap Saya interval ke-. Oleh karena itu, luas histogram frekuensi relatif sama dengan jumlah semua frekuensi relatif, yaitu. satuan.

1.5 Estimasi parameter populasi

Parameter utama populasi adalah ekspektasi matematis (rata-rata umum) M(X) dan simpangan baku S. Ini adalah kuantitas konstan yang dapat diperkirakan dari data sampel. Estimasi parameter umum, yang dinyatakan dalam satu angka, disebut estimasi titik.

Estimasi titik dari mean umum adalah mean sampel.

Rata-rata sampel adalah rata-rata aritmatika suatu karakteristik dalam suatu populasi sampel.

Jika semua nilai x1, x2,..., xn karakteristik sampel berbeda (atau jika datanya tidak dikelompokkan), maka:

x1, x2,..., xn n1, n2,...,nk, Dan n1 + n2 +...+ nk = n(atau jika mean sampel dihitung dari rangkaian variasi), maka

Dalam hal data statistik disajikan dalam bentuk deret variasi interval, pada saat menghitung rata-rata sampel, nilai tengah interval dianggap sebagai pilihan.

Rata-rata sampel adalah ciri utama suatu posisi, menunjukkan pusat sebaran populasi, memungkinkan Anda mengkarakterisasi populasi yang diteliti dengan satu angka, menelusuri tren perkembangan, dan membandingkan populasi yang berbeda (rata-rata sampel adalah titik dimana jumlah deviasi pengamatan sama dengan 0).

Untuk tarif Dengan Untuk menentukan derajat dispersi (deviasi) suatu indikator tertentu dari nilai rata-ratanya, beserta nilai maksimum dan minimumnya, digunakan konsep dispersi dan standar deviasi.

Varians sampel atau varians sampel (dari bahasa Inggris variance) adalah ukuran variabilitas suatu variabel. Istilah ini pertama kali diciptakan oleh Fischer pada tahun 1918.

Varians sampel Dв adalah mean aritmatika dari kuadrat deviasi nilai observasi suatu karakteristik dari nilai rata-ratanya.

Jika semua nilai x1, x2,..., xn atribut pengambilan sampel volume N berbeda, maka:

Jika semua nilai atribut x1, x2,..., xn mempunyai frekuensi yang sesuai n1, n2,...,nk, Dan n1 + n2 +...+ nk = n, Itu

Variansnya bervariasi dari nol hingga tak terhingga. Nilai ekstrim 0 berarti tidak ada variabilitas ketika nilai variabelnya konstan.

Deviasi kuadrat rata-rata (deviasi standar), (dari deviasi standar bahasa Inggris) dihitung sebagai akar kuadrat dari varians.

Semakin tinggi varians atau deviasi standarnya, maka semakin tersebar nilai-nilai variabel tersebut di sekitar mean.

Ciri-ciri posisi nonparametrik adalah modus dan median.

Mode Mo Pilihan yang mempunyai frekuensi tertinggi atau frekuensi relatif disebut.

median Aku disebut varian, yang membagi deret variasi menjadi dua bagian yang sama jumlahnya dengan varian tersebut.

Jika bilangan ganjil, pilihan (n=2k+1)

Saya = xk+1,

dan jika bilangan genap, pilihan (n=2k)

Saya = (xk + xk+1)/2.

2. Analisis korelasi dan regresi

2.1 Analisis korelasi

korelasi pengelompokan statistik matematika

Analisis korelasi melibatkan pembentukan hubungan statistik antara variabel acak. Ini dapat digunakan dalam penelitian pedagogis untuk menilai pengaruh beberapa faktor terhadap faktor lain dan membangun hubungan di antara faktor-faktor tersebut dalam hubungannya dengan parameter lain - ekspektasi matematis dan deviasi standar. Analisis korelasi tidak dapat diterapkan secara langsung untuk mengidentifikasi hubungan sebab-akibat antara proses acak. Ini hanya membangun hubungan antara karakteristik statistik dari proses acak yang terkait.

Misalkan ada dua variabel acak X dan Y dengan ekspektasi matematis mx dan my. Momen korelasi

Kxy =M((X-mx)(Y-saya))

akan mencirikan hubungan antara besaran X dan Y. Untuk kemudahan penggunaan, momen korelasi dinormalisasi sesuai rumus

dimana yx dan yy merupakan simpangan baku dari nilai X dan Y. Nilai Kk disebut koefisien korelasi dari nilai X dan Y.

Untuk variabel acak diskrit yang kita hadapi, estimasi koefisien korelasi dihitung menggunakan rumus

Rumus untuk menghitung koefisien korelasi adalah sah dengan syarat hubungan antar variabel acak adalah linier dan masing-masing nilai tersebut tunduk pada hukum normal.

Untuk mengevaluasi hubungan statistik antara tingkat persiapan sekolah dan kinerja siswa tahun pertama dalam disiplin ilmu “Informatika”.Persiapan sekolah dinilai dengan tes saat masuk ke universitas (nilai X). Prestasi mahasiswa dinilai berdasarkan hasil ujian setelah semester pertama (nilai Y). Nomor siswa ditunjuk N.

Data awal untuk perhitungan dirangkum dalam tabel

Mengganti data dari tabel ke dalam ekspresi (1), kita memperoleh Kk=0,78.

Kita melihat bahwa ciri-ciri statistik dari nilai X dan Y saling berdekatan.

2.2 Analisis regresi

Analisis regresi menetapkan tugas mempelajari secara statistik hubungan antara variabel terikat dan variabel bebas (regressor atau predikator). Dalam kasus paling sederhana, ketergantungan ini diasumsikan linier. Masalah membangun hubungan linier berbentuk y=ax+b sedang diselesaikan, dimana xi dan yi masing-masing adalah variabel bebas dan terikat (i=1,2,3,...). Penyelesaiannya dicari dengan metode kuadrat terkecil. Nilainya diminimalkan

min koefisien a dan b ditemukan.

Rumus perhitungannya adalah sebagai berikut:

Pada dasarnya, himpunan titik yang diperoleh secara eksperimental kira-kira digantikan oleh ketergantungan analitis y=ax+b. Penggantian ini secara signifikan menyederhanakan transformasi matematika dan dapat digunakan dalam membangun model analitik. Dalam kasus umum, tidak hanya fungsi linier, tetapi juga fungsi lainnya dapat dipilih untuk membangun ketergantungan regresi. Secara alami, rumus untuk menghitung parameter yang diperlukan menjadi lebih rumit.

3. Metode matematika untuk optimalisasi eksperimen

3.1 Metode optimasi simpleks

Simpleks adalah polihedron beraturan yang memiliki n+1 bagian atas dimana P - sejumlah faktor yang mempengaruhi proses tersebut. Jadi, misalnya ada dua faktor, maka simpleksnya adalah segitiga beraturan.

Beras. 1 Optimasi menggunakan metode simpleks

Rangkaian percobaan awal sesuai dengan simpul dari simpleks awal (titik 1, 2 dan 3). Kondisi percobaan pertama ini diambil dari kisaran nilai faktor yang sesuai dengan mode proses yang paling menguntungkan dan diketahui yang sedang dioptimalkan. Membandingkan hasil percobaan pada poin 1, 2 dan 3, mereka menemukan yang “terburuk” di antara mereka, dari sudut pandang kriteria optimalitas yang dipilih. Misalnya, pengalaman yang paling “tidak berhasil” adalah intinya 1. Pengalaman ini dikecualikan dari pertimbangan, dan sebagai gantinya pengalaman pada titik tersebut dimasukkan ke dalam simpleks 4, yang simetris terhadap titik 1 relatif terhadap sisi berlawanan dari segitiga yang menghubungkan titik-titik tersebut 2 Dan 3.

Selanjutnya, mereka membandingkan hasil percobaan pada simpul-simpul simpleks baru, membuang simpul-simpul yang paling “tidak berhasil” dan memindahkan simpul-simpul simpleks yang bersesuaian ke titik tersebut. 5. Prosedur di atas kemudian diulangi selama proses optimasi.

Jika kriteria optimalitas ekstrem tercapai, maka pergerakan simpleks selanjutnya berhenti. Artinya, langkah baru akan mengembalikan peneliti ke titik sebelumnya dalam ruang faktor.

Jika terdapat beberapa ekstrem dari kriteria optimalitas, maka metode ini memungkinkan Anda menemukan ekstrem yang letaknya lebih dekat ke titik-titik simpleks asli. Oleh karena itu, jika terdapat kecurigaan adanya beberapa ekstrem kriteria optimalitas, maka perlu dilakukan pencarian, setiap kali memulai optimasi dari area baru dalam ruang faktor. Maka Anda harus membandingkan kondisi optimal yang ditemukan dan memilih yang terbaik dari semua opsi.

Saat melakukan optimasi, perlu memperhitungkan batasan yang dikenakan pada faktor-faktor yang mempengaruhi dan fungsi respons.

Penting untuk diperhatikan ketika menggunakan metode simpleks tidak perlu percobaan duplikat. Faktanya adalah kesalahan dalam percobaan terpisah hanya dapat memperlambat pengoptimalan. Jika eksperimen selanjutnya dilakukan dengan sempurna, maka pergerakan menuju optimal akan terus berlanjut.

Matriks percobaan simpleks asli dalam variabel berkode diberikan pada Tabel 11.

Nilai yang termasuk dalam tabel ini dihitung menggunakan rumus berikut:

Di sini i adalah banyaknya faktor dalam matriks perencanaan. Simbol 0 menunjukkan koordinat pusat denah, yaitu tingkat utama.

Tabel 11

Matriks simpleks asal

Nomor pengalaman

X2

Fungsi respon

K2

K2

Eksperimen disajikan dalam tabel. 11 sesuai dengan simpul simpleks, yang sisinya sama dengan satu, dan pusatnya bertepatan dengan titik asal koordinat (dalam variabel berkode).

Hasil perhitungan dilakukan berdasarkan tabel. 11 dan rumus (*) diberikan dalam tabel. 12.

Tabel 12

Kondisi rangkaian percobaan awal

Nomor pengalaman

Jelasnya, jumlah percobaan terbesar harus dilakukan pada awal percobaan. Kemudian, pada setiap langkah pengoptimalan, hanya satu eksperimen yang dilakukan.

Saat memulai pengoptimalan, Anda perlu menggunakan tabel. 11 atau 12 menghitung matriks rangkaian percobaan awal variabel fisis, menggunakan rumus

Di masa depan, semua operasi hanya dilakukan dengan operasi fisik1. variabel.

Kondisi setiap pengalaman baru dihitung menggunakan rumus:

Di mana P-- sejumlah faktor dalam matriks perencanaan;

j -- nomor percobaan;

nomor faktor-i;

Nilai faktor ke-i pada pengalaman paling “tidak berhasil” dari simpleks sebelumnya.

Perlu diperhatikan bahwa pada setiap langkah optimasi yang dilakukan dengan metode simpleks, langkah baru dapat dimasukkan dalam program penelitian faktor , yang sampai saat itu tidak diperhitungkan, tetapi tetap pada tingkat yang konstan.

Dalam hal ini, nilai semua faktor yang dipertimbangkan sebelumnya dihitung menggunakan rumus:

dimana 1= 1, 2,..., P, artinya, ini adalah rata-rata aritmatika dari koordinat-koordinat yang bersesuaian dari simpleks sebelumnya.

Nilai faktor yang baru dimasukkan ditentukan dengan rumus:

dimana x0(n+1) adalah level utama dari faktor ini;

Dxn+1—langkah variasi yang dipilih untuk faktor tertentu;

Rn+1, buku+1 --nilai dihitung menggunakan rumus (*).

Perhatikan bahwa penambahan faktor baru ke dalam “eksperimen faktorial” yang lengkap disertai dengan penggandaan jumlah eksperimen . Dalam hal ini, metode simpleks jelas mempunyai keuntungan .

Contoh 3.2. Misalkan diperlukan optimasi rendemen produk sasaran dengan menggunakan metode simpleks pada(%), yang diperoleh melalui interaksi dua reagen dengan konsentrasi x1 dan x2 () pada suhu x3 (°C).

Mari kita pilih tingkat dan langkah utama dari berbagai faktor dan rangkum dalam tabel. 13.

Tabel 13

Nilai tingkat faktor dan langkah variasi

Tingkat utama

Langkah variasi

Menggunakan rumus (3.5) dan tabel. 12, kami menghitung kondisi untuk melakukan empat percobaan pertama dan merangkum hasil yang diperoleh dalam tabel. 14. Jadi, misalnya untuk percobaan ketiga

x31=1+0,1*0==1; x32==1,50 +0,2 (--0,578) ==1,38; x33=60+5*0,204==61.

Tabel 14

Optimasi menggunakan metode simpleks

Nomor pengalaman

Fungsi respon

Membandingkan hasil empat percobaan pertama, kita melihat bahwa hasil terendah dari produk target diperoleh pada percobaan ketiga. Pengalaman ini harus dikecualikan dari pertimbangan lebih lanjut.

Mari kita ganti dengan percobaan 5, syaratnya akan kita hitung menggunakan rumus (**):

Pada simpleks baru yang dibentuk dari percobaan 1, 2, 4 dan 5, yang paling “tidak berhasil” adalah percobaan 4. Kita ganti dengan percobaan 6 yang kondisinya akan dicari dengan menggunakan rumus yang sama (**).

Sekarang mari kita perhatikan pertanyaan bagaimana memasukkan faktor lain ke dalam program penelitian, misalnya kecepatan putaran pengaduk. Biarkan sampai sekarang konstan dan sama dengan 500 rpm Sekarang kita akan menganggap nilai ini sebagai faktor x4 dan mengambil langkah variasi Dx4 = 100 rpm.

Simpleks sebelumnya untuk tiga faktor (lihat Tabel 14) terdiri dari percobaan 1, 2, 5 dan 6. Untuk mendapatkan simpleks baru untuk empat faktor, kami memperkenalkan percobaan 7 (Tabel 15).

Tabel 15

Menambahkan faktor baru ke program optimasi

Nomor pengalaman

Fungsi respon

Kita cari syarat untuk melakukan percobaan ke-7 dengan menggunakan rumus (3.7) dan (3.8):

Diposting di Allbest.ru

...

Dokumen serupa

    Metode matematika untuk mensistematisasikan dan menggunakan data statistik untuk kesimpulan ilmiah dan praktis. Hukum distribusi variabel acak diskrit. Konsep populasi umum. Masalah observasi statistik. Distribusi pengambilan sampel.

    abstrak, ditambahkan 10/12/2010

    Konsep statistik matematika sebagai ilmu tentang metode matematika sistematisasi dan penggunaan data statistik untuk kesimpulan ilmiah dan praktis. Estimasi titik parameter distribusi statistik. Analisis perhitungan rata-rata.

    tugas kursus, ditambahkan 13/12/2014

    Statistika matematika sebagai ilmu tentang metode matematika untuk mensistematisasikan data statistik, indikator-indikatornya. Menyusun distribusi statistik integral dari populasi sampel, membuat histogram. Perhitungan estimasi titik parameter.

    tugas kursus, ditambahkan 04/10/2011

    Analisis primer dan ciri-ciri utama data statistik. Estimasi titik parameter distribusi. Interval kepercayaan untuk ekspektasi matematis yang tidak diketahui dan untuk deviasi standar. Menguji hipotesis statistik.

    tesis, ditambahkan 18/01/2016

    Statistika adalah ilmu tentang fenomena massa di alam dan masyarakat; memperoleh, mengolah, menganalisis data. Statistik demografi, perkiraan populasi untuk Rusia. Metode pengolahan data statistik: unsur logika, kombinatorik, teori probabilitas.

    presentasi, ditambahkan 19/12/2012

    Penerapan metode khusus dalam statistik tergantung pada tugasnya. Metode observasi massal, pengelompokan, indikator generalisasi, deret waktu, metode indeks. Analisis korelasi dan varians. Perhitungan nilai statistik rata-rata.

    tes, ditambahkan 21/09/2009

    Memperoleh data statistik untuk gambaran umum tentang keadaan dan perkembangan fenomena. Jenis, metode dan bentuk organisasi observasi statistik. Bentuk statistik, ringkasan dan pengelompokan data. Tabel dan grafik statistik.

    abstrak, ditambahkan 12/11/2009

    Penentuan ekspektasi matematis dan simpangan baku untuk memilih hukum distribusi sampel data statistik kegagalan elemen kendaraan. Menemukan banyaknya kejadian dalam interval tertentu; perhitungan nilai kriteria Pearson.

    tes, ditambahkan 01/04/2014

    Metode tabel dalam menyajikan data statistik hukum. Indikator absolut dan umum. Besaran relatif, jenis utama dan aplikasinya. Rata-rata geometri, modus dan median. Metode observasi sampel. Klasifikasi deret dinamika.

    tes, ditambahkan 29/03/2013

    Pemrosesan primer data statistik tentang jumlah terminal pelanggan seluler terdaftar pada tahun 2008 per 1000 penduduk di wilayah Rusia. Estimasi parameter interval. Hipotesis tentang jenis distribusi. Analisis regresi.

4.1.1. Model statistik. Dalam pemodelan statistik (stokastik), objek utama pemodelan adalah kejadian acak, variabel acak, dan fungsi acak.

Saat melakukan eksperimen, peneliti mencatat ada atau tidaknya peristiwa yang diinginkan, dan juga mengukur nilai parameter yang bersifat acak dan pada dasarnya merupakan nilai implementasi dari beberapa variabel acak.

Pemodelan statistik memungkinkan, tanpa melakukan eksperimen nyata pada objek yang diteliti (yang dalam banyak kasus memerlukan biaya material dan finansial yang besar), untuk memperoleh informasi yang relevan tentang terjadinya atau tidak terjadinya peristiwa tertentu yang terjadi pada objek nyata. tentang nilai sampel variabel acak berdasarkan karakteristik probabilistik yang tersedia dari peristiwa simulasi dan variabel acak. Jenis pemodelan ini melibatkan pengumpulan informasi awal tentang indikator yang dimodelkan dan pemrosesan statistik lebih lanjut dari hasil yang diperoleh untuk memperoleh perkiraan statistik yang masuk akal yang diperlukan untuk memodelkan karakteristik probabilistik.

Model stokastik digunakan terutama dalam dua kasus:

1) objek pemodelan kurang dipelajari - tidak ada hukum kuantitatif yang cukup berkembang yang menggambarkan proses dan fenomena yang sedang dipertimbangkan, dan juga tidak ada kemungkinan untuk menemukan solusi analitis yang dapat diterima untuk masalah ini;

2) objek yang dimodelkan telah dipelajari dengan cukup baik secara deterministik, tetapi tanpa memperhitungkan faktor-faktor acak yang mempengaruhi proses dan fenomena yang diteliti.

Dalam kasus pertama, berdasarkan deskripsi verbal dari objek yang diteliti, indikator kuantitatif dipilih dengan perhitungan dimensi fisiknya, yang terdiri dari dua kelompok. Salah satu kelompok dianggap sebagai besaran masukan model, dan kelompok lainnya dianggap sebagai besaran keluaran. Selanjutnya, dengan menerapkan hasil-hasil teoritis ilmiah yang diperoleh oleh peneliti lain di bidang ini dan mungkin menerapkan sejumlah asumsi yang diperlukan, serta mungkin data eksperimen yang sudah ada mengenai besaran masukan dan keluaran (misalnya, pada hukum distribusinya) membentuk ketergantungan deterministik atau stokastik antara besaran masukan dan keluaran model. Himpunan hubungan yang diperoleh antara besaran masukan dan keluaran (biasanya ditulis dalam bentuk persamaan) disebut model statistik.

Selama penerapan model statistik, berdasarkan hukum distribusi variabel acak yang dipilih dan probabilitas peristiwa simulasi yang dipilih, metode statistik matematika menentukan nilai sampel pra-eksperimental dari variabel acak dan urutan kejadian kuasi-empiris atau tidak terjadinya peristiwa simulasi. Selanjutnya, nilai sampel yang sesuai dari besaran keluarannya ditentukan dari persamaan model. Dan implementasi berulang dari model yang dibangun memungkinkan peneliti untuk membangun sampel model dari nilai keluarannya, yang sekali lagi dikenakan analisis statistik (korelasi, regresi, dispersi, spektral) untuk memperoleh perkiraan karakteristik parameter keluaran model atau menguji hipotesis yang diajukan. Berdasarkan hasil yang diperoleh, ditarik kesimpulan terhadap objek penelitian, serta justifikasi penerapan praktis model yang dibangun.

Metode pemodelan statistik banyak digunakan dalam penyelesaian masalah antrian, teori optimasi, teori kontrol, teori fisika, dll.

Landasan teori metode pemodelan statistik pada komputer adalah teorema limit teori probabilitas.

4.1.2. Ketimpangan Chebyshev. Untuk fungsi non-negatif dari variabel acak, pertidaksamaan

.

4.1.3. teorema Bernoulli. Jika pengujian independen dilakukan, yang masing-masing peristiwa tertentu terjadi dengan probabilitas , maka kemurnian relatif terjadinya peristiwa tersebut (jumlah hasil pengujian yang menguntungkan) pada probabilitas konvergen ke , yaitu. pada

4.1.4. teorema Poisson. Jika pengujian independen dilakukan dan peluang terjadinya peristiwa dalam pengujian tersebut sama dengan , maka kemurnian relatif terjadinya peristiwa tersebut (jumlah hasil pengujian yang menguntungkan) pada probabilitas konvergen terhadap rata-rata probabilitas , yaitu. pada

4.1.5. teorema Chebyshev. Jika nilai-nilai variabel acak diamati dalam pengujian independen, maka pada rata-rata aritmatika nilai-nilai variabel acak tersebut konvergen dalam probabilitas dengan ekspektasi matematisnya, yaitu. pada

4.1.6. Teorema Chebyshev yang digeneralisasikan. Jika variabel acak independen dengan ekspektasi dan varian matematis dibatasi dari atas dengan angka yang sama, maka ketika mean aritmatika dari nilai variabel acak tersebut konvergen dalam probabilitas ke mean aritmatika dari ekspektasi matematisnya

4.1.7. teorema Markov.. Teorema Chebyshev juga berlaku untuk variabel acak terikat jika

4.1.8. Teorema limit pusat. Jika variabel acak independen berdistribusi identik dengan ekspektasi dan varians matematis, maka ketika hukum distribusi jumlah mendekati hukum distribusi normal tanpa batas

di mana fungsi Laplace

4.1.9. teorema Laplace. Jika dalam setiap percobaan bebas suatu peristiwa terjadi dengan probabilitas , maka

Metode statistik dan teori probabilitas membentuk dasar metodologis dari jenis pemodelan dengan nama yang sama. Pada tingkat formalisasi model ini, kita belum berbicara tentang pengungkapan hukum yang menjamin penghapusan ketidakpastian dalam pengambilan keputusan, tetapi ada serangkaian pengamatan tertentu terhadap sistem ini atau analoginya, yang memungkinkan kita untuk menarik perhatian tertentu. kesimpulan mengenai keadaan sistem di masa lalu/saat ini/masa depan, berdasarkan hipotesis tentang invariansi perilakunya.

Seperti biasa, mari kita rumuskan definisi... Model statistik atau teori probabilitas (model stokastik) adalah model yang memperhitungkan pengaruh faktor acak dalam proses operasi sistem, berdasarkan penerapan metodologi statistik atau teori probabilitas dalam kaitannya dengan fenomena yang berulang.. Model ini beroperasi dengan kriteria kuantitatif ketika menilai fenomena yang berulang dan memungkinkan untuk memperhitungkan nonlinier, dinamika, dan gangguan acaknya dengan mengajukan, berdasarkan analisis hasil pengamatan, hipotesis tentang sifat sebaran variabel acak tertentu yang mempengaruhi perilaku sistem.

Pada dasarnya, model teori probabilitas dan model statistik berbeda dalam tingkat ketidakpastian pengetahuan tentang sistem yang dimodelkan yang ada pada saat sintesis model. Dalam hal gagasan tentang sistem lebih bersifat teoritis dan hanya didasarkan pada hipotesis tentang sifat sistem dan pengaruh-pengaruh yang mengganggu, tidak didukung oleh hasil observasi, maka model teoritis-probabilistik adalah satu-satunya yang mungkin. Ketika, pada tahap sintesis model, data yang diperoleh secara eksperimental sudah ada, hipotesis dapat diperkuat melalui pemrosesan statistiknya. Hal ini menjadi jelas jika kita mempertimbangkan hubungan antara metode statistik matematika dan teori probabilitas. Statistika matematika adalah ilmu yang mempelajari metode untuk mengungkapkan pola-pola yang melekat pada kumpulan besar objek atau peristiwa yang homogen, berdasarkan pengambilan sampelnya (atau sejumlah besar data yang diperoleh sebagai hasil pengamatan terhadap objek yang sama dalam jangka waktu yang cukup lama). Teori probabilitas mempelajari pola kuantitatif yang diikuti oleh fenomena acak jika fenomena ini ditentukan oleh peristiwa yang probabilitasnya diketahui. Oleh karena itu, statistik matematika merupakan penghubung antara teori probabilitas dan fenomena dunia nyata, karena memungkinkan seseorang untuk merumuskan perkiraan probabilitas peristiwa tertentu berdasarkan analisis data statistik.

Dapat dikatakan bahwa model statistik adalah jenis model matematika khusus yang digunakan sebagai data awal tidak hanya data terkini tentang keadaan suatu objek saat ini, tetapi juga data yang mengkarakterisasi keadaan objek lain dari kelas tertentu, atau objek ini. tetapi pada waktu yang berbeda. Model statistik dapat diterapkan untuk mempelajari fenomena massa dalam bentuk apa pun, termasuk yang tidak termasuk dalam kategori ditentukan secara probabilistik (statistik matematika juga diadaptasi untuk memecahkan masalah deterministik). Saat memodelkan yang terakhir, proses statistik dimasukkan secara artifisial ke dalam model untuk mendapatkan estimasi statistik dari solusi numerik (misalnya, keakuratan pengukuran parameter proses deterministik).

Metode statistik matematika dan teori probabilitas antara lain dapat diperkenalkan ke dalam model logis dan logis-linguistik, seperti yang ditunjukkan pada subbab sebelumnya. Misalnya, metode untuk mengintegrasikan estimasi statistik ke dalam model hubungan semantik untuk memberikan bobot berbeda pada busur yang menghubungkan masing-masing simpul dapat dipertimbangkan. Perkiraan statistik juga dapat dimasukkan ke dalam sistem presentasi tesauri untuk menyelesaikan situasi polisemi tanpa menggunakan prosedur analisis kontekstual. Dengan kata lain, metode statistik dapat menjadi dasar model dan digunakan untuk memodifikasi jenis model lainnya.

Untuk mengolah hasil observasi digunakan metode korelasi, regresi, faktor, cluster dan jenis analisis lainnya yang beroperasi dengan hipotesis statistik. Peran khusus di sini diberikan kepada metode uji statistik (Metode Monte Carlo ). Ini adalah metode untuk menyelesaikan masalah matematika secara numerik, berdasarkan teori probabilitas berulang dan pemodelan statistik dari variabel atau proses acak untuk membangun estimasi statistik untuk kuantitas yang diinginkan. Inti dari metode ini adalah menerapkan beberapa simulasi fenomena acak dengan menggunakan prosedur tertentu yang memberikan hasil acak. Untuk melakukan ini, dengan menggunakan komputer, sejumlah implementasi proses acak dibuat yang mensimulasikan pengaruh-pengaruh yang mengganggu pada objek atau proses yang diteliti, setelah itu proses atau objek ini dimodelkan dalam kondisi yang ditentukan oleh pengaruh acak yang dihasilkan. Hasil pemodelan tersebut diolah dengan menggunakan metode statistik matematika. Dalam hal ini, jenis dan parameter distribusi variabel acak dapat bervariasi.

Penerapan proses acak menurut metode Monte Carlo adalah rangkaian lot tunggal, diselingi dengan perhitungan biasa, di mana hasil dari pengaruh yang mengganggu pada suatu objek atau proses, pada hasil operasi, ditentukan.

Karena kecukupan model distribusi pengaruh acak sulit ditentukan dalam kasus umum, tugas pemodelan menggunakan metode Monte Carlo adalah untuk memastikan ketahanan solusi yang diperoleh (ketahanan terhadap perubahan parameter hukum distribusi variabel acak dan kondisi pemodelan awal). Jika hasil simulasi tidak kuat (sangat bergantung pada parameter hukum distribusi dan parameter model), maka hal ini menunjukkan adanya risiko tinggi ketika mengambil keputusan dalam implementasi sistem yang disimulasikan.

Peran penting dalam model statistik dimainkan oleh hipotesis tentang sifat proses perubahan keadaan dalam sistem yang dimodelkan. Misalnya, kasus yang sangat menarik adalah hipotesis tentang “ Markovianitas » proses (dinamai menurut ilmuwan Rusia A.A. Markov - awal abad ke-20). Proses Markov adalah kasus suatu proses dengan probabilitas deterministik, yang sejarah awal perubahan keadaan sistem pada interval waktu sebelumnya tidak signifikan untuk menetapkan probabilitas terjadinya peristiwa berikutnya - signifikansi utama diberikan kepada keadaannya saat ini. Jika ada kepercayaan pada proses Markovian, hal ini secara signifikan mengubah gagasan sistem (dapat dianggap sebagai “inersia”, sebagian besar bergantung pada keadaannya saat ini dan sifat pengaruh yang mengganggu). Prinsip Markov ditemukan dalam analisis teks dalam bahasa alami, dimana kemungkinan kemunculan karakter berikutnya dapat diprediksi berdasarkan analisis statistik susunan teks dalam bahasa tertentu.

Pemodelan statistik erat kaitannya dengan pemodelan simulasi , di mana model objek sering kali “dibenamkan dalam lingkungan probabilistik (statistik)” di mana berbagai situasi dan mode fungsi model/objek dimainkan. Namun, model simulasi juga dapat diimplementasikan dalam lingkungan deterministik.

Metode pemodelan statistik banyak digunakan dalam bidang perencanaan dan manajemen strategis. Meluasnya penggunaan metode pemodelan statistik di bidang manajemen operasional terhambat oleh tingginya kompleksitas proses pemodelan. Hal ini terutama disebabkan oleh kebutuhan akan elaborasi matematis yang mendalam terhadap model dan tingginya tuntutan yang dibebankan pada pengetahuan matematika pengguna.

Pemodelan Statistik

metode numerik untuk memecahkan masalah matematika, di mana kuantitas yang diperlukan diwakili oleh karakteristik probabilistik dari beberapa fenomena acak, fenomena ini dimodelkan, setelah itu karakteristik yang diperlukan kira-kira ditentukan melalui pemrosesan statistik dari "pengamatan" model. Misalnya, perlu menghitung aliran panas dalam pelat logam tipis yang dipanaskan, yang ujung-ujungnya dijaga pada suhu nol. Distribusi panas dijelaskan dengan persamaan yang sama seperti penyebaran noda cat pada lapisan cairan (lihat Konduktivitas termal, Difusi). Oleh karena itu, mereka mensimulasikan gerakan bidang Brown dari partikel “cat” di pelat, memantau posisinya pada saat tertentu kτ, k= 0, 1, 2,... Diasumsikan secara kasar bahwa dalam interval kecil τ partikel bergerak satu langkah H kemungkinan yang sama ke segala arah. Setiap kali arahnya dipilih secara acak, terlepas dari semua yang sebelumnya. Hubungan antara τ dan H ditentukan oleh koefisien konduktivitas termal. Pergerakan dimulai dari sumber panas dan berakhir ketika tepi pertama kali tercapai (terlihat “cat” menempel ke tepi). Aliran panas Q (C) melalui bagian batas C diukur dengan jumlah cat yang menempel. Dengan jumlah total N partikel menurut hukum bilangan besar perkiraan seperti itu memberikan kesalahan relatif acak berorde h karena keleluasaan model yang dipilih).

Nilai yang diinginkan diwakili oleh ekspektasi matematis (Lihat Ekspektasi matematis) dari fungsi numerik F dari hasil acak ω dari fenomena: , yaitu, integral atas ukuran probabilitas P (lihat Ukuran suatu himpunan). Untuk evaluasi , dimana ω 1 ,..., ω N hasil simulasi dapat dilihat sebagai rumus kuadratur untuk integral yang ditunjukkan dengan node acak ω k dan kesalahan acak R N biasanya diterima , menganggap kesalahan besar dapat diabaikan; Penyebaran Df dapat dinilai melalui observasi (lihat Teori kesalahan).

Dalam contoh di atas F(ω)= 1 , ketika lintasan berakhir di C; jika tidak F(ω) = 0. Varians

Pelaksanaan setiap "percobaan" dibagi menjadi dua bagian: "pengundian" dari hasil acak ω dan perhitungan fungsi selanjutnya F(ω). Jika ruang semua hasil dan ukuran probabilitas P terlalu rumit, penggambarannya dilakukan secara berurutan dalam beberapa tahap (lihat contoh). Pemilihan acak pada setiap tahap dilakukan dengan menggunakan nomor acak, misalnya dihasilkan oleh beberapa sensor fisik; Peniruan aritmatikanya juga digunakan - bilangan pseudorandom (lihat bilangan acak dan pseudorandom). Prosedur pemilihan acak serupa digunakan dalam statistik matematika dan teori permainan.

SM banyak digunakan untuk menyelesaikan persamaan integral di komputer, misalnya dalam studi sistem besar (lihat Sistem besar). Mereka nyaman karena keserbagunaannya, biasanya tidak memerlukan banyak memori. Kerugiannya adalah kesalahan acak yang besar, yang berkurang terlalu lambat seiring dengan bertambahnya jumlah eksperimen. Oleh karena itu, metode transformasi model telah dikembangkan yang memungkinkan untuk mengurangi sebaran nilai yang diamati dan volume percobaan model.

menyala.: Metode uji statistik (metode Monte Carlo), M., 1962; Ermakov S.M., Metode Monte Carlo dan masalah terkait, M., 1971.

N. N. Chentsov.


Ensiklopedia Besar Soviet. - M.: Ensiklopedia Soviet. 1969-1978 .

Lihat apa itu “Pemodelan Statistik” di kamus lain:

    Studi pemodelan statistik dan ekonometrik objek pengetahuan berdasarkan model statistiknya; konstruksi dan studi model objek, proses atau fenomena kehidupan nyata (misalnya: proses ekonomi di ... ... Wikipedia

    Pemodelan Statistik- cara untuk mempelajari proses perilaku sistem probabilistik dalam kondisi di mana interaksi internal dalam sistem ini tidak diketahui. Ini terdiri dari peniruan mesin dari proses yang sedang dipelajari, yang seolah-olah disalin ke... ... Kamus ekonomi dan matematika

    Sebuah metode matematika terapan dan komputasi, yang terdiri dari implementasi stokastik yang dikembangkan secara khusus pada komputer. model dari fenomena atau objek yang diteliti. Perluasan cakupan penerapan S.m dikaitkan dengan pesatnya perkembangan teknologi dan khususnya... ... Ensiklopedia Matematika

    Pemodelan situasi menggunakan pola statistik yang melekat pada fenomena yang sedang dipertimbangkan. Kamus istilah bisnis. Akademik.ru. 2001 ... Kamus istilah bisnis

    Pemodelan adalah studi tentang objek pengetahuan berdasarkan modelnya; membangun dan mempelajari model objek, proses atau fenomena kehidupan nyata untuk memperoleh penjelasan atas fenomena tersebut, serta untuk memprediksi fenomena yang menarik... ... Wikipedia

    PEMODELAN SIMULASI dalam sosiologi- jenis pemodelan matematika yang terdiri dari reproduksi proses sosial atau fungsi sistem sosial di komputer. Hampir selalu melibatkan reproduksi faktor acak yang mempengaruhi fenomena yang sedang dipelajari, dan, sebagai konsekuensinya,... ... Sosiologi: Ensiklopedia

    PEMODELAN, STATISTIK- pengembangan berbagai model yang mencerminkan pola statistik dari objek, fenomena yang dijelaskan. Ciri khusus yang umum dari model ini adalah pertimbangan gangguan atau penyimpangan acak. Objek S.m. berbeda... ... Kamus ekonomi besar

    PEMODELAN STATISTIK- representasi atau deskripsi suatu fenomena tertentu atau sistem hubungan antar fenomena melalui sekumpulan variabel (indikator, karakteristik) dan hubungan statistik di antara mereka. Tujuan dari M.S. (seperti pemodelan lainnya) bayangkan... ... Sosiologi: Ensiklopedia

    Untuk menyempurnakan artikel ini, disarankan?: Perbaiki artikel sesuai dengan aturan gaya Wikipedia. Pemodelan simulasi (situasi... Wikipedia

    PEMODELAN SIMULASI- (...dari sampel model Perancis) metode mempelajari setiap fenomena dan proses menggunakan uji statistik (metode Monte Carlo) dengan menggunakan komputer. Metode ini didasarkan pada penggambaran (simulasi) pengaruh faktor-faktor acak terhadap fenomena yang diteliti atau... ... Kamus Ensiklopedis Psikologi dan Pedagogi

Buku

  • Pemodelan statistik. Metode Monte Carlo. Buku teks untuk gelar sarjana dan master, Mikhailov G.A. Buku teks ini dikhususkan untuk fitur pemodelan variabel acak, proses, dan bidang. Perhatian khusus diberikan pada integrasi numerik, khususnya metode Monte Carlo. Solusi diberikan...

Statistik matematika adalah salah satu cabang matematika yang mengembangkan metode untuk mencatat, mendeskripsikan, dan menganalisis data observasi dan eksperimen guna membangun model probabilistik dari fenomena dan proses acak. Tergantung pada sifat matematis hasil pengamatan tertentu, statistik matematika dibagi menjadi statistik bilangan, analisis statistik multivariat, analisis fungsi (proses) dan deret waktu, statistik objek yang bersifat non-numerik. Statistik matematika menggabungkan berbagai metode analisis statistik berdasarkan penggunaan pola statistik atau karakteristiknya.

Sejarah statistika biasanya dianggap bermula dari masalah pemulihan ketergantungan, sejak dikembangkan oleh K. Gauss pada tahun 1794 (menurut sumber lain - pada tahun 1795) metode kuadrat terkecil. Perkembangan metode untuk memperkirakan data dan mereduksi dimensi deskripsi dimulai lebih dari 100 tahun yang lalu, ketika K. Pearson menciptakan metode komponen utama. Kemudian mereka dikembangkan analisis faktor, berbagai metode konstruksi (analisis klaster), analisis dan penggunaan (analisis diskriminan) klasifikasi (tipologi) dan lain-lain Pada awal abad ke-20. Teori statistik matematika dikembangkan oleh A. A. Chuprov. Kontribusi signifikan terhadap teori proses acak dibuat oleh A. A. Markov, E. E. Slutsky, A. N. Kolmogorov, A. Ya. Khinchin dan lain-lain, Dikembangkan pada sepertiga pertama abad ke-20. teori analisis data disebut statistik parametrik, karena objek studi utamanya adalah sampel dari distribusi yang dijelaskan oleh satu atau sejumlah kecil parameter. Yang paling umum adalah keluarga kurva Pearson, yang ditentukan oleh empat parameter. Yang paling populer adalah distribusi normal. Untuk menguji hipotesis digunakan uji Pearson, Student, dan Fisher. Metode kemungkinan maksimum dan analisis varians diusulkan, dan ide dasar perencanaan eksperimen dirumuskan.

Pada tahun 1954, Akademisi Akademi Ilmu Pengetahuan SSR Ukraina B.V. Gnedenko memberikan definisi berikut: “Statistik terdiri dari tiga bagian:

  • 1) pengumpulan informasi statistik, mis. informasi yang mengkarakterisasi unit individu dari setiap agregat massa;
  • 2) studi statistik dari data yang diperoleh, yang terdiri dari mengidentifikasi pola-pola yang dapat ditetapkan berdasarkan data observasi massal;
  • 3) pengembangan teknik observasi statistik dan analisis data statistik.

Bagian terakhir sebenarnya merupakan isi statistik matematika."

Menurut tingkat kekhususan metode yang terkait dengan perendaman dalam masalah tertentu, ada tiga jenis kegiatan ilmiah dan terapan di bidang metode statistik analisis data:

  • a) pengembangan dan penelitian metode tujuan umum, tanpa memperhatikan kekhususan bidang penerapannya;
  • b) pengembangan dan penelitian model statistik fenomena dan proses nyata sesuai dengan kebutuhan bidang kegiatan tertentu;
  • c) penerapan metode dan model statistik untuk analisis statistik data tertentu.

Metode analisis statistik yang paling umum adalah:

  • analisis regresi (berdasarkan perbandingan ekspektasi matematis);
  • analisis varians (berdasarkan perbandingan varians);
  • analisis korelasi (memperhitungkan ekspektasi matematis, varians dan karakteristik hubungan antara peristiwa atau proses);
  • analisis faktor (pemrosesan statistik dari eksperimen multifaktorial);
  • korelasi peringkat (kombinasi korelasi dan analisis faktor).

Ketika menerapkan berbagai metode statistik matematika, pola statistik atau karakteristiknya diperoleh dengan berbagai cara: dengan mengamati dan mempelajari sampel, menggunakan metode perkiraan berdasarkan berbagai metode mengubah atau membagi sampel ke dalam bentuk deret variasi, membagi sampel menjadi aliran , bagian, interval waktu acak dan sebagainya.

Statistik matematika digunakan dalam berbagai bidang manajemen.

Istilah "statistik" awalnya digunakan untuk menggambarkan kondisi ekonomi dan politik suatu negara atau bagiannya. Misalnya, definisi tersebut berasal dari tahun 1792: “statistik menggambarkan keadaan suatu negara pada saat ini atau pada suatu saat yang diketahui di masa lalu.” Dan saat ini, kegiatan layanan statistik negara sesuai dengan definisi ini. Statistik didefinisikan sebagai cabang ilmu pengetahuan yang berhubungan dengan masalah umum pengumpulan, pengukuran dan analisis data statistik massal (kuantitatif atau kualitatif); studi tentang sisi kuantitatif fenomena sosial massa dalam bentuk numerik.

Kata "statistik" berasal dari bahasa Latin status - keadaan. Istilah "statistik" diperkenalkan ke dalam sains oleh ilmuwan Jerman Gottfried Achenwall pada tahun 1746, mengusulkan untuk mengganti nama mata kuliah "Studi Negara" yang diajarkan di universitas-universitas Jerman dengan "Statistik", dengan demikian menandai dimulainya perkembangan statistik sebagai sebuah ilmu pengetahuan dan disiplin akademis.

Statistika menggunakan metodologi khusus untuk meneliti dan mengolah bahan: pengamatan statistik massal, metode pengelompokan, rata-rata, indeks, metode keseimbangan, metode gambar grafik dan metode analisis data statistik lainnya.

Perkembangan teknologi komputer membawa dampak yang signifikan terhadap statistika. Sebelumnya, model statistik terutama diwakili oleh model linier. Peningkatan kecepatan komputer dan pengembangan algoritme numerik yang sesuai telah meningkatkan minat terhadap model nonlinier, seperti jaringan saraf tiruan, dan mengarah pada pengembangan model statistik yang kompleks, seperti model linier umum dan model hierarki. Metode komputasi berdasarkan pengambilan sampel berulang telah tersebar luas. Saat ini statistik komputasi semakin berkembang, dan terdapat berbagai perangkat lunak statistik untuk keperluan umum dan khusus. Metode statistik digunakan dalam arah yang disebut "Data Mining" (lihat Bab 8).

Kembali

×
Bergabunglah dengan komunitas “koon.ru”!
Berhubungan dengan:
Saya sudah berlangganan komunitas “koon.ru”