สำหรับนักวิจัยมือใหม่หลายคน การประมวลผลข้อมูลทางสถิติเป็นเหมือนคอร์ดสุดท้ายในการเขียนรายงานทางวิทยาศาสตร์ เนื้อหาทางทฤษฎี เครื่องมือพื้นฐานในการวิเคราะห์ข้อมูลทางเศรษฐศาสตร์

การสร้างแบบจำลองทางสถิติ

การสร้างแบบจำลองทางสถิติและเศรษฐมิติ- การวิจัยวัตถุความรู้เกี่ยวกับแบบจำลองทางสถิติ การสร้างและการศึกษาแบบจำลองวัตถุ กระบวนการ หรือปรากฏการณ์ในชีวิตจริง (เช่น กระบวนการทางเศรษฐศาสตร์ทางเศรษฐมิติ) เพื่อให้ได้คำอธิบายปรากฏการณ์เหล่านี้ ตลอดจนทำนายปรากฏการณ์หรือตัวชี้วัดที่ผู้วิจัยสนใจ

พารามิเตอร์ของแบบจำลองดังกล่าวประเมินโดยใช้วิธีการทางสถิติ ตัวอย่างเช่น วิธีความน่าจะเป็นสูงสุด วิธีกำลังสองน้อยที่สุด วิธีของโมเมนต์

Y = b_1 + b_2×X

โดยที่ Y - ค่าใช้จ่าย, X - รายได้, b_1 และ b_2 - พารามิเตอร์ของสมการ (พารามิเตอร์), คุณ - ข้อผิดพลาดสุ่ม (การรบกวน, เงื่อนไขข้อผิดพลาด)

ประเภทของแบบจำลองทางสถิติและเศรษฐมิติ

การถดถอยเชิงเส้น (OLS) การถดถอยบนตัวแปรไบนารี่ ตัวแบบ Autoregressive ระบบสมการพร้อมกัน (SEM) ตัวแบบความน่าจะเป็นเชิงเส้น (LPM) ตัวแบบ Logit (Logit) ตัวแบบ Probit (Probit) เป็นต้น

มูลนิธิวิกิมีเดีย 2010.

ดูว่า "การสร้างแบบจำลองทางสถิติ" ในพจนานุกรมอื่น ๆ คืออะไร:

การสร้างแบบจำลองทางสถิติ- วิธีการศึกษากระบวนการพฤติกรรมของระบบความน่าจะเป็นในสภาวะที่ไม่ทราบปฏิสัมพันธ์ภายในในระบบเหล่านี้ ประกอบด้วยการเลียนแบบกระบวนการที่กำลังศึกษาโดยเครื่องจักรซึ่งก็คือการคัดลอกไปยัง... ... พจนานุกรมเศรษฐศาสตร์-คณิตศาสตร์

วิธีการคณิตศาสตร์ประยุกต์และการคำนวณ ซึ่งประกอบด้วยการใช้งานคอมพิวเตอร์ที่มีสุ่มที่พัฒนาขึ้นเป็นพิเศษ แบบจำลองปรากฏการณ์หรือวัตถุที่กำลังศึกษา การขยายขอบเขตการใช้งานของ S. m. มีความเกี่ยวข้องกับการพัฒนาเทคโนโลยีอย่างรวดเร็วและโดยเฉพาะอย่างยิ่ง... ... สารานุกรมคณิตศาสตร์

วิธีการเชิงตัวเลขสำหรับการแก้ปัญหาทางคณิตศาสตร์ ซึ่งปริมาณที่ต้องการแสดงด้วยคุณลักษณะความน่าจะเป็นของปรากฏการณ์สุ่มบางปรากฏการณ์ ปรากฏการณ์นี้จะถูกจำลองขึ้น หลังจากนั้นจึงกำหนดคุณลักษณะที่จำเป็นโดยประมาณ... ... สารานุกรมผู้ยิ่งใหญ่แห่งสหภาพโซเวียต

การสร้างแบบจำลองสถานการณ์โดยใช้รูปแบบทางสถิติที่มีอยู่ในปรากฏการณ์ที่พิจารณา พจนานุกรมคำศัพท์ทางธุรกิจ Akademik.ru. 2544 ... พจนานุกรมคำศัพท์ทางธุรกิจ

การสร้างแบบจำลองคือการศึกษาวัตถุแห่งความรู้เกี่ยวกับแบบจำลอง การสร้างและศึกษาแบบจำลองวัตถุ กระบวนการ หรือปรากฏการณ์ในชีวิตจริง เพื่อให้ได้คำอธิบายปรากฏการณ์เหล่านี้ พร้อมทั้งทำนายปรากฏการณ์ที่น่าสนใจ... ... Wikipedia

แบบจำลองการจำลองในสังคมวิทยา- การสร้างแบบจำลองทางคณิตศาสตร์ประเภทหนึ่งที่ประกอบด้วยการทำซ้ำกระบวนการทางสังคมหรือการทำงานของระบบสังคมบนคอมพิวเตอร์ เกือบทุกครั้งเกี่ยวข้องกับการทำซ้ำของปัจจัยสุ่มที่มีอิทธิพลต่อปรากฏการณ์ที่กำลังศึกษาอยู่ และผลที่ตามมาก็คือ... ... สังคมวิทยา: สารานุกรม

การสร้างแบบจำลองสถิติ- การพัฒนาแบบจำลองต่าง ๆ ที่สะท้อนรูปแบบทางสถิติของวัตถุปรากฏการณ์ที่อธิบายไว้ คุณลักษณะเฉพาะทั่วไปของรุ่นเหล่านี้คือการพิจารณาการรบกวนหรือการเบี่ยงเบนแบบสุ่ม วัตถุส.ม. แตกต่าง... ... พจนานุกรมเศรษฐศาสตร์ขนาดใหญ่

การสร้างแบบจำลองทางสถิติ- การแสดงหรือคำอธิบายของปรากฏการณ์หรือระบบความสัมพันธ์ระหว่างปรากฏการณ์ผ่านชุดตัวแปร (ตัวบ่งชี้ลักษณะ) และความสัมพันธ์ทางสถิติระหว่างสิ่งเหล่านั้น เป้าหมายของ M.S. (เหมือนโมเดลอื่นๆ) ลองนึกภาพ... ... สังคมวิทยา: สารานุกรม

แนะนำให้ปรับปรุงบทความนี้: แก้ไขบทความตามกฎโวหารของวิกิพีเดีย การสร้างแบบจำลองสถานการณ์จำลอง (สถานการณ์... Wikipedia

การสร้างแบบจำลองการจำลอง- (...จากตัวอย่างแบบจำลองภาษาฝรั่งเศส) วิธีการศึกษาปรากฏการณ์และกระบวนการใด ๆ โดยใช้การทดสอบทางสถิติ (วิธีมอนติคาร์โล) โดยใช้คอมพิวเตอร์ วิธีการนี้อาศัยการวาด (จำลอง) อิทธิพลของปัจจัยสุ่มต่อปรากฏการณ์ที่กำลังศึกษาหรือ... ... พจนานุกรมสารานุกรมจิตวิทยาและการสอน

หนังสือ

การสร้างแบบจำลองทางสถิติ วิธีการมอนติคาร์โล หนังสือเรียนสำหรับระดับปริญญาตรีและปริญญาโท Mikhailov G.A. หนังสือเรียนนี้เน้นไปที่คุณสมบัติของการสร้างแบบจำลองตัวแปรสุ่ม กระบวนการ และสาขาต่างๆ ความสนใจเป็นพิเศษจะจ่ายให้กับปริพันธ์เชิงตัวเลข โดยเฉพาะอย่างยิ่งวิธีมอนติคาร์โล มีทางออกให้...

ส่งผลงานดีๆ ของคุณในฐานความรู้ได้ง่ายๆ ใช้แบบฟอร์มด้านล่าง

นักศึกษา นักศึกษาระดับบัณฑิตศึกษา นักวิทยาศาสตร์รุ่นเยาว์ ที่ใช้ฐานความรู้ในการศึกษาและการทำงาน จะรู้สึกขอบคุณเป็นอย่างยิ่ง

โพสต์เมื่อ http://www.allbest.ru/

กระทรวงศึกษาธิการรัสเซีย

การศึกษาอิสระของรัฐบาลกลาง
สถาบันการศึกษาวิชาชีพชั้นสูง
"มหาวิทยาลัยสหพันธรัฐใต้"

ภาควิชาสารสนเทศและอุปกรณ์การวัดและเทคโนโลยี

พิเศษ

230201 ระบบสารสนเทศและเทคโนโลยี

เชิงนามธรรม

เรื่อง: "องค์กรวิจัยและพัฒนา"

ในหัวข้อ: “วิธีการสร้างแบบจำลองทางคณิตศาสตร์ทางสถิติ”

จัดทำโดยนักเรียน: Strotsev Vasily Andreevich

ครู: Gusenko Tamara Grigorievna

1. องค์ประกอบของสถิติทางคณิตศาสตร์

สถิติทางคณิตศาสตร์เป็นสาขาหนึ่งของคณิตศาสตร์ที่เกี่ยวข้องกับวิธีการทางคณิตศาสตร์ในการจัดระบบ การประมวลผล และการใช้ข้อมูลทางสถิติเพื่อการสรุปทางวิทยาศาสตร์และการปฏิบัติ ข้อมูลทางสถิติในที่นี้เข้าใจว่าเป็นข้อมูลเกี่ยวกับจำนวนออบเจ็กต์ในคอลเลกชันที่ครอบคลุมไม่มากก็น้อยที่มีลักษณะบางอย่าง

เป้าหมายหลักของสถิติทางคณิตศาสตร์คือการได้ข้อสรุปที่มีความหมายและอิงทางวิทยาศาสตร์จากข้อมูลที่มีการกระจายแบบสุ่ม ในเวลาเดียวกัน ปรากฏการณ์ที่กำลังศึกษาอยู่ซึ่งสร้างข้อมูลเหล่านี้ มักซับซ้อนเกินกว่าที่จะสร้างคำอธิบายที่สมบูรณ์ซึ่งสะท้อนรายละเอียดทั้งหมดได้ ดังนั้น ข้อสรุปทางสถิติจึงจัดทำขึ้นบนพื้นฐานของแบบจำลองความน่าจะเป็นทางคณิตศาสตร์ของปรากฏการณ์สุ่มจริง ซึ่งควรสร้างคุณลักษณะที่สำคัญขึ้นมาใหม่ และไม่รวมคุณลักษณะที่ถือว่าไม่สำคัญ วิธีการทางสถิติทางคณิตศาสตร์ทำให้สามารถกำหนดลักษณะความน่าจะเป็นของตัวแปรสุ่มที่เข้าร่วมในแบบจำลองทางคณิตศาสตร์ที่อธิบายปรากฏการณ์นี้ได้โดยอาศัยการสังเกตปรากฏการณ์ที่กำลังศึกษา

งานของสถิติทางคณิตศาสตร์ - การสร้างรูปแบบซึ่งเป็นปรากฏการณ์สุ่มมวล - ขึ้นอยู่กับการศึกษาข้อมูลทางสถิติ - ผลการสังเกต - โดยใช้วิธีการของทฤษฎีความน่าจะเป็น ข้อมูลทางสถิติคือข้อมูลที่ได้รับจากการสำรวจวัตถุหรือปรากฏการณ์จำนวนมาก ดังนั้นสถิติทางคณิตศาสตร์จึงเกี่ยวข้องกับปรากฏการณ์มวล

งานแรกของสถิติทางคณิตศาสตร์คือการระบุวิธีการรวบรวมและจัดกลุ่มข้อมูลทางสถิติที่ได้รับจากการสังเกตหรือจากการทดลองที่ออกแบบมาเป็นพิเศษ

ภารกิจที่สองของสถิติทางคณิตศาสตร์คือการพัฒนาวิธีการวิเคราะห์ข้อมูลทางสถิติขึ้นอยู่กับวัตถุประสงค์ของการศึกษา

สถิติทางคณิตศาสตร์สมัยใหม่พัฒนาวิธีการกำหนดจำนวนการทดสอบที่จำเป็นก่อนเริ่มการศึกษา ระหว่างการศึกษา และแก้ปัญหาอื่นๆ อีกมากมาย สถิติทางคณิตศาสตร์สมัยใหม่ถูกกำหนดให้เป็นศาสตร์แห่งการตัดสินใจภายใต้เงื่อนไขของความไม่แน่นอน

หน้าที่ของสถิติทางคณิตศาสตร์คือการสร้างวิธีการรวบรวมและประมวลผลข้อมูลทางสถิติเพื่อให้ได้ข้อสรุปทางวิทยาศาสตร์และการปฏิบัติ

1.1 ข้อมูลทางสถิติทั่วไปและตัวอย่าง

ปล่อยให้มีความจำเป็นต้องศึกษาชุดของวัตถุที่เป็นเนื้อเดียวกันโดยคำนึงถึงคุณลักษณะเชิงคุณภาพหรือเชิงปริมาณที่กำหนดลักษณะของวัตถุเหล่านี้

วัตถุมีหรือไม่มีลักษณะเชิงคุณภาพ ไม่สามารถวัดผลได้โดยตรง (เช่น ความเชี่ยวชาญด้านกีฬา คุณสมบัติ สัญชาติ สังกัดอาณาเขต ฯลฯ)

คุณลักษณะเชิงปริมาณแสดงถึงผลลัพธ์ของการนับหรือการวัด ด้วยเหตุนี้จึงแบ่งออกเป็นแบบไม่ต่อเนื่องและต่อเนื่อง

บางครั้งมีการตรวจสอบอย่างสมบูรณ์เช่น ตรวจสอบแต่ละวัตถุในประชากรเกี่ยวกับลักษณะที่พวกเขาสนใจ ในทางปฏิบัติ การตรวจต่อเนื่องมักไม่ค่อยได้ใช้ ตัวอย่างเช่น หากประชากรมีวัตถุจำนวนมาก ก็เป็นไปไม่ได้ทางกายภาพที่จะดำเนินการสำรวจที่ครอบคลุม ในกรณีเช่นนี้ วัตถุจำนวนจำกัดจะถูกสุ่มเลือกจากประชากรทั้งหมดและนำไปศึกษา มีทั้งประชากรทั่วไปและกลุ่มตัวอย่าง

ประชากรตัวอย่าง (ตัวอย่าง) คือกลุ่มของวัตถุที่เลือกแบบสุ่ม

ประชากรทั่วไป (หลัก) คือกลุ่มของวัตถุที่ใช้สร้างตัวอย่าง

ปริมาตรของประชากร (ตัวอย่างหรือทั่วไป) คือจำนวนวัตถุในประชากรนี้ ตัวอย่างเช่น หากเลือก 100 ส่วนจาก 1,000 ส่วนสำหรับการตรวจสอบ ขนาดประชากรคือ N = 1,000 และขนาดตัวอย่างคือ n = 100 จำนวนวัตถุในประชากร N เกินขนาดตัวอย่าง n อย่างมีนัยสำคัญ

1.2 วิธีการสุ่มตัวอย่าง

เมื่อรวบรวมตัวอย่าง มีสองวิธีในการดำเนินการ: หลังจากเลือกและสังเกตวัตถุแล้ว วัตถุนั้นอาจจะส่งคืนให้กับประชากรหรือไม่ก็ได้ ตามที่ระบุไว้ข้างต้น ตัวอย่างจะถูกแบ่งออกเป็นแบบทำซ้ำและไม่ซ้ำ

การสุ่มตัวอย่างซ้ำคือตัวอย่างที่วัตถุที่เลือก (ก่อนเลือกรายการถัดไป) จะถูกส่งกลับไปยังประชากร

การสุ่มตัวอย่างแบบไม่ทำซ้ำคือตัวอย่างที่วัตถุที่เลือกไม่ได้ถูกส่งกลับไปยังประชากร

เพื่อให้ข้อมูลตัวอย่างมีความน่าเชื่อถือเพียงพอที่จะตัดสินลักษณะของประชากรที่สนใจ จำเป็นที่วัตถุตัวอย่างจะต้องเป็นตัวแทนอย่างถูกต้อง (ตัวอย่างจะต้องเป็นตัวแทนสัดส่วนของประชากรอย่างถูกต้อง) - ตัวอย่างจะต้องเป็นตัวแทน (ตัวแทน ).

ตัวอย่างจะเป็นตัวแทนหาก:

· แต่ละวัตถุตัวอย่างจะถูกสุ่มเลือกจากประชากรทั่วไป

· วัตถุทั้งหมดมีความน่าจะเป็นเท่ากันที่จะรวมอยู่ในตัวอย่าง

1.3 วิธีการจัดกลุ่มสถิติ

1.3.1 ซีรีย์รูปแบบที่ไม่ต่อเนื่อง

โดยปกติแล้วข้อมูลที่สังเกตได้จะมีตัวเลขจำนวนมากจัดเรียงไม่เป็นระเบียบ เมื่อพิจารณาจากชุดตัวเลขนี้ เป็นการยากที่จะระบุรูปแบบของการเปลี่ยนแปลง (การเปลี่ยนแปลง) เพื่อศึกษารูปแบบการแปรผันของค่าของตัวแปรสุ่ม ข้อมูลการทดลองจะถูกประมวลผล

ตัวอย่างที่ 1 มีการสังเกตตัวเลข เอ็กซ์คะแนนที่นักศึกษามหาวิทยาลัยได้รับจากการสอบ การสังเกตภายในหนึ่งชั่วโมงให้ผลลัพธ์ดังต่อไปนี้: 3; 4; 3; 5; 4; 2; 2; 4; 4; 3; 5; 2; 4; 5; 4; 3; 4; 3; 3; 4; 4; 2; 2; 5; 5; 4; 5; 2; 3; 4; 4; 3; 4; 5; 2; 5; 5; 4; 3; 3; 4; 2; 4; 4; 5; 4; 3; 5; 3; 5; 4; 4; 5; 4; 4; 5; 4; 5; 5; 5. นี่คือหมายเลข เอ็กซ์เป็นตัวแปรสุ่มแบบไม่ต่อเนื่อง และข้อมูลที่ได้รับเกี่ยวกับตัวแปรนี้แสดงถึงข้อมูลทางสถิติ (สังเกตได้)

โดยการจัดเรียงข้อมูลข้างต้นตามลำดับที่ไม่ลดลงและจัดกลุ่มเพื่อให้ในแต่ละกลุ่มค่าของตัวแปรสุ่มเท่ากัน จะได้รับชุดข้อมูลการสังเกตที่ได้รับการจัดอันดับ

ในตัวอย่างที่ 1 เรามีสี่กลุ่มที่มีค่าตัวแปรสุ่มดังต่อไปนี้: 2; 3; 4; 5. ค่าของตัวแปรสุ่มที่สอดคล้องกับกลุ่มแยกต่างหากของชุดข้อมูลที่สังเกตได้ซึ่งจัดกลุ่มเรียกว่าตัวแปร และการเปลี่ยนแปลงของค่านี้เรียกว่าการเปลี่ยนแปลง

ตัวเลือกจะแสดงด้วยตัวอักษรละตินตัวเล็กพร้อมดัชนีที่สอดคล้องกับหมายเลขซีเรียลของกลุ่ม - ซี. ตัวเลขที่แสดงจำนวนครั้งที่ตัวแปรที่สอดคล้องกันเกิดขึ้นในการสังเกตจำนวนหนึ่งเรียกว่าความถี่ของตัวแปรและถูกกำหนดตามนั้น - พรรณี.

ผลรวมของความถี่ทั้งหมดของอนุกรมคือขนาดตัวอย่าง อัตราส่วนของความถี่ตัวแปรต่อขนาดตัวอย่าง พรรณี/n = วิเรียกว่าความถี่สัมพัทธ์

การกระจายทางสถิติของกลุ่มตัวอย่างคือรายการตัวเลือกและความถี่ที่สอดคล้องกันหรือความถี่สัมพัทธ์ (ตารางที่ 1 ตารางที่ 2)

ตัวอย่างที่ 2 มีการระบุการกระจายความถี่ของการสุ่มตัวอย่างตามปริมาตร n = 20:

ตารางที่ 1

ควบคุม: 0,15 + 0,50 + 0, 35 = 1.

การแจกแจงทางสถิติยังสามารถระบุเป็นลำดับของช่วงเวลาและความถี่ที่สอดคล้องกับช่วงเวลาเหล่านั้นได้ (ผลรวมของความถี่ที่อยู่ภายในช่วงเวลานี้จะถือเป็นความถี่ที่สอดคล้องกับช่วงเวลา)

ชุดการแจกแจงแบบแยกส่วนคือชุดตัวเลือกแบบจัดอันดับ ซีด้วยความถี่ที่สอดคล้องกัน พรรณีหรือความถี่สัมพัทธ์ วิ.

ตัวอย่างเช่น 1 ที่พิจารณาข้างต้น ชุดรูปแบบที่แยกไม่ต่อเนื่องมีรูปแบบ:

ตารางที่ 3

ควบคุม: ผลรวมของความถี่ทั้งหมดของซีรีย์รูปแบบ (ผลรวมของค่าในแถวที่สองของตารางที่ 3) คือขนาดตัวอย่าง (ในตัวอย่างที่ 1 n = 60 ); ผลรวมของความถี่สัมพัทธ์ของซีรีย์รูปแบบจะต้องเท่ากับ 1 (ผลรวมของค่าของแถวที่สามของตารางที่ 3)

1.3.2 อนุกรมความแปรผันของช่วง

หากตัวแปรสุ่มภายใต้การศึกษามีความต่อเนื่องการจัดอันดับและการจัดกลุ่มค่าที่สังเกตได้มักจะไม่อนุญาตให้ระบุลักษณะเฉพาะของการแปรผันในค่าของมัน สิ่งนี้อธิบายได้จากข้อเท็จจริงที่ว่าค่าแต่ละค่าของตัวแปรสุ่มสามารถแตกต่างกันได้เพียงเล็กน้อยเท่าที่ต้องการ ดังนั้นในจำนวนรวมของข้อมูลที่สังเกต ค่าที่เหมือนกันของปริมาณจึงแทบจะไม่เกิดขึ้น และความถี่ของ ตัวแปรมีความแตกต่างกันเล็กน้อย

นอกจากนี้ยังเป็นไปไม่ได้ที่จะสร้างอนุกรมแบบแยกสำหรับตัวแปรสุ่มแบบแยกซึ่งจำนวนค่าที่เป็นไปได้ซึ่งมีขนาดใหญ่ ในกรณีเช่นนี้ ควรสร้างอนุกรมการแจกแจงความแปรผันตามช่วงเวลา

ในการสร้างอนุกรมดังกล่าว ช่วงเวลาทั้งหมดของการแปรผันของค่าที่สังเกตได้ของตัวแปรสุ่มจะถูกแบ่งออกเป็นช่วงจำนวนบางส่วน และความถี่ของการเกิดค่าตัวแปรในแต่ละช่วงบางส่วนจะถูกคำนวณ

ซีรีย์การแปรผันช่วงเวลาคือชุดของช่วงเวลาที่ได้รับคำสั่งของค่าที่แตกต่างกันของตัวแปรสุ่มที่มีความถี่ที่สอดคล้องกันหรือความถี่สัมพัทธ์ของค่าของตัวแปรที่ตกอยู่ในแต่ละค่า

ในการสร้างอนุกรมช่วงเวลาที่คุณต้องการ:

1. กำหนดขนาดของช่วงเวลาบางส่วน

2. กำหนดความกว้างของช่วงเวลา

3. กำหนดขอบเขตบนและล่างสำหรับแต่ละช่วงเวลา

4. จัดกลุ่มผลการสังเกต

1. คำถามในการเลือกจำนวนและความกว้างของช่วงเวลาการจัดกลุ่มจะต้องตัดสินใจในแต่ละกรณีโดยพิจารณาจากเป้าหมาย การวิจัย ขนาดตัวอย่าง และระดับความแปรปรวนของลักษณะเฉพาะในตัวตัวอย่าง

จำนวนช่วงโดยประมาณ เคสามารถประมาณได้ตามขนาดตัวอย่างเท่านั้น n ด้วยวิธีใดวิธีหนึ่งดังต่อไปนี้:

· ตามสูตร สเตอร์เจส: k = 1 + 3.32 บันทึก n;

โดยใช้ตารางที่ 1

ตารางที่ 1

2. โดยทั่วไปควรใช้ช่องว่างที่มีความกว้างเท่ากัน เพื่อกำหนดความกว้างของช่วงเวลา ชม.คำนวณ:

· ช่วงของการเปลี่ยนแปลง ร- ค่าตัวอย่าง: R = xสูงสุด - xนาที, ที่ไหน xmaxและ เอ็กซ์มิน- ตัวเลือกการสุ่มตัวอย่างสูงสุดและต่ำสุด

·ความกว้างของแต่ละช่วงเวลา ชม.กำหนดโดยสูตรต่อไปนี้: ชม. = ร/เค.

3. ขีดจำกัดล่างของช่วงแรก xh1ถูกเลือกเพื่อให้มีตัวเลือกตัวอย่างขั้นต่ำ เอ็กซ์มินลดลงประมาณกลางช่วงเวลานี้: xh1 = xmin - 0.5 ชม.

ช่วงระยะกลางได้มาจากการเพิ่มความยาวของช่วงบางส่วนต่อท้ายช่วงก่อนหน้า ชม.:

xhi = xhi-1 +h.

การสร้างมาตราส่วนช่วงเวลาตามการคำนวณขอบเขตของช่วงเวลาจะดำเนินต่อไปจนกระทั่งถึงค่า ซีตอบสนองความสัมพันธ์:

ซี< xmax + 0,5·h .

4. ตามมาตราส่วนช่วงเวลาค่าลักษณะจะถูกจัดกลุ่ม - สำหรับแต่ละช่วงเวลาบางส่วนจะมีการคำนวณผลรวมของความถี่ พรรณีตัวเลือกที่รวมอยู่ใน ฉันช่วงเวลาที่. ในกรณีนี้ ช่วงจะรวมค่าของตัวแปรสุ่มที่มากกว่าหรือเท่ากับขีดจำกัดล่างและน้อยกว่าขีดจำกัดบนของช่วงเวลา

1.4 รูปหลายเหลี่ยมและฮิสโตแกรม

เพื่อความชัดเจน จึงได้มีการสร้างกราฟการกระจายทางสถิติต่างๆ จากข้อมูลของอนุกรมการแปรผันแบบแยกส่วน จะมีการสร้างรูปหลายเหลี่ยมของความถี่หรือความถี่สัมพัทธ์

รูปหลายเหลี่ยมความถี่คือเส้นประที่ส่วนต่างๆ เชื่อมต่อกัน ( x1; n1), (x2; n2),..., (เอ็กซ์เค; ไม่เป็นไร). ในการสร้างรูปหลายเหลี่ยมความถี่ ตัวเลือกต่างๆ จะถูกพล็อตบนแกนแอบซิสซา ซีและในการกำหนด - ความถี่ที่สอดคล้องกัน พรรณี. คะแนน ( ซี; พรรณี) เชื่อมต่อกันด้วยส่วนตรงและได้รับรูปหลายเหลี่ยมความถี่ (รูปที่ 1)

รูปหลายเหลี่ยมของความถี่สัมพัทธ์คือเส้นขาดที่ส่วนต่างๆ เชื่อมต่อกัน ( x1; ส1), (x2; ส2),..., (เอ็กซ์เค; สัปดาห์). ในการสร้างรูปหลายเหลี่ยมที่มีความถี่สัมพัทธ์ ตัวเลือกต่างๆ จะถูกพล็อตบนแกนแอบซิสซา ซีและบนพิกัด - ความถี่สัมพัทธ์ที่สอดคล้องกัน วิ. คะแนน ( ซี; วิ) เชื่อมต่อกันด้วยส่วนตรงและได้รับรูปหลายเหลี่ยมของความถี่สัมพัทธ์ ในกรณีที่มีลักษณะต่อเนื่อง แนะนำให้สร้างฮิสโตแกรม

ฮิสโตแกรมความถี่เป็นรูปขั้นที่ประกอบด้วยสี่เหลี่ยม โดยมีฐานเป็นช่วงความยาวบางส่วน ชม.และความสูงเท่ากับอัตราส่วน NIH(ความหนาแน่นของความถี่)

ในการสร้างฮิสโตแกรมความถี่ ช่วงเวลาบางส่วนจะถูกวางบนแกน Abscissa และส่วนที่ขนานกับแกน Abscissa จะถูกวาดไว้เหนือพวกมันในระยะไกล NIH.

สี่เหลี่ยม ฉัน ฮนี / ชม = พรรณี- ผลรวมของตัวเลือกความถี่ ฉัน - ช่วงเวลาที่; ดังนั้นพื้นที่ของฮิสโตแกรมความถี่จึงเท่ากับผลรวมของความถี่ทั้งหมดนั่นคือ ขนาดตัวอย่าง.

ฮิสโตแกรมความถี่สัมพัทธ์เป็นรูปขั้นที่ประกอบด้วยสี่เหลี่ยม โดยมีฐานเป็นช่วงความยาวบางส่วน ชม.และความสูงเท่ากับอัตราส่วน Wi/ชม(ความหนาแน่นความถี่สัมพัทธ์)

ในการสร้างฮิสโตแกรมของความถี่สัมพัทธ์ ช่วงเวลาบางส่วนจะถูกวางบนแกน Abscissa และส่วนที่ขนานกับแกน Abscissa จะถูกวาดไว้เหนือพวกมันในระยะไกล Wi/ชม(รูปที่ 2)

สี่เหลี่ยม ฉัน - สี่เหลี่ยมผืนผ้าบางส่วนเท่ากับ hWi/h = Wi- ความถี่สัมพัทธ์ของตัวแปรต่างๆ ที่จับได้ ฉัน-ช่วงที่ ดังนั้นพื้นที่ของฮิสโตแกรมของความถี่สัมพัทธ์จึงเท่ากับผลรวมของความถี่สัมพัทธ์ทั้งหมดนั่นคือ หน่วย.

1.5 การประมาณค่าพารามิเตอร์ประชากร

พารามิเตอร์หลักของประชากรคือค่าคาดหวังทางคณิตศาสตร์ (ค่าเฉลี่ยทั่วไป) M(X) และค่าเบี่ยงเบนมาตรฐาน ส. นี่เป็นปริมาณคงที่ที่สามารถประมาณได้จากข้อมูลตัวอย่าง การประมาณค่าของพารามิเตอร์ทั่วไปซึ่งแสดงเป็นตัวเลขเดียวเรียกว่าการประมาณค่าแบบจุด

การประมาณค่าแบบจุดของค่าเฉลี่ยทั่วไปคือค่าเฉลี่ยตัวอย่าง

ค่าเฉลี่ยตัวอย่างคือค่าเฉลี่ยเลขคณิตของคุณลักษณะในประชากรตัวอย่าง

หากมีค่าทั้งหมด x1, x2,..., xnลักษณะตัวอย่างจะแตกต่างกัน (หรือหากข้อมูลไม่ได้ถูกจัดกลุ่ม) ดังนั้น:

x1, x2,..., xn n1, n2,..., nk, และ n1 + n2 +...+ nk = n(หรือถ้าค่าเฉลี่ยตัวอย่างคำนวณจากชุดรูปแบบต่างๆ) แล้ว

ในกรณีที่ข้อมูลทางสถิติแสดงในรูปแบบของชุดการแปรผันช่วงเวลาเมื่อคำนวณค่าเฉลี่ยตัวอย่างค่ากลางของช่วงเวลาจะถือเป็นตัวเลือก

ค่าเฉลี่ยตัวอย่างเป็นคุณลักษณะหลักของตำแหน่ง โดยแสดงจุดศูนย์กลางการกระจายตัวของประชากร ทำให้สามารถระบุลักษณะประชากรที่กำลังศึกษาด้วยตัวเลขตัวเดียว ติดตามแนวโน้มการพัฒนา และเปรียบเทียบประชากรต่างๆ (ค่าเฉลี่ยตัวอย่างคือจุด ซึ่งผลรวมของการเบี่ยงเบนของการสังเกตเท่ากับ 0)

สำหรับอัตรา กับ ในการกำหนดระดับการกระจายตัว (ส่วนเบี่ยงเบน) ของตัวบ่งชี้บางตัวจากค่าเฉลี่ย พร้อมกับค่าสูงสุดและค่าต่ำสุด จะใช้แนวคิดของการกระจายตัวและส่วนเบี่ยงเบนมาตรฐาน

ความแปรปรวนตัวอย่างหรือความแปรปรวนตัวอย่าง (จากความแปรปรวนภาษาอังกฤษ) คือการวัดความแปรปรวนของตัวแปร คำนี้ได้รับการประกาศเกียรติคุณครั้งแรกโดย Fischer ในปี 1918

ความแปรปรวนตัวอย่าง Dв คือค่าเฉลี่ยเลขคณิตของกำลังสองของการเบี่ยงเบนของค่าที่สังเกตได้ของคุณลักษณะจากค่าเฉลี่ย

หากมีค่าทั้งหมด x1, x2,..., xnคุณลักษณะการสุ่มตัวอย่างปริมาณ nแตกต่างกัน ดังนั้น:

หากค่าแอตทริบิวต์ทั้งหมด x1, x2,..., xnมีความถี่ที่สอดคล้องกัน n1, n2,..., nk, และ n1 + n2 +...+ nk = n, ที่

ความแปรปรวนแตกต่างกันไปตั้งแต่ศูนย์ถึงอนันต์ ค่าสุดขีดของ 0 หมายความว่าไม่มีความแปรปรวนเมื่อค่าของตัวแปรคงที่

ค่าเบี่ยงเบนกำลังสองเฉลี่ย (ค่าเบี่ยงเบนมาตรฐาน) (จากค่าเบี่ยงเบนมาตรฐานภาษาอังกฤษ) คำนวณเป็นรากที่สองของความแปรปรวน

ยิ่งความแปรปรวนหรือค่าเบี่ยงเบนมาตรฐานสูง ค่าของตัวแปรจะกระจัดกระจายรอบๆ ค่าเฉลี่ยมากขึ้น

คุณลักษณะที่ไม่ใช่พารามิเตอร์ของตำแหน่งคือโหมดและค่ามัธยฐาน

แฟชั่น โมตัวเลือกที่มีความถี่สูงสุดหรือความถี่สัมพัทธ์เรียกว่า

ค่ามัธยฐาน ฉันเรียกว่าตัวแปร ซึ่งแบ่งอนุกรมของรูปแบบออกเป็นสองส่วน โดยมีจำนวนเท่ากับตัวแปร

ถ้าเป็นเลขคี่ ตัวเลือก (n=2k+1)

ฉัน = xk+1,

และถ้าเป็นเลขคู่ ตัวเลือก (n=2k)

ฉัน = (xk + xk+1)/2.

2. การวิเคราะห์สหสัมพันธ์และการถดถอย

2.1 การวิเคราะห์สหสัมพันธ์

ความสัมพันธ์ระหว่างการจัดกลุ่มทางสถิติทางคณิตศาสตร์

การวิเคราะห์ความสัมพันธ์เกี่ยวข้องกับการสร้างความสัมพันธ์ทางสถิติระหว่างตัวแปรสุ่ม สามารถใช้ในการวิจัยเชิงการสอนเพื่อประเมินอิทธิพลของปัจจัยบางอย่างที่มีต่อปัจจัยอื่นๆ และสร้างการเชื่อมโยงระหว่างปัจจัยเหล่านั้นร่วมกับพารามิเตอร์อื่นๆ เช่น ความคาดหวังทางคณิตศาสตร์และค่าเบี่ยงเบนมาตรฐาน การวิเคราะห์สหสัมพันธ์ไม่สามารถใช้โดยตรงในการระบุความสัมพันธ์ระหว่างเหตุและผลระหว่างกระบวนการสุ่มได้ มันสร้างการเชื่อมโยงระหว่างคุณลักษณะทางสถิติของกระบวนการสุ่มที่เกี่ยวข้องเท่านั้น

ให้มีตัวแปรสุ่มสองตัวคือ X และ Y พร้อมด้วยความคาดหวังทางคณิตศาสตร์ mx และ my ตามลำดับ ช่วงเวลาแห่งความสัมพันธ์

Kxy =M((X-mx)(Y-ของฉัน))

จะกำหนดลักษณะความสัมพันธ์ระหว่างปริมาณ X และ Y เพื่อความสะดวกในการใช้งานโมเมนต์สหสัมพันธ์จะถูกทำให้เป็นมาตรฐานตามสูตร

โดยที่ yx และ yy คือค่าเบี่ยงเบนมาตรฐานของค่า X และ Y ค่า Kk เรียกว่าสัมประสิทธิ์สหสัมพันธ์ของค่า X และ Y

สำหรับตัวแปรสุ่มแบบไม่ต่อเนื่องที่เรากำลังเผชิญอยู่ การประมาณค่าสัมประสิทธิ์สหสัมพันธ์จะคำนวณโดยใช้สูตร

สูตรในการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์นั้นใช้ได้โดยมีเงื่อนไขว่าความสัมพันธ์ระหว่างตัวแปรสุ่มนั้นเป็นเส้นตรงและแต่ละค่าเหล่านี้อยู่ภายใต้กฎปกติ

เพื่อประเมินความสัมพันธ์ทางสถิติระหว่างระดับการเตรียมตัวเข้าโรงเรียนกับผลการปฏิบัติงานของนักเรียนชั้นปีที่ 1 ในสาขาวิชา “สารสนเทศ” การเตรียมตัวเข้าโรงเรียนได้รับการประเมินโดยการทดสอบเมื่อเข้าศึกษาในมหาวิทยาลัย (ค่า X) ประเมินผลการปฏิบัติงานของนักเรียนตามผลการสอบหลังภาคการศึกษาแรก (ค่า Y) หมายเลขนักเรียนถูกกำหนดไว้ N.

ข้อมูลเบื้องต้นสำหรับการคำนวณสรุปไว้ในตาราง

การแทนที่ข้อมูลจากตารางเป็นนิพจน์ (1) เราจะได้ Kk=0.78

เราจะเห็นว่าลักษณะทางสถิติของค่า X และ Y นั้นอยู่ใกล้กัน

2.2 การวิเคราะห์การถดถอย

การวิเคราะห์การถดถอยกำหนดหน้าที่ในการศึกษาความสัมพันธ์ระหว่างตัวแปรตามและตัวแปรอิสระทางสถิติ (ตัวถดถอยหรือตัวแสดง) ในกรณีที่ง่ายที่สุด สันนิษฐานว่าการพึ่งพานี้เป็นเส้นตรง ปัญหาของการสร้างความสัมพันธ์เชิงเส้นในรูปแบบ y=ax+b กำลังได้รับการแก้ไข โดยที่ xi และ yi เป็นตัวแปรอิสระและตัวแปรตาม ตามลำดับ (i=1,2,3,...) วิธีแก้หาได้โดยวิธีกำลังสองน้อยที่สุด ค่าจะลดลง

นาที พบสัมประสิทธิ์ a และ b

สูตรการคำนวณมีดังนี้:

โดยพื้นฐานแล้ว ชุดของคะแนนที่ได้รับจากการทดลองจะถูกแทนที่ด้วยการพึ่งพาเชิงวิเคราะห์ y=ax+b โดยประมาณ การแทนที่นี้ทำให้การแปลงทางคณิตศาสตร์ง่ายขึ้นอย่างมาก และสามารถใช้ในการสร้างแบบจำลองเชิงวิเคราะห์ได้ ในกรณีทั่วไป ไม่เพียงแต่เชิงเส้นเท่านั้น แต่ยังสามารถเลือกฟังก์ชันอื่นๆ เพื่อสร้างการพึ่งพาการถดถอยได้ โดยปกติแล้วสูตรในการคำนวณพารามิเตอร์ที่ต้องการจะซับซ้อนมากขึ้น

3. วิธีการทางคณิตศาสตร์เพื่อเพิ่มประสิทธิภาพการทดลอง

3.1 วิธีการเพิ่มประสิทธิภาพ Simplex

ซิมเพล็กซ์คือรูปทรงหลายเหลี่ยมปกติที่มี n+1ด้านบนอยู่ที่ไหน พี -ปัจจัยหลายประการที่มีอิทธิพลต่อกระบวนการ ตัวอย่างเช่น หากมีปัจจัยสองประการ เริมก็เป็นรูปสามเหลี่ยมปกติ

ข้าว. 1 การเพิ่มประสิทธิภาพโดยใช้วิธีซิมเพล็กซ์

ชุดการทดลองเริ่มแรกสอดคล้องกับจุดยอดของซิมเพล็กซ์เริ่มต้น (คะแนน 1, 2 และ 3)เงื่อนไขของการทดลองครั้งแรกเหล่านี้นำมาจากช่วงของค่าปัจจัยที่สอดคล้องกับโหมดที่ทราบดีที่สุดของกระบวนการที่กำลังปรับให้เหมาะสม เปรียบเทียบผลการทดลองที่จุดที่ 1, 2 และ 3, พวกเขาพบสิ่งที่ "แย่ที่สุด" ในหมู่พวกเขา จากมุมมองของเกณฑ์การปรับให้เหมาะสมที่เลือกไว้ ตัวอย่างเช่น ให้ประสบการณ์ที่ "ล้มเหลว" ที่สุดอยู่ในจุดนั้น 1. ประสบการณ์นี้ไม่รวมอยู่ในการพิจารณา และประสบการณ์ ณ จุดนั้นจะถูกนำเข้าสู่ซิมเพล็กซ์แทน 4, ซึ่งสมมาตรกับจุดที่ 1 สัมพันธ์กับด้านตรงข้ามของสามเหลี่ยมที่เชื่อมจุดนั้น 2 และ 3.

จากนั้นพวกเขาจะเปรียบเทียบผลการทดลองที่จุดยอดของซิมเพล็กซ์ใหม่ ละทิ้งส่วนที่ "ไม่สำเร็จ" มากที่สุดและย้ายจุดยอดที่สอดคล้องกันของซิมเพล็กซ์ไปยังจุดนั้น 5. จากนั้นทำซ้ำขั้นตอนข้างต้นตลอดกระบวนการปรับให้เหมาะสม

หากถึงจุดสุดยอดของเกณฑ์การปรับให้เหมาะสมที่สุด การเคลื่อนที่ต่อไปของซิมเพล็กซ์จะหยุดลง ซึ่งหมายความว่าขั้นตอนใหม่จะนำผู้วิจัยกลับไปยังจุดก่อนหน้าในพื้นที่ตัวประกอบ

หากมีเกณฑ์การปรับให้เหมาะสมที่สุดหลายวิธีวิธีนี้จะช่วยให้คุณค้นหาเกณฑ์ที่อยู่ใกล้กับจุดของซิมเพล็กซ์ดั้งเดิมมากขึ้น ดังนั้นหากมีข้อสงสัยเกี่ยวกับการมีอยู่ของเกณฑ์การปรับให้เหมาะสมที่สุดหลายจุด จำเป็นต้องค้นหาเกณฑ์เหล่านี้ในแต่ละครั้งที่เริ่มการปรับให้เหมาะสมจากพื้นที่ใหม่ของพื้นที่ปัจจัย จากนั้นคุณควรเปรียบเทียบเงื่อนไขที่เหมาะสมที่สุดที่พบและเลือกเงื่อนไขที่ดีที่สุดจากตัวเลือกทั้งหมด

เมื่อทำการออปติไมซ์ จำเป็นต้องคำนึงถึงข้อจำกัดที่กำหนดโดยปัจจัยที่มีอิทธิพลและฟังก์ชันการตอบสนอง

สิ่งสำคัญคือต้องทราบว่าเมื่อใช้วิธีซิมเพล็กซ์ ไม่จำเป็นการทดลองซ้ำ ความจริงก็คือข้อผิดพลาดในการทดสอบแยกต่างหากอาจทำให้การเพิ่มประสิทธิภาพช้าลงบ้างเท่านั้น หากการทดลองครั้งต่อๆ ไปดำเนินไปอย่างไร้ที่ติ การเคลื่อนไหวไปสู่จุดที่เหมาะสมจะดำเนินต่อไป

เมทริกซ์ของการทดลองของซิมเพล็กซ์ดั้งเดิมในตัวแปรที่เข้ารหัสได้รับไว้ในตารางที่ 11

ค่าที่รวมอยู่ในตารางนี้คำนวณโดยใช้สูตรต่อไปนี้:

โดยที่ i คือจำนวนปัจจัยในเมทริกซ์การวางแผน สัญลักษณ์ 0 ระบุพิกัดของจุดศูนย์กลางของแผน เช่น ระดับหลัก

ตารางที่ 11

เมทริกซ์ของซิมเพล็กซ์ดั้งเดิม

หมายเลขประสบการณ์	เอ็กซ์2	ฟังก์ชั่นตอบสนอง
	เค2
	เค2

การทดลองที่นำเสนอในตาราง 11 สอดคล้องกับจุดยอดของซิมเพล็กซ์ ซึ่งด้านเท่ากับ 1 และจุดศูนย์กลางตรงกับจุดกำเนิดของพิกัด (ในตัวแปรที่เข้ารหัส)

ผลลัพธ์ของการคำนวณดำเนินการตามตาราง 11 และสูตร (*) แสดงไว้ในตาราง 12.

ตารางที่ 12

เงื่อนไขของการทดลองชุดแรก

หมายเลขประสบการณ์

แน่นอนว่าต้องมีการทดลองจำนวนมากที่สุดในช่วงเริ่มต้นของการทดลอง จากนั้น ในแต่ละขั้นตอนการเพิ่มประสิทธิภาพ จะทำการทดสอบเพียงครั้งเดียวเท่านั้น

เมื่อเริ่มต้นการปรับให้เหมาะสม คุณต้องใช้ตาราง 11 หรือ 12 คำนวณเมทริกซ์ของชุดการทดลองเริ่มต้นในตัวแปรทางกายภาพโดยใช้สูตร

ในอนาคต การดำเนินการทั้งหมดจะดำเนินการกับการดำเนินการทางกายภาพเท่านั้น1 ตัวแปร

เงื่อนไขของประสบการณ์ใหม่แต่ละรายการคำนวณโดยใช้สูตร:

ที่ไหน พ--จำนวนปัจจัยในเมทริกซ์การวางแผน

j -- หมายเลขการทดลอง;

หมายเลขตัวประกอบ i;

ค่าของปัจจัย i-th ในประสบการณ์ที่ "ไม่สำเร็จ" ที่สุดของซิมเพล็กซ์ก่อนหน้า

ควรสังเกตว่าในขั้นตอนการเพิ่มประสิทธิภาพใด ๆ ที่ดำเนินการโดยวิธี simplex สามารถรวมขั้นตอนใหม่ไว้ในโปรแกรมการวิจัยได้ ปัจจัย , ซึ่งถึงตอนนั้นก็ไม่ได้นำมาพิจารณาแต่ก็ยังคงอยู่ในระดับคงที่

ในกรณีนี้ค่าของปัจจัยที่พิจารณาก่อนหน้านี้ทั้งหมดจะถูกคำนวณโดยใช้สูตร:

โดยที่ 1= 1, 2,..., พีนั่นคือเป็นค่าเฉลี่ยเลขคณิตของพิกัดที่สอดคล้องกันของซิมเพล็กซ์ก่อนหน้า

ค่าของปัจจัยที่เพิ่งแนะนำถูกกำหนดโดยสูตร:

โดยที่ x0(n+1) คือระดับหลักของปัจจัยนี้

Dxn+1—ขั้นตอนการเปลี่ยนแปลงที่เลือกสำหรับปัจจัยที่กำหนด

ร+1, KN+1 --ค่าคำนวณโดยใช้สูตร (*)

โปรดทราบว่าการเพิ่มปัจจัยใหม่ให้กับ "การทดสอบแฟคทอเรียล" ที่สมบูรณ์จะมาพร้อมกับจำนวนการทดลองที่เพิ่มขึ้นสองเท่า . ในแง่นี้ วิธีซิมเพล็กซ์มีข้อได้เปรียบที่ชัดเจน .

ตัวอย่างที่ 3.2 ปล่อยให้จำเป็นต้องปรับผลผลิตของผลิตภัณฑ์เป้าหมายให้เหมาะสมโดยใช้วิธีซิมเพล็กซ์ ที่(%) ซึ่งได้มาจากปฏิกิริยาระหว่างรีเอเจนต์สองตัวที่มีความเข้มข้น x1 และ x2 () ที่อุณหภูมิ x3 (°C)

ให้เราเลือกระดับหลักและขั้นตอนของปัจจัยต่างๆ แล้วสรุปลงในตาราง 13.

ตารางที่ 13

ค่าระดับปัจจัยและขั้นตอนการแปรผัน

	ระดับหลัก	ขั้นตอนการเปลี่ยนแปลง

โดยใช้สูตร (3.5) และตาราง ในรูปที่ 12 เราคำนวณเงื่อนไขสำหรับการดำเนินการทดลองสี่ครั้งแรกและสรุปผลลัพธ์ที่ได้รับในตาราง 14. ตัวอย่างเช่น สำหรับการทดลองครั้งที่สาม

x31=1+0.1*0==1; x32==1.50 +0.2 (--0.578) ==1.38; x33=60+5*0.204==61.

ตารางที่ 14

การเพิ่มประสิทธิภาพโดยใช้วิธีซิมเพล็กซ์

หมายเลขประสบการณ์				ฟังก์ชั่นตอบสนอง

เมื่อเปรียบเทียบผลลัพธ์ของการทดลองสี่ครั้งแรก เราจะเห็นว่าผลผลิตเป้าหมายต่ำที่สุดได้รับในการทดลองครั้งที่สาม ประสบการณ์นี้ควรถูกแยกออกจากการพิจารณาเพิ่มเติม

ให้เราแทนที่ด้วยการทดลองที่ 5 เงื่อนไขที่เราจะคำนวณโดยใช้สูตร (**):

ในซิมเพล็กซ์ใหม่ที่เกิดจากการทดลองที่ 1, 2, 4 และ 5 สิ่งที่ "ไม่สำเร็จ" มากที่สุดคือการทดลองที่ 4 เราจะแทนที่ด้วยการทดลองที่ 6 ซึ่งจะพบเงื่อนไขโดยใช้สูตรเดียวกัน (**)

ตอนนี้ให้เราพิจารณาคำถามว่าจะรวมปัจจัยอื่นในโครงการวิจัยอย่างไร เช่น ความเร็วการหมุนของเครื่องกวน ให้จนถึงตอนนี้มันคงที่และเท่ากับ 500 รอบต่อนาทีตอนนี้เราจะพิจารณาค่านี้เป็นปัจจัย x4 และใช้ขั้นตอนการเปลี่ยนแปลง Dx4 = 100 rpm

ซิมเพล็กซ์ก่อนหน้าสำหรับปัจจัยสามตัว (ดูตารางที่ 14) ประกอบด้วยการทดลองที่ 1, 2, 5 และ 6 เพื่อให้ได้ซิมเพล็กซ์ใหม่สำหรับปัจจัยสี่ตัว จากนั้นเราจะแนะนำการทดลองที่ 7 (ตารางที่ 15)

ตารางที่ 15

การเพิ่มปัจจัยใหม่ให้กับโปรแกรมเพิ่มประสิทธิภาพ

หมายเลขประสบการณ์					ฟังก์ชั่นตอบสนอง

เราพบเงื่อนไขในการทำการทดลองครั้งที่ 7 โดยใช้สูตร (3.7) และ (3.8):

โพสต์บน Allbest.ru

...

เอกสารที่คล้ายกัน

วิธีทางคณิตศาสตร์ในการจัดระบบและการใช้ข้อมูลทางสถิติเพื่อข้อสรุปทางวิทยาศาสตร์และการปฏิบัติ กฎการกระจายของตัวแปรสุ่มแบบไม่ต่อเนื่อง แนวคิดของประชากรทั่วไป ปัญหาการสังเกตทางสถิติ การกระจายตัวอย่าง

บทคัดย่อ เพิ่มเมื่อ 12/10/2010

แนวคิดของสถิติทางคณิตศาสตร์ในฐานะวิทยาศาสตร์เกี่ยวกับวิธีการจัดระบบทางคณิตศาสตร์และการใช้ข้อมูลทางสถิติเพื่อการสรุปทางวิทยาศาสตร์และการปฏิบัติ การประมาณค่าพารามิเตอร์ของการแจกแจงทางสถิติ การวิเคราะห์การคำนวณค่าเฉลี่ย

งานหลักสูตร เพิ่มเมื่อ 12/13/2014

สถิติทางคณิตศาสตร์เป็นศาสตร์แห่งวิธีการทางคณิตศาสตร์ในการจัดระบบข้อมูลทางสถิติตัวชี้วัด วาดการแจกแจงเชิงสถิติเชิงบูรณาการของประชากรตัวอย่าง สร้างฮิสโตแกรม การคำนวณค่าประมาณจุดของพารามิเตอร์

งานหลักสูตร เพิ่มเมื่อ 04/10/2011

การวิเคราะห์เบื้องต้นและลักษณะสำคัญของข้อมูลทางสถิติ การประมาณค่าพารามิเตอร์การกระจายจุด ช่วงความเชื่อมั่นสำหรับค่าคาดหวังทางคณิตศาสตร์ที่ไม่ทราบค่าและค่าเบี่ยงเบนมาตรฐาน การทดสอบสมมติฐานทางสถิติ

วิทยานิพนธ์เพิ่มเมื่อ 18/01/2559

สถิติเป็นศาสตร์แห่งปรากฏการณ์มวลชนในธรรมชาติและสังคม การรับ การประมวลผล การวิเคราะห์ข้อมูล สถิติประชากร การพยากรณ์ประชากรของรัสเซีย วิธีการประมวลผลข้อมูลทางสถิติ: องค์ประกอบของตรรกะ เชิงผสม ทฤษฎีความน่าจะเป็น

การนำเสนอเพิ่มเมื่อ 12/19/2012

การประยุกต์วิธีการเฉพาะทางสถิติตามงาน วิธีการสังเกตมวล การจัดกลุ่ม ตัวบ่งชี้ทั่วไป อนุกรมเวลา วิธีดัชนี การวิเคราะห์ความสัมพันธ์และความแปรปรวน การคำนวณค่าสถิติเฉลี่ย

ทดสอบเพิ่มเมื่อ 09.21.2009

การได้รับข้อมูลทางสถิติสำหรับคำอธิบายทั่วไปเกี่ยวกับสถานะและการพัฒนาของปรากฏการณ์ ประเภท วิธีการ และรูปแบบการจัดองค์กรของการสังเกตทางสถิติ รูปแบบทางสถิติ สรุป และการจัดกลุ่มข้อมูล ตารางสถิติและกราฟ

บทคัดย่อ เพิ่มเมื่อ 11/12/2552

การหาค่าคาดหวังทางคณิตศาสตร์และส่วนเบี่ยงเบนมาตรฐาน เพื่อเลือกกฎการกระจายสำหรับตัวอย่างข้อมูลทางสถิติเกี่ยวกับความล้มเหลวของส่วนประกอบของยานพาหนะ ค้นหาจำนวนเหตุการณ์ในช่วงเวลาที่กำหนด การคำนวณมูลค่าของเกณฑ์เพียร์สัน

ทดสอบเพิ่มเมื่อ 04/01/2014

วิธีการนำเสนอข้อมูลสถิติทางกฎหมายแบบตาราง ตัวชี้วัดที่แน่นอนและทั่วไป ปริมาณสัมพัทธ์ ประเภทหลัก และการใช้งาน ค่าเฉลี่ยเรขาคณิต โหมด และค่ามัธยฐาน วิธีการสังเกตตัวอย่าง การจำแนกอนุกรมไดนามิกส์

ทดสอบเพิ่มเมื่อ 29/03/2556

การประมวลผลข้อมูลทางสถิติเบื้องต้นเกี่ยวกับจำนวนเทอร์มินัลสมาชิกเซลลูล่าร์ที่ลงทะเบียนในปี 2551 ต่อประชากร 1,000 คนในภูมิภาครัสเซีย การประมาณค่าพารามิเตอร์ช่วง สมมติฐานเกี่ยวกับประเภทของการกระจาย การวิเคราะห์การถดถอย

สถิติทางคณิตศาสตร์เป็นสาขาหนึ่งของคณิตศาสตร์ที่พัฒนาวิธีการบันทึก อธิบาย และวิเคราะห์ข้อมูลเชิงสังเกตและการทดลอง เพื่อสร้างแบบจำลองความน่าจะเป็นของปรากฏการณ์และกระบวนการสุ่ม ขึ้นอยู่กับลักษณะทางคณิตศาสตร์ของผลการสังเกตเฉพาะ สถิติทางคณิตศาสตร์แบ่งออกเป็นสถิติของตัวเลข การวิเคราะห์ทางสถิติหลายตัวแปร การวิเคราะห์ฟังก์ชัน (กระบวนการ) และอนุกรมเวลา สถิติของวัตถุที่มีลักษณะที่ไม่ใช่ตัวเลข สถิติทางคณิตศาสตร์ผสมผสานวิธีต่างๆ ของการวิเคราะห์ทางสถิติโดยอิงจากการใช้รูปแบบทางสถิติหรือคุณลักษณะของรูปแบบเหล่านั้น

ประวัติความเป็นมาของสถิติมักจะพิจารณาโดยเริ่มจากปัญหาในการกู้คืนการพึ่งพาเนื่องจากการพัฒนาโดย K. Gauss ในปี พ.ศ. 2337 (อ้างอิงจากแหล่งข้อมูลอื่น - ในปี พ.ศ. 2338) วิธีกำลังสองน้อยที่สุดการพัฒนาวิธีการประมาณข้อมูลและลดขนาดคำอธิบายเริ่มขึ้นเมื่อกว่า 100 ปีที่แล้วเมื่อ K. Pearson สร้างขึ้น วิธีองค์ประกอบหลักต่อมาก็ได้รับการพัฒนา การวิเคราะห์ปัจจัยวิธีการก่อสร้างต่างๆ (การวิเคราะห์คลัสเตอร์)การวิเคราะห์และการใช้งาน (การวิเคราะห์จำแนก)การจำแนกประเภท (ประเภท)และอื่น ๆ ในช่วงต้นศตวรรษที่ 20 ทฤษฎีสถิติทางคณิตศาสตร์ได้รับการพัฒนาโดย A. A. Chuprov การมีส่วนร่วมที่สำคัญในทฤษฎีกระบวนการสุ่มจัดทำโดย A. A. Markov, E. E. Slutsky, A. N. Kolmogorov, A. Ya. Khinchin และคนอื่น ๆ พัฒนาขึ้นในช่วงสามแรกของศตวรรษที่ 20 ทฤษฎีการวิเคราะห์ข้อมูลเรียกว่า สถิติพาราเมตริกเนื่องจากวัตถุประสงค์หลักของการศึกษาคือตัวอย่างจากการแจกแจงที่อธิบายโดยพารามิเตอร์หนึ่งตัวหรือจำนวนเล็กน้อย ลักษณะที่พบบ่อยที่สุดคือกลุ่มของเส้นโค้ง Pearson ซึ่งกำหนดโดยพารามิเตอร์สี่ตัว ความนิยมมากที่สุดคือการแจกแจงแบบปกติ เพื่อทดสอบสมมติฐาน จะใช้การทดสอบแบบเพียร์สัน นักศึกษา และฟิชเชอร์ มีการเสนอวิธีความน่าจะเป็นสูงสุดและการวิเคราะห์ความแปรปรวน และแนวคิดพื้นฐานของการวางแผนการทดลองได้รับการกำหนด

ในปี 1954 นักวิชาการของ Academy of Sciences ของยูเครน SSR B.V. Gnedenko ให้คำจำกัดความต่อไปนี้: "สถิติประกอบด้วยสามส่วน:

1) การรวบรวมข้อมูลทางสถิติ ได้แก่ ข้อมูลที่แสดงลักษณะแต่ละหน่วยของมวลรวมใด ๆ
2) การศึกษาทางสถิติของข้อมูลที่ได้รับซึ่งประกอบด้วยการระบุรูปแบบที่สามารถสร้างขึ้นบนพื้นฐานของข้อมูลการสังเกตมวล
3) การพัฒนาเทคนิคในการสังเกตและวิเคราะห์ข้อมูลทางสถิติ

อันที่จริงส่วนสุดท้ายประกอบด้วยเนื้อหาของสถิติทางคณิตศาสตร์"

ตามระดับความจำเพาะของวิธีการที่เกี่ยวข้องกับการแช่ในปัญหาเฉพาะกิจกรรมทางวิทยาศาสตร์และประยุกต์สามประเภทในสาขาวิธีการวิเคราะห์ข้อมูลทางสถิติมีความโดดเด่น:

ก) การพัฒนาและการวิจัยวิธีการทั่วไป โดยไม่คำนึงถึงลักษณะเฉพาะของสาขาที่ประยุกต์ใช้
b) การพัฒนาและการวิจัยแบบจำลองทางสถิติของปรากฏการณ์และกระบวนการจริงตามความต้องการของกิจกรรมเฉพาะด้าน
ค) การประยุกต์วิธีการและแบบจำลองทางสถิติสำหรับการวิเคราะห์ทางสถิติของข้อมูลเฉพาะ

วิธีการวิเคราะห์ทางสถิติที่พบบ่อยที่สุดคือ:

การวิเคราะห์การถดถอย (ขึ้นอยู่กับการเปรียบเทียบความคาดหวังทางคณิตศาสตร์)
การวิเคราะห์ความแปรปรวน (ขึ้นอยู่กับการเปรียบเทียบความแปรปรวน)
การวิเคราะห์ความสัมพันธ์ (คำนึงถึงความคาดหวังทางคณิตศาสตร์ ความแปรปรวน และลักษณะของการเชื่อมโยงระหว่างเหตุการณ์หรือกระบวนการ)
การวิเคราะห์ปัจจัย (การประมวลผลทางสถิติของการทดลองหลายปัจจัย)
ความสัมพันธ์อันดับ (การรวมกันของความสัมพันธ์และการวิเคราะห์ปัจจัย)

เมื่อใช้วิธีการต่าง ๆ ของสถิติทางคณิตศาสตร์ รูปแบบทางสถิติหรือลักษณะเฉพาะของรูปแบบจะได้รับหลายวิธี: โดยการสังเกตและศึกษาตัวอย่างโดยใช้วิธีการประมาณโดยใช้วิธีการต่าง ๆ ในการแปลงหรือแบ่งตัวอย่างให้อยู่ในรูปของชุดการแปรผัน การแบ่งตัวอย่างออกเป็นกระแส , ส่วนต่างๆ , ช่วงเวลาสุ่ม และอื่นๆ

สถิติทางคณิตศาสตร์ถูกนำมาใช้ในด้านต่างๆของการจัดการ

เดิมคำว่า "สถิติ" ใช้เพื่ออธิบายภาวะเศรษฐกิจและการเมืองของรัฐหรือบางส่วน ตัวอย่างเช่น คำจำกัดความย้อนกลับไปถึงปี 1792: “สถิติอธิบายสถานะของรัฐในปัจจุบันหรือ ณ จุดใดจุดหนึ่งที่ทราบในอดีต” และในปัจจุบันกิจกรรมการบริการทางสถิติของรัฐก็สอดคล้องกับคำจำกัดความนี้ สถิติถูกกำหนดให้เป็นสาขาวิชาความรู้ที่เกี่ยวข้องกับประเด็นทั่วไปในการรวบรวม วัด และวิเคราะห์ข้อมูลทางสถิติจำนวนมาก (เชิงปริมาณหรือเชิงคุณภาพ) การศึกษาด้านปริมาณของปรากฏการณ์ทางสังคมมวลชนในรูปแบบตัวเลข

คำว่า "สถิติ" มาจากภาษาละติน สถานะ -สถานะของกิจการ คำว่า "สถิติ" ถูกนำมาใช้ในวิทยาศาสตร์โดยนักวิทยาศาสตร์ชาวเยอรมัน Gottfried Achenwall ในปี ค.ศ. 1746 โดยเสนอให้แทนที่ชื่อของหลักสูตร "รัฐศึกษา" ที่สอนในมหาวิทยาลัยในเยอรมนีด้วย "สถิติ" จึงเป็นจุดเริ่มต้นของการพัฒนาสถิติในฐานะ สาขาวิชาวิทยาศาสตร์และวิชาการ

สถิติใช้วิธีการพิเศษสำหรับการวิจัยและการประมวลผลวัสดุ: การสังเกตทางสถิติมวล, วิธีการจัดกลุ่ม, ค่าเฉลี่ย, ดัชนี, วิธีสมดุล, วิธีภาพกราฟิก และวิธีการอื่น ๆ ในการวิเคราะห์ข้อมูลทางสถิติ

การพัฒนาเทคโนโลยีคอมพิวเตอร์มีผลกระทบอย่างมากต่อสถิติ ก่อนหน้านี้ แบบจำลองทางสถิติจะแสดงด้วยแบบจำลองเชิงเส้นเป็นหลัก การเพิ่มขึ้นของความเร็วของคอมพิวเตอร์และการพัฒนาอัลกอริธึมเชิงตัวเลขที่สอดคล้องกันได้นำไปสู่ความสนใจที่เพิ่มขึ้นในแบบจำลองไม่เชิงเส้น เช่น โครงข่ายประสาทเทียม และได้นำไปสู่การพัฒนาแบบจำลองทางสถิติที่ซับซ้อน เช่น แบบจำลองเชิงเส้นทั่วไปและแบบจำลองลำดับชั้น วิธีการคำนวณจากการสุ่มตัวอย่างซ้ำๆ แพร่หลายมากขึ้น ปัจจุบัน สถิติเชิงคำนวณกำลังพัฒนา และมีซอฟต์แวร์ทางสถิติหลากหลายสำหรับวัตถุประสงค์ทั่วไปและเฉพาะทาง วิธีการทางสถิติใช้ในทิศทางที่เรียกว่า "การขุดข้อมูล" (ดูบทที่ 8)

สถิติทางคณิตศาสตร์เป็นสาขาหนึ่งของคณิตศาสตร์ประยุกต์ที่อยู่ติดกันโดยตรงและอิงตามทฤษฎีความน่าจะเป็น เช่นเดียวกับทฤษฎีทางคณิตศาสตร์อื่นๆ สถิติทางคณิตศาสตร์พัฒนาขึ้นภายในกรอบของแบบจำลองบางอย่างที่อธิบายปรากฏการณ์จริงช่วงหนึ่ง ในการกำหนดแบบจำลองทางสถิติและอธิบายปัญหาเฉพาะในสถิติทางคณิตศาสตร์ ให้เรานึกถึงบทบัญญัติบางประการจากทฤษฎีความน่าจะเป็น

แบบจำลองทางคณิตศาสตร์ของปรากฏการณ์สุ่มที่ศึกษาในทฤษฎีความน่าจะเป็นนั้นมีพื้นฐานมาจากแนวคิดเรื่องปริภูมิความน่าจะเป็น ยิ่งไปกว่านั้น ในแต่ละสถานการณ์ ความน่าจะเป็นถือเป็นฟังก์ชันตัวเลขที่ทราบโดยสมบูรณ์ในพีชคณิต นั่นคือ สำหรับตัวเลขใดๆ ก็ตาม ตัวเลขจะถูกกำหนดโดยสมบูรณ์ งานหลักของทฤษฎีความน่าจะเป็นคือการพัฒนาวิธีการค้นหาความน่าจะเป็นของเหตุการณ์ที่ซับซ้อนต่างๆ จากความน่าจะเป็นที่ทราบของเหตุการณ์ที่ง่ายกว่า (เช่น การใช้กฎการกระจายตัวของตัวแปรสุ่มที่ทราบ คุณลักษณะเชิงตัวเลขและกฎการกระจายฟังก์ชันของตัวแปรสุ่มคือ มุ่งมั่น).

อย่างไรก็ตาม ในทางปฏิบัติ เมื่อศึกษาการทดลองสุ่มที่เฉพาะเจาะจง ตามกฎแล้วความน่าจะเป็นคือไม่ทราบหรือทราบเพียงบางส่วน เราคิดได้แค่ว่าความน่าจะเป็นที่แท้จริงนั้นเป็นองค์ประกอบของความน่าจะเป็นบางระดับ (ที่เลวร้ายที่สุด - คลาสของความน่าจะเป็นที่เป็นไปได้ทั้งหมดที่สามารถระบุได้ใน ) ระดับ เรียกว่าชุด ยอมรับได้ เพื่ออธิบายการทดลองที่กำหนดความน่าจะเป็น และเซต - แบบจำลองทางสถิติ การทดลอง. โดยทั่วไป งานของสถิติทางคณิตศาสตร์คือการปรับแต่งแบบจำลองความน่าจะเป็นของปรากฏการณ์สุ่มที่กำลังศึกษาอยู่ (นั่นคือ เพื่อค้นหาความน่าจะเป็นจริงหรือใกล้เคียงกัน) โดยใช้ข้อมูลที่ได้มาจากผลลัพธ์ที่สังเกตได้ของการทดลอง ซึ่งเรียกว่าข้อมูลทางสถิติ .

ในสถิติทางคณิตศาสตร์คลาสสิกซึ่งเราจะศึกษาเพิ่มเติม เราจะจัดการกับการทดลองสุ่มซึ่งประกอบด้วยการดำเนินการ nการสังเกตอิสระซ้ำๆ ของตัวแปรสุ่มบางตัวที่มีการแจกแจงความน่าจะเป็นที่ไม่ทราบสาเหตุ เช่น ฟังก์ชันการกระจายที่ไม่รู้จัก ในกรณีนี้จะเรียกชุดของค่าที่เป็นไปได้ทั้งหมดของตัวแปรสุ่มที่สังเกตได้ ประชากรทั่วไป มีฟังก์ชันการกระจายหรือกระจายตาม ตัวเลข ซึ่งเป็นผลมาจากการสังเกตอิสระของตัวแปรสุ่มเรียกว่า การสุ่มตัวอย่าง จากประชาชนทั่วไปหรือ เลือกสรร (ทางสถิติ) ข้อมูล เรียกว่าจำนวนการสังเกต ปริมาณ ตัวอย่าง

งานหลักของสถิติทางคณิตศาสตร์คือการใช้ตัวอย่างเพื่ออะไร จากประชากรทั่วไป โดยดึงข้อมูลออกมามากที่สุดเท่าที่จะเป็นไปได้ เพื่อสรุปข้อสรุปเกี่ยวกับลักษณะความน่าจะเป็นที่ไม่ทราบของตัวแปรสุ่มที่สังเกตได้

โดยแบบจำลองทางสถิติที่สอดคล้องกับการสังเกตอิสระซ้ำของตัวแปรสุ่ม มันเป็นเรื่องธรรมดาที่จะเข้าใจแทนเซต โดยที่ประชากรทั่วไปคือพีชคณิตของเซตย่อย Borel ของ เป็นคลาสของฟังก์ชันการแจกแจงที่ยอมรับได้สำหรับตัวแปรสุ่มที่กำหนด ซึ่งมีฟังก์ชันการแจกแจงที่ไม่รู้จักจริงอยู่ด้วย

ทั้งสามมักเรียกว่าการทดลองทางสถิติ

หากระบุฟังก์ชันการแจกแจงจากจนถึงค่าของพารามิเตอร์บางตัวนั่นคือ ( เป็นชุดพารามิเตอร์) แบบจำลองดังกล่าวจะถูกเรียก พารามิเตอร์ . พวกเขาบอกว่าในกรณีนี้มันเป็นที่รู้จัก พิมพ์ การกระจายของตัวแปรสุ่มที่สังเกตได้ และไม่ทราบเฉพาะพารามิเตอร์ที่การแจกแจงขึ้นอยู่กับเท่านั้น พารามิเตอร์อาจเป็นสเกลาร์หรือเวกเตอร์ก็ได้

แบบจำลองทางสถิติเรียกว่า อย่างต่อเนื่อง หรือ ไม่ต่อเนื่อง ถ้าเป็นส่วนประกอบทั้งหมดของคลาสฟังก์ชันการแจกแจงตามลำดับ

ตัวอย่างที่ 1. สมมติว่าการแจกแจงของตัวแปรสุ่มที่สังเกตได้เป็นแบบเกาส์เซียนโดยมีค่าความแปรปรวนที่ทราบและค่าที่คาดหวังที่ไม่ทราบ

ในกรณีนี้ แบบจำลองทางสถิติมีความต่อเนื่องและมีรูปแบบ:

หากไม่ทราบความแปรปรวน แบบจำลองทางสถิติจะมีรูปแบบ:

และฟังก์ชันการแจกแจงมีความหนาแน่นของความน่าจะเป็น

นี่คือสิ่งที่เรียกว่าโมเดลปกติทั่วไป ซึ่งแสดงไว้

ตัวอย่างที่ 2. สมมติว่าการกระจายตัวของตัวแปรสุ่มที่สังเกตได้คือปัวซองโดยมีพารามิเตอร์ที่ไม่รู้จัก ในกรณีนี้ แบบจำลองทางสถิติไม่ต่อเนื่องและมีรูปแบบ: , ตัวแปรสุ่ม (พวกเขากล่าวว่าตัวแปรสุ่มเป็นการคัดลอก) และยังไม่ได้ใช้ค่าเฉพาะอันเป็นผลมาจากการทดลอง การเปลี่ยนจากตัวอย่างเฉพาะ เพื่อสุ่มตัวอย่างจะถูกนำไปใช้ซ้ำในภายหลังในการแก้คำถามและปัญหาเชิงทฤษฎีเพื่อให้ได้ข้อสรุปที่ถูกต้องสำหรับตัวอย่างใด ๆ จากประชากรทั่วไป

ปัญหาหลักที่พิจารณาในสถิติทางคณิตศาสตร์สามารถแบ่งออกเป็นสองกลุ่มใหญ่:

1. ปัญหาที่เกี่ยวข้องกับการกำหนดกฎการกระจายที่ไม่รู้จักของตัวแปรสุ่มที่สังเกตได้และพารามิเตอร์ที่รวมอยู่ในนั้น (พิจารณาภายใต้กรอบของทฤษฎีการประมาณค่าทางสถิติ)

2. ปัญหาที่เกี่ยวข้องกับการทดสอบสมมติฐานเกี่ยวกับกฎการกระจายของตัวแปรสุ่มที่สังเกตได้ (แก้ไขภายในกรอบของทฤษฎีการทดสอบสมมติฐานทางสถิติ)

4.1.1. แบบจำลองทางสถิติในการสร้างแบบจำลองทางสถิติ (สุ่ม) วัตถุหลักของการสร้างแบบจำลองคือเหตุการณ์สุ่ม ตัวแปรสุ่ม และฟังก์ชันสุ่ม

เมื่อทำการทดลองผู้วิจัยจะบันทึกการเกิดขึ้นหรือไม่เกิดขึ้นของเหตุการณ์ที่สนใจและยังวัดค่าของพารามิเตอร์ที่มีลักษณะสุ่มและเป็นค่าการใช้งานของตัวแปรสุ่มบางตัวเป็นหลัก

การสร้างแบบจำลองทางสถิติช่วยให้ได้รับข้อมูลที่เกี่ยวข้องกับการเกิดขึ้นหรือไม่เกิดขึ้นของเหตุการณ์บางอย่างที่เกิดขึ้นในวัตถุจริงโดยไม่ต้องทำการทดลองจริงกับวัตถุที่กำลังศึกษา (ซึ่งในกรณีส่วนใหญ่ต้องใช้วัสดุและต้นทุนทางการเงินจำนวนมาก) เกี่ยวกับค่าตัวอย่างของตัวแปรสุ่มตามลักษณะความน่าจะเป็นที่มีอยู่ของเหตุการณ์จำลองและตัวแปรสุ่ม การสร้างแบบจำลองประเภทนี้เกี่ยวข้องกับการรวบรวมข้อมูลเบื้องต้นเกี่ยวกับตัวบ่งชี้แบบจำลองและการประมวลผลทางสถิติเพิ่มเติมของผลลัพธ์ที่ได้รับ เพื่อให้ได้ค่าประมาณทางสถิติที่เหมาะสมซึ่งจำเป็นสำหรับการสร้างแบบจำลองคุณลักษณะความน่าจะเป็น

โมเดล Stochastic ส่วนใหญ่จะใช้ในสองกรณี:

1) วัตถุประสงค์ของการสร้างแบบจำลองได้รับการศึกษาไม่ดี - ไม่มีกฎหมายเชิงปริมาณที่ได้รับการพัฒนาอย่างดีเพียงพอซึ่งอธิบายกระบวนการและปรากฏการณ์ที่อยู่ระหว่างการพิจารณาและยังไม่มีความเป็นไปได้ในการค้นหาวิธีแก้ไขปัญหาเชิงวิเคราะห์ที่ยอมรับได้สำหรับปัญหานี้

2) วัตถุแบบจำลองได้รับการศึกษาค่อนข้างดีในลักษณะที่กำหนด แต่ไม่คำนึงถึงปัจจัยสุ่มที่มีอิทธิพลต่อกระบวนการและปรากฏการณ์ที่กำลังศึกษา

ในกรณีแรกตามคำอธิบายด้วยวาจาของวัตถุที่กำลังศึกษา ตัวบ่งชี้เชิงปริมาณจะถูกเลือกด้วยการคำนวณมิติทางกายภาพซึ่งประกอบด้วยสองกลุ่ม กลุ่มหนึ่งถือเป็นปริมาณอินพุตของแบบจำลอง และอีกกลุ่มถือเป็นปริมาณเอาท์พุต นอกจากนี้ การใช้ผลลัพธ์ทางทฤษฎีทางวิทยาศาสตร์ที่ได้รับจากนักวิจัยคนอื่นๆ ในสาขานี้ และอาจใช้สมมติฐานที่จำเป็นจำนวนหนึ่ง ตลอดจนข้อมูลการทดลองที่มีอยู่แล้วเกี่ยวกับปริมาณอินพุตและเอาต์พุต (เช่น กฎการกระจาย) จะสร้างการพึ่งพาเชิงกำหนดหรือสุ่มระหว่าง ปริมาณอินพุตและเอาต์พุตของโมเดล ชุดของความสัมพันธ์ที่ได้รับระหว่างปริมาณอินพุตและเอาต์พุต (โดยปกติจะเขียนในรูปแบบของสมการ) เรียกว่า แบบจำลองทางสถิติ

ในระหว่างการนำแบบจำลองทางสถิติไปใช้ตามกฎที่เลือกของการแจกแจงตัวแปรสุ่มและความน่าจะเป็นที่เลือกของเหตุการณ์จำลอง วิธีการทางสถิติทางคณิตศาสตร์จะกำหนดค่าตัวอย่างก่อนการทดลองของตัวแปรสุ่มและลำดับเสมือนเชิงประจักษ์ของการเกิดขึ้น หรือการไม่มีเหตุการณ์จำลองเกิดขึ้น ถัดไป ค่าตัวอย่างที่สอดคล้องกันของปริมาณเอาต์พุตจะถูกกำหนดโดยใช้สมการแบบจำลอง และการนำแบบจำลองที่สร้างขึ้นไปใช้ซ้ำช่วยให้ผู้วิจัยสามารถสร้างตัวอย่างแบบจำลองของค่าเอาต์พุต ซึ่งจะต้องได้รับการวิเคราะห์ทางสถิติอีกครั้ง (สหสัมพันธ์ การถดถอย การกระจายตัว สเปกตรัม) เพื่อให้ได้ค่าประมาณลักษณะของพารามิเตอร์เอาต์พุตของแบบจำลองหรือ ทดสอบสมมติฐานที่นำเสนอ จากผลลัพธ์ที่ได้รับ จะมีการสรุปข้อสรุปเกี่ยวกับวัตถุประสงค์ของการศึกษา รวมถึงเหตุผลสำหรับการใช้งานจริงของแบบจำลองที่สร้างขึ้น

วิธีการสร้างแบบจำลองทางสถิติถูกนำมาใช้กันอย่างแพร่หลายในการแก้ปัญหาการเข้าคิว ทฤษฎีการหาค่าเหมาะที่สุด ทฤษฎีการควบคุม ฟิสิกส์เชิงทฤษฎี ฯลฯ

พื้นฐานทางทฤษฎีของวิธีการสร้างแบบจำลองทางสถิติบนคอมพิวเตอร์คือทฤษฎีบทขีดจำกัดของทฤษฎีความน่าจะเป็น

4.1.2. ความไม่เท่าเทียมกันของ Chebyshev. สำหรับฟังก์ชันที่ไม่เป็นลบของตัวแปรสุ่ม ก็คืออสมการ

4.1.3. ทฤษฎีบทของเบอร์นูลลี. หากทำการทดสอบอิสระ ซึ่งในแต่ละเหตุการณ์มีเหตุการณ์บางอย่างเกิดขึ้นด้วยความน่าจะเป็น ดังนั้นความบริสุทธิ์สัมพัทธ์ของการเกิดขึ้นของเหตุการณ์ (จำนวนผลการทดสอบที่น่าพอใจ) ที่มาบรรจบกันในความน่าจะเป็น เช่น ที่

4.1.4. ทฤษฎีบทของปัวซอง. หากทำการทดสอบอิสระและความน่าจะเป็นของเหตุการณ์ที่เกิดขึ้นในการทดสอบนั้นเท่ากับ ความบริสุทธิ์สัมพัทธ์ของการเกิดเหตุการณ์นั้น (จำนวนผลลัพธ์ที่น่าพอใจของการทดสอบ) ที่มาบรรจบกันในความน่าจะเป็นเป็นค่าเฉลี่ยของความน่าจะเป็น , เช่น. ที่

4.1.5. ทฤษฎีบทของเชบีเชฟ. หากสังเกตค่าของตัวแปรสุ่มในการทดสอบอิสระจากนั้นที่ค่าเฉลี่ยเลขคณิตของค่าของตัวแปรสุ่มจะมาบรรจบกันในความน่าจะเป็นกับความคาดหวังทางคณิตศาสตร์นั่นคือ ที่

4.1.6. ทฤษฎีบทของเชบีเชฟแบบทั่วไป. หากตัวแปรสุ่มอิสระที่มีความคาดหวังและความแปรปรวนทางคณิตศาสตร์ถูกขอบเขตจากด้านบนด้วยจำนวนเดียวกัน จากนั้นเมื่อค่าเฉลี่ยเลขคณิตของค่าของตัวแปรสุ่มมาบรรจบกันในความน่าจะเป็นกับค่าเฉลี่ยเลขคณิตของความคาดหวังทางคณิตศาสตร์

4.1.7. ทฤษฎีบทของมาร์คอฟ.. ทฤษฎีบทของเชบีเชฟยังใช้ได้กับตัวแปรสุ่มตามถ้า

4.1.8. ทฤษฎีบทขีดจำกัดกลาง. หากตัวแปรสุ่มแจกแจงอย่างอิสระเหมือนกันโดยมีค่าคาดหวังและความแปรปรวนทางคณิตศาสตร์ จากนั้นเมื่อกฎการกระจายของผลรวมเข้าใกล้กฎการแจกแจงแบบปกติอย่างไม่มีกำหนด