การสร้างแบบจำลองทางสถิติ
การสร้างแบบจำลองทางสถิติและเศรษฐมิติ- การวิจัยวัตถุความรู้เกี่ยวกับแบบจำลองทางสถิติ การสร้างและการศึกษาแบบจำลองวัตถุ กระบวนการ หรือปรากฏการณ์ในชีวิตจริง (เช่น กระบวนการทางเศรษฐศาสตร์ทางเศรษฐมิติ) เพื่อให้ได้คำอธิบายปรากฏการณ์เหล่านี้ ตลอดจนทำนายปรากฏการณ์หรือตัวชี้วัดที่ผู้วิจัยสนใจ
พารามิเตอร์ของแบบจำลองดังกล่าวประเมินโดยใช้วิธีการทางสถิติ ตัวอย่างเช่น วิธีความน่าจะเป็นสูงสุด วิธีกำลังสองน้อยที่สุด วิธีของโมเมนต์
Y = b_1 + b_2×X
โดยที่ Y - ค่าใช้จ่าย, X - รายได้, b_1 และ b_2 - พารามิเตอร์ของสมการ (พารามิเตอร์), คุณ - ข้อผิดพลาดสุ่ม (การรบกวน, เงื่อนไขข้อผิดพลาด)
ประเภทของแบบจำลองทางสถิติและเศรษฐมิติ
การถดถอยเชิงเส้น (OLS) การถดถอยบนตัวแปรไบนารี่ ตัวแบบ Autoregressive ระบบสมการพร้อมกัน (SEM) ตัวแบบความน่าจะเป็นเชิงเส้น (LPM) ตัวแบบ Logit (Logit) ตัวแบบ Probit (Probit) เป็นต้นมูลนิธิวิกิมีเดีย 2010.
ดูว่า "การสร้างแบบจำลองทางสถิติ" ในพจนานุกรมอื่น ๆ คืออะไร:
การสร้างแบบจำลองทางสถิติ- วิธีการศึกษากระบวนการพฤติกรรมของระบบความน่าจะเป็นในสภาวะที่ไม่ทราบปฏิสัมพันธ์ภายในในระบบเหล่านี้ ประกอบด้วยการเลียนแบบกระบวนการที่กำลังศึกษาโดยเครื่องจักรซึ่งก็คือการคัดลอกไปยัง... ... พจนานุกรมเศรษฐศาสตร์-คณิตศาสตร์
วิธีการคณิตศาสตร์ประยุกต์และการคำนวณ ซึ่งประกอบด้วยการใช้งานคอมพิวเตอร์ที่มีสุ่มที่พัฒนาขึ้นเป็นพิเศษ แบบจำลองปรากฏการณ์หรือวัตถุที่กำลังศึกษา การขยายขอบเขตการใช้งานของ S. m. มีความเกี่ยวข้องกับการพัฒนาเทคโนโลยีอย่างรวดเร็วและโดยเฉพาะอย่างยิ่ง... ... สารานุกรมคณิตศาสตร์
วิธีการเชิงตัวเลขสำหรับการแก้ปัญหาทางคณิตศาสตร์ ซึ่งปริมาณที่ต้องการแสดงด้วยคุณลักษณะความน่าจะเป็นของปรากฏการณ์สุ่มบางปรากฏการณ์ ปรากฏการณ์นี้จะถูกจำลองขึ้น หลังจากนั้นจึงกำหนดคุณลักษณะที่จำเป็นโดยประมาณ... ... สารานุกรมผู้ยิ่งใหญ่แห่งสหภาพโซเวียต
การสร้างแบบจำลองสถานการณ์โดยใช้รูปแบบทางสถิติที่มีอยู่ในปรากฏการณ์ที่พิจารณา พจนานุกรมคำศัพท์ทางธุรกิจ Akademik.ru. 2544 ... พจนานุกรมคำศัพท์ทางธุรกิจ
การสร้างแบบจำลองคือการศึกษาวัตถุแห่งความรู้เกี่ยวกับแบบจำลอง การสร้างและศึกษาแบบจำลองวัตถุ กระบวนการ หรือปรากฏการณ์ในชีวิตจริง เพื่อให้ได้คำอธิบายปรากฏการณ์เหล่านี้ พร้อมทั้งทำนายปรากฏการณ์ที่น่าสนใจ... ... Wikipedia
แบบจำลองการจำลองในสังคมวิทยา- การสร้างแบบจำลองทางคณิตศาสตร์ประเภทหนึ่งที่ประกอบด้วยการทำซ้ำกระบวนการทางสังคมหรือการทำงานของระบบสังคมบนคอมพิวเตอร์ เกือบทุกครั้งเกี่ยวข้องกับการทำซ้ำของปัจจัยสุ่มที่มีอิทธิพลต่อปรากฏการณ์ที่กำลังศึกษาอยู่ และผลที่ตามมาก็คือ... ... สังคมวิทยา: สารานุกรม
การสร้างแบบจำลองสถิติ- การพัฒนาแบบจำลองต่าง ๆ ที่สะท้อนรูปแบบทางสถิติของวัตถุปรากฏการณ์ที่อธิบายไว้ คุณลักษณะเฉพาะทั่วไปของรุ่นเหล่านี้คือการพิจารณาการรบกวนหรือการเบี่ยงเบนแบบสุ่ม วัตถุส.ม. แตกต่าง... ... พจนานุกรมเศรษฐศาสตร์ขนาดใหญ่
การสร้างแบบจำลองทางสถิติ- การแสดงหรือคำอธิบายของปรากฏการณ์หรือระบบความสัมพันธ์ระหว่างปรากฏการณ์ผ่านชุดตัวแปร (ตัวบ่งชี้ลักษณะ) และความสัมพันธ์ทางสถิติระหว่างสิ่งเหล่านั้น เป้าหมายของ M.S. (เหมือนโมเดลอื่นๆ) ลองนึกภาพ... ... สังคมวิทยา: สารานุกรม
แนะนำให้ปรับปรุงบทความนี้: แก้ไขบทความตามกฎโวหารของวิกิพีเดีย การสร้างแบบจำลองสถานการณ์จำลอง (สถานการณ์... Wikipedia
การสร้างแบบจำลองการจำลอง- (...จากตัวอย่างแบบจำลองภาษาฝรั่งเศส) วิธีการศึกษาปรากฏการณ์และกระบวนการใด ๆ โดยใช้การทดสอบทางสถิติ (วิธีมอนติคาร์โล) โดยใช้คอมพิวเตอร์ วิธีการนี้อาศัยการวาด (จำลอง) อิทธิพลของปัจจัยสุ่มต่อปรากฏการณ์ที่กำลังศึกษาหรือ... ... พจนานุกรมสารานุกรมจิตวิทยาและการสอน
หนังสือ
- การสร้างแบบจำลองทางสถิติ วิธีการมอนติคาร์โล หนังสือเรียนสำหรับระดับปริญญาตรีและปริญญาโท Mikhailov G.A. หนังสือเรียนนี้เน้นไปที่คุณสมบัติของการสร้างแบบจำลองตัวแปรสุ่ม กระบวนการ และสาขาต่างๆ ความสนใจเป็นพิเศษจะจ่ายให้กับปริพันธ์เชิงตัวเลข โดยเฉพาะอย่างยิ่งวิธีมอนติคาร์โล มีทางออกให้...
ส่งผลงานดีๆ ของคุณในฐานความรู้ได้ง่ายๆ ใช้แบบฟอร์มด้านล่าง
นักศึกษา นักศึกษาระดับบัณฑิตศึกษา นักวิทยาศาสตร์รุ่นเยาว์ ที่ใช้ฐานความรู้ในการศึกษาและการทำงาน จะรู้สึกขอบคุณเป็นอย่างยิ่ง
โพสต์เมื่อ http://www.allbest.ru/
กระทรวงศึกษาธิการรัสเซีย
การศึกษาอิสระของรัฐบาลกลาง
สถาบันการศึกษาวิชาชีพชั้นสูง
"มหาวิทยาลัยสหพันธรัฐใต้"
ภาควิชาสารสนเทศและอุปกรณ์การวัดและเทคโนโลยี
พิเศษ
230201 ระบบสารสนเทศและเทคโนโลยี
เชิงนามธรรม
เรื่อง: "องค์กรวิจัยและพัฒนา"
ในหัวข้อ: “วิธีการสร้างแบบจำลองทางคณิตศาสตร์ทางสถิติ”
จัดทำโดยนักเรียน: Strotsev Vasily Andreevich
ครู: Gusenko Tamara Grigorievna
1. องค์ประกอบของสถิติทางคณิตศาสตร์
สถิติทางคณิตศาสตร์เป็นสาขาหนึ่งของคณิตศาสตร์ที่เกี่ยวข้องกับวิธีการทางคณิตศาสตร์ในการจัดระบบ การประมวลผล และการใช้ข้อมูลทางสถิติเพื่อการสรุปทางวิทยาศาสตร์และการปฏิบัติ ข้อมูลทางสถิติในที่นี้เข้าใจว่าเป็นข้อมูลเกี่ยวกับจำนวนออบเจ็กต์ในคอลเลกชันที่ครอบคลุมไม่มากก็น้อยที่มีลักษณะบางอย่าง
เป้าหมายหลักของสถิติทางคณิตศาสตร์คือการได้ข้อสรุปที่มีความหมายและอิงทางวิทยาศาสตร์จากข้อมูลที่มีการกระจายแบบสุ่ม ในเวลาเดียวกัน ปรากฏการณ์ที่กำลังศึกษาอยู่ซึ่งสร้างข้อมูลเหล่านี้ มักซับซ้อนเกินกว่าที่จะสร้างคำอธิบายที่สมบูรณ์ซึ่งสะท้อนรายละเอียดทั้งหมดได้ ดังนั้น ข้อสรุปทางสถิติจึงจัดทำขึ้นบนพื้นฐานของแบบจำลองความน่าจะเป็นทางคณิตศาสตร์ของปรากฏการณ์สุ่มจริง ซึ่งควรสร้างคุณลักษณะที่สำคัญขึ้นมาใหม่ และไม่รวมคุณลักษณะที่ถือว่าไม่สำคัญ วิธีการทางสถิติทางคณิตศาสตร์ทำให้สามารถกำหนดลักษณะความน่าจะเป็นของตัวแปรสุ่มที่เข้าร่วมในแบบจำลองทางคณิตศาสตร์ที่อธิบายปรากฏการณ์นี้ได้โดยอาศัยการสังเกตปรากฏการณ์ที่กำลังศึกษา
งานของสถิติทางคณิตศาสตร์ - การสร้างรูปแบบซึ่งเป็นปรากฏการณ์สุ่มมวล - ขึ้นอยู่กับการศึกษาข้อมูลทางสถิติ - ผลการสังเกต - โดยใช้วิธีการของทฤษฎีความน่าจะเป็น ข้อมูลทางสถิติคือข้อมูลที่ได้รับจากการสำรวจวัตถุหรือปรากฏการณ์จำนวนมาก ดังนั้นสถิติทางคณิตศาสตร์จึงเกี่ยวข้องกับปรากฏการณ์มวล
งานแรกของสถิติทางคณิตศาสตร์คือการระบุวิธีการรวบรวมและจัดกลุ่มข้อมูลทางสถิติที่ได้รับจากการสังเกตหรือจากการทดลองที่ออกแบบมาเป็นพิเศษ
ภารกิจที่สองของสถิติทางคณิตศาสตร์คือการพัฒนาวิธีการวิเคราะห์ข้อมูลทางสถิติขึ้นอยู่กับวัตถุประสงค์ของการศึกษา
สถิติทางคณิตศาสตร์สมัยใหม่พัฒนาวิธีการกำหนดจำนวนการทดสอบที่จำเป็นก่อนเริ่มการศึกษา ระหว่างการศึกษา และแก้ปัญหาอื่นๆ อีกมากมาย สถิติทางคณิตศาสตร์สมัยใหม่ถูกกำหนดให้เป็นศาสตร์แห่งการตัดสินใจภายใต้เงื่อนไขของความไม่แน่นอน
หน้าที่ของสถิติทางคณิตศาสตร์คือการสร้างวิธีการรวบรวมและประมวลผลข้อมูลทางสถิติเพื่อให้ได้ข้อสรุปทางวิทยาศาสตร์และการปฏิบัติ
1.1 ข้อมูลทางสถิติทั่วไปและตัวอย่าง
ปล่อยให้มีความจำเป็นต้องศึกษาชุดของวัตถุที่เป็นเนื้อเดียวกันโดยคำนึงถึงคุณลักษณะเชิงคุณภาพหรือเชิงปริมาณที่กำหนดลักษณะของวัตถุเหล่านี้
วัตถุมีหรือไม่มีลักษณะเชิงคุณภาพ ไม่สามารถวัดผลได้โดยตรง (เช่น ความเชี่ยวชาญด้านกีฬา คุณสมบัติ สัญชาติ สังกัดอาณาเขต ฯลฯ)
คุณลักษณะเชิงปริมาณแสดงถึงผลลัพธ์ของการนับหรือการวัด ด้วยเหตุนี้จึงแบ่งออกเป็นแบบไม่ต่อเนื่องและต่อเนื่อง
บางครั้งมีการตรวจสอบอย่างสมบูรณ์เช่น ตรวจสอบแต่ละวัตถุในประชากรเกี่ยวกับลักษณะที่พวกเขาสนใจ ในทางปฏิบัติ การตรวจต่อเนื่องมักไม่ค่อยได้ใช้ ตัวอย่างเช่น หากประชากรมีวัตถุจำนวนมาก ก็เป็นไปไม่ได้ทางกายภาพที่จะดำเนินการสำรวจที่ครอบคลุม ในกรณีเช่นนี้ วัตถุจำนวนจำกัดจะถูกสุ่มเลือกจากประชากรทั้งหมดและนำไปศึกษา มีทั้งประชากรทั่วไปและกลุ่มตัวอย่าง
ประชากรตัวอย่าง (ตัวอย่าง) คือกลุ่มของวัตถุที่เลือกแบบสุ่ม
ประชากรทั่วไป (หลัก) คือกลุ่มของวัตถุที่ใช้สร้างตัวอย่าง
ปริมาตรของประชากร (ตัวอย่างหรือทั่วไป) คือจำนวนวัตถุในประชากรนี้ ตัวอย่างเช่น หากเลือก 100 ส่วนจาก 1,000 ส่วนสำหรับการตรวจสอบ ขนาดประชากรคือ N = 1,000 และขนาดตัวอย่างคือ n = 100 จำนวนวัตถุในประชากร N เกินขนาดตัวอย่าง n อย่างมีนัยสำคัญ
1.2 วิธีการสุ่มตัวอย่าง
เมื่อรวบรวมตัวอย่าง มีสองวิธีในการดำเนินการ: หลังจากเลือกและสังเกตวัตถุแล้ว วัตถุนั้นอาจจะส่งคืนให้กับประชากรหรือไม่ก็ได้ ตามที่ระบุไว้ข้างต้น ตัวอย่างจะถูกแบ่งออกเป็นแบบทำซ้ำและไม่ซ้ำ
การสุ่มตัวอย่างซ้ำคือตัวอย่างที่วัตถุที่เลือก (ก่อนเลือกรายการถัดไป) จะถูกส่งกลับไปยังประชากร
การสุ่มตัวอย่างแบบไม่ทำซ้ำคือตัวอย่างที่วัตถุที่เลือกไม่ได้ถูกส่งกลับไปยังประชากร
เพื่อให้ข้อมูลตัวอย่างมีความน่าเชื่อถือเพียงพอที่จะตัดสินลักษณะของประชากรที่สนใจ จำเป็นที่วัตถุตัวอย่างจะต้องเป็นตัวแทนอย่างถูกต้อง (ตัวอย่างจะต้องเป็นตัวแทนสัดส่วนของประชากรอย่างถูกต้อง) - ตัวอย่างจะต้องเป็นตัวแทน (ตัวแทน ).
ตัวอย่างจะเป็นตัวแทนหาก:
· แต่ละวัตถุตัวอย่างจะถูกสุ่มเลือกจากประชากรทั่วไป
· วัตถุทั้งหมดมีความน่าจะเป็นเท่ากันที่จะรวมอยู่ในตัวอย่าง
1.3 วิธีการจัดกลุ่มสถิติ
1.3.1 ซีรีย์รูปแบบที่ไม่ต่อเนื่อง
โดยปกติแล้วข้อมูลที่สังเกตได้จะมีตัวเลขจำนวนมากจัดเรียงไม่เป็นระเบียบ เมื่อพิจารณาจากชุดตัวเลขนี้ เป็นการยากที่จะระบุรูปแบบของการเปลี่ยนแปลง (การเปลี่ยนแปลง) เพื่อศึกษารูปแบบการแปรผันของค่าของตัวแปรสุ่ม ข้อมูลการทดลองจะถูกประมวลผล
ตัวอย่างที่ 1 มีการสังเกตตัวเลข เอ็กซ์คะแนนที่นักศึกษามหาวิทยาลัยได้รับจากการสอบ การสังเกตภายในหนึ่งชั่วโมงให้ผลลัพธ์ดังต่อไปนี้: 3; 4; 3; 5; 4; 2; 2; 4; 4; 3; 5; 2; 4; 5; 4; 3; 4; 3; 3; 4; 4; 2; 2; 5; 5; 4; 5; 2; 3; 4; 4; 3; 4; 5; 2; 5; 5; 4; 3; 3; 4; 2; 4; 4; 5; 4; 3; 5; 3; 5; 4; 4; 5; 4; 4; 5; 4; 5; 5; 5. นี่คือหมายเลข เอ็กซ์เป็นตัวแปรสุ่มแบบไม่ต่อเนื่อง และข้อมูลที่ได้รับเกี่ยวกับตัวแปรนี้แสดงถึงข้อมูลทางสถิติ (สังเกตได้)
โดยการจัดเรียงข้อมูลข้างต้นตามลำดับที่ไม่ลดลงและจัดกลุ่มเพื่อให้ในแต่ละกลุ่มค่าของตัวแปรสุ่มเท่ากัน จะได้รับชุดข้อมูลการสังเกตที่ได้รับการจัดอันดับ
ในตัวอย่างที่ 1 เรามีสี่กลุ่มที่มีค่าตัวแปรสุ่มดังต่อไปนี้: 2; 3; 4; 5. ค่าของตัวแปรสุ่มที่สอดคล้องกับกลุ่มแยกต่างหากของชุดข้อมูลที่สังเกตได้ซึ่งจัดกลุ่มเรียกว่าตัวแปร และการเปลี่ยนแปลงของค่านี้เรียกว่าการเปลี่ยนแปลง
ตัวเลือกจะแสดงด้วยตัวอักษรละตินตัวเล็กพร้อมดัชนีที่สอดคล้องกับหมายเลขซีเรียลของกลุ่ม - ซี. ตัวเลขที่แสดงจำนวนครั้งที่ตัวแปรที่สอดคล้องกันเกิดขึ้นในการสังเกตจำนวนหนึ่งเรียกว่าความถี่ของตัวแปรและถูกกำหนดตามนั้น - พรรณี.
ผลรวมของความถี่ทั้งหมดของอนุกรมคือขนาดตัวอย่าง อัตราส่วนของความถี่ตัวแปรต่อขนาดตัวอย่าง พรรณี/n = วิเรียกว่าความถี่สัมพัทธ์
การกระจายทางสถิติของกลุ่มตัวอย่างคือรายการตัวเลือกและความถี่ที่สอดคล้องกันหรือความถี่สัมพัทธ์ (ตารางที่ 1 ตารางที่ 2)
ตัวอย่างที่ 2 มีการระบุการกระจายความถี่ของการสุ่มตัวอย่างตามปริมาตร n = 20:
ตารางที่ 1
ควบคุม: 0,15 + 0,50 + 0, 35 = 1.
การแจกแจงทางสถิติยังสามารถระบุเป็นลำดับของช่วงเวลาและความถี่ที่สอดคล้องกับช่วงเวลาเหล่านั้นได้ (ผลรวมของความถี่ที่อยู่ภายในช่วงเวลานี้จะถือเป็นความถี่ที่สอดคล้องกับช่วงเวลา)
ชุดการแจกแจงแบบแยกส่วนคือชุดตัวเลือกแบบจัดอันดับ ซีด้วยความถี่ที่สอดคล้องกัน พรรณีหรือความถี่สัมพัทธ์ วิ.
ตัวอย่างเช่น 1 ที่พิจารณาข้างต้น ชุดรูปแบบที่แยกไม่ต่อเนื่องมีรูปแบบ:
ตารางที่ 3
ควบคุม: ผลรวมของความถี่ทั้งหมดของซีรีย์รูปแบบ (ผลรวมของค่าในแถวที่สองของตารางที่ 3) คือขนาดตัวอย่าง (ในตัวอย่างที่ 1 n = 60 ); ผลรวมของความถี่สัมพัทธ์ของซีรีย์รูปแบบจะต้องเท่ากับ 1 (ผลรวมของค่าของแถวที่สามของตารางที่ 3)
1.3.2 อนุกรมความแปรผันของช่วง
หากตัวแปรสุ่มภายใต้การศึกษามีความต่อเนื่องการจัดอันดับและการจัดกลุ่มค่าที่สังเกตได้มักจะไม่อนุญาตให้ระบุลักษณะเฉพาะของการแปรผันในค่าของมัน สิ่งนี้อธิบายได้จากข้อเท็จจริงที่ว่าค่าแต่ละค่าของตัวแปรสุ่มสามารถแตกต่างกันได้เพียงเล็กน้อยเท่าที่ต้องการ ดังนั้นในจำนวนรวมของข้อมูลที่สังเกต ค่าที่เหมือนกันของปริมาณจึงแทบจะไม่เกิดขึ้น และความถี่ของ ตัวแปรมีความแตกต่างกันเล็กน้อย
นอกจากนี้ยังเป็นไปไม่ได้ที่จะสร้างอนุกรมแบบแยกสำหรับตัวแปรสุ่มแบบแยกซึ่งจำนวนค่าที่เป็นไปได้ซึ่งมีขนาดใหญ่ ในกรณีเช่นนี้ ควรสร้างอนุกรมการแจกแจงความแปรผันตามช่วงเวลา
ในการสร้างอนุกรมดังกล่าว ช่วงเวลาทั้งหมดของการแปรผันของค่าที่สังเกตได้ของตัวแปรสุ่มจะถูกแบ่งออกเป็นช่วงจำนวนบางส่วน และความถี่ของการเกิดค่าตัวแปรในแต่ละช่วงบางส่วนจะถูกคำนวณ
ซีรีย์การแปรผันช่วงเวลาคือชุดของช่วงเวลาที่ได้รับคำสั่งของค่าที่แตกต่างกันของตัวแปรสุ่มที่มีความถี่ที่สอดคล้องกันหรือความถี่สัมพัทธ์ของค่าของตัวแปรที่ตกอยู่ในแต่ละค่า
ในการสร้างอนุกรมช่วงเวลาที่คุณต้องการ:
1. กำหนดขนาดของช่วงเวลาบางส่วน
2. กำหนดความกว้างของช่วงเวลา
3. กำหนดขอบเขตบนและล่างสำหรับแต่ละช่วงเวลา
4. จัดกลุ่มผลการสังเกต
1. คำถามในการเลือกจำนวนและความกว้างของช่วงเวลาการจัดกลุ่มจะต้องตัดสินใจในแต่ละกรณีโดยพิจารณาจากเป้าหมาย การวิจัย ขนาดตัวอย่าง และระดับความแปรปรวนของลักษณะเฉพาะในตัวตัวอย่าง
จำนวนช่วงโดยประมาณ เคสามารถประมาณได้ตามขนาดตัวอย่างเท่านั้น n ด้วยวิธีใดวิธีหนึ่งดังต่อไปนี้:
· ตามสูตร สเตอร์เจส: k = 1 + 3.32 บันทึก n;
โดยใช้ตารางที่ 1
ตารางที่ 1
2. โดยทั่วไปควรใช้ช่องว่างที่มีความกว้างเท่ากัน เพื่อกำหนดความกว้างของช่วงเวลา ชม.คำนวณ:
· ช่วงของการเปลี่ยนแปลง ร- ค่าตัวอย่าง: R = xสูงสุด - xนาที, ที่ไหน xmaxและ เอ็กซ์มิน- ตัวเลือกการสุ่มตัวอย่างสูงสุดและต่ำสุด
·ความกว้างของแต่ละช่วงเวลา ชม.กำหนดโดยสูตรต่อไปนี้: ชม. = ร/เค.
3. ขีดจำกัดล่างของช่วงแรก xh1ถูกเลือกเพื่อให้มีตัวเลือกตัวอย่างขั้นต่ำ เอ็กซ์มินลดลงประมาณกลางช่วงเวลานี้: xh1 = xmin - 0.5 ชม.
ช่วงระยะกลางได้มาจากการเพิ่มความยาวของช่วงบางส่วนต่อท้ายช่วงก่อนหน้า ชม.:
xhi = xhi-1 +h.
การสร้างมาตราส่วนช่วงเวลาตามการคำนวณขอบเขตของช่วงเวลาจะดำเนินต่อไปจนกระทั่งถึงค่า ซีตอบสนองความสัมพันธ์:
ซี< xmax + 0,5·h .
4. ตามมาตราส่วนช่วงเวลาค่าลักษณะจะถูกจัดกลุ่ม - สำหรับแต่ละช่วงเวลาบางส่วนจะมีการคำนวณผลรวมของความถี่ พรรณีตัวเลือกที่รวมอยู่ใน ฉันช่วงเวลาที่. ในกรณีนี้ ช่วงจะรวมค่าของตัวแปรสุ่มที่มากกว่าหรือเท่ากับขีดจำกัดล่างและน้อยกว่าขีดจำกัดบนของช่วงเวลา
1.4 รูปหลายเหลี่ยมและฮิสโตแกรม
เพื่อความชัดเจน จึงได้มีการสร้างกราฟการกระจายทางสถิติต่างๆ จากข้อมูลของอนุกรมการแปรผันแบบแยกส่วน จะมีการสร้างรูปหลายเหลี่ยมของความถี่หรือความถี่สัมพัทธ์
รูปหลายเหลี่ยมความถี่คือเส้นประที่ส่วนต่างๆ เชื่อมต่อกัน ( x1; n1), (x2; n2),..., (เอ็กซ์เค; ไม่เป็นไร). ในการสร้างรูปหลายเหลี่ยมความถี่ ตัวเลือกต่างๆ จะถูกพล็อตบนแกนแอบซิสซา ซีและในการกำหนด - ความถี่ที่สอดคล้องกัน พรรณี. คะแนน ( ซี; พรรณี) เชื่อมต่อกันด้วยส่วนตรงและได้รับรูปหลายเหลี่ยมความถี่ (รูปที่ 1)
รูปหลายเหลี่ยมของความถี่สัมพัทธ์คือเส้นขาดที่ส่วนต่างๆ เชื่อมต่อกัน ( x1; ส1), (x2; ส2),..., (เอ็กซ์เค; สัปดาห์). ในการสร้างรูปหลายเหลี่ยมที่มีความถี่สัมพัทธ์ ตัวเลือกต่างๆ จะถูกพล็อตบนแกนแอบซิสซา ซีและบนพิกัด - ความถี่สัมพัทธ์ที่สอดคล้องกัน วิ. คะแนน ( ซี; วิ) เชื่อมต่อกันด้วยส่วนตรงและได้รับรูปหลายเหลี่ยมของความถี่สัมพัทธ์ ในกรณีที่มีลักษณะต่อเนื่อง แนะนำให้สร้างฮิสโตแกรม
ฮิสโตแกรมความถี่เป็นรูปขั้นที่ประกอบด้วยสี่เหลี่ยม โดยมีฐานเป็นช่วงความยาวบางส่วน ชม.และความสูงเท่ากับอัตราส่วน NIH(ความหนาแน่นของความถี่)
ในการสร้างฮิสโตแกรมความถี่ ช่วงเวลาบางส่วนจะถูกวางบนแกน Abscissa และส่วนที่ขนานกับแกน Abscissa จะถูกวาดไว้เหนือพวกมันในระยะไกล NIH.
สี่เหลี่ยม ฉัน ฮนี / ชม = พรรณี- ผลรวมของตัวเลือกความถี่ ฉัน - ช่วงเวลาที่; ดังนั้นพื้นที่ของฮิสโตแกรมความถี่จึงเท่ากับผลรวมของความถี่ทั้งหมดนั่นคือ ขนาดตัวอย่าง.
ฮิสโตแกรมความถี่สัมพัทธ์เป็นรูปขั้นที่ประกอบด้วยสี่เหลี่ยม โดยมีฐานเป็นช่วงความยาวบางส่วน ชม.และความสูงเท่ากับอัตราส่วน Wi/ชม(ความหนาแน่นความถี่สัมพัทธ์)
ในการสร้างฮิสโตแกรมของความถี่สัมพัทธ์ ช่วงเวลาบางส่วนจะถูกวางบนแกน Abscissa และส่วนที่ขนานกับแกน Abscissa จะถูกวาดไว้เหนือพวกมันในระยะไกล Wi/ชม(รูปที่ 2)
สี่เหลี่ยม ฉัน - สี่เหลี่ยมผืนผ้าบางส่วนเท่ากับ hWi/h = Wi- ความถี่สัมพัทธ์ของตัวแปรต่างๆ ที่จับได้ ฉัน-ช่วงที่ ดังนั้นพื้นที่ของฮิสโตแกรมของความถี่สัมพัทธ์จึงเท่ากับผลรวมของความถี่สัมพัทธ์ทั้งหมดนั่นคือ หน่วย.
1.5 การประมาณค่าพารามิเตอร์ประชากร
พารามิเตอร์หลักของประชากรคือค่าคาดหวังทางคณิตศาสตร์ (ค่าเฉลี่ยทั่วไป) M(X) และค่าเบี่ยงเบนมาตรฐาน ส. นี่เป็นปริมาณคงที่ที่สามารถประมาณได้จากข้อมูลตัวอย่าง การประมาณค่าของพารามิเตอร์ทั่วไปซึ่งแสดงเป็นตัวเลขเดียวเรียกว่าการประมาณค่าแบบจุด
การประมาณค่าแบบจุดของค่าเฉลี่ยทั่วไปคือค่าเฉลี่ยตัวอย่าง
ค่าเฉลี่ยตัวอย่างคือค่าเฉลี่ยเลขคณิตของคุณลักษณะในประชากรตัวอย่าง
หากมีค่าทั้งหมด x1, x2,..., xnลักษณะตัวอย่างจะแตกต่างกัน (หรือหากข้อมูลไม่ได้ถูกจัดกลุ่ม) ดังนั้น:
x1, x2,..., xn n1, n2,..., nk, และ n1 + n2 +...+ nk = n(หรือถ้าค่าเฉลี่ยตัวอย่างคำนวณจากชุดรูปแบบต่างๆ) แล้ว
ในกรณีที่ข้อมูลทางสถิติแสดงในรูปแบบของชุดการแปรผันช่วงเวลาเมื่อคำนวณค่าเฉลี่ยตัวอย่างค่ากลางของช่วงเวลาจะถือเป็นตัวเลือก
ค่าเฉลี่ยตัวอย่างเป็นคุณลักษณะหลักของตำแหน่ง โดยแสดงจุดศูนย์กลางการกระจายตัวของประชากร ทำให้สามารถระบุลักษณะประชากรที่กำลังศึกษาด้วยตัวเลขตัวเดียว ติดตามแนวโน้มการพัฒนา และเปรียบเทียบประชากรต่างๆ (ค่าเฉลี่ยตัวอย่างคือจุด ซึ่งผลรวมของการเบี่ยงเบนของการสังเกตเท่ากับ 0)
สำหรับอัตรา กับ ในการกำหนดระดับการกระจายตัว (ส่วนเบี่ยงเบน) ของตัวบ่งชี้บางตัวจากค่าเฉลี่ย พร้อมกับค่าสูงสุดและค่าต่ำสุด จะใช้แนวคิดของการกระจายตัวและส่วนเบี่ยงเบนมาตรฐาน
ความแปรปรวนตัวอย่างหรือความแปรปรวนตัวอย่าง (จากความแปรปรวนภาษาอังกฤษ) คือการวัดความแปรปรวนของตัวแปร คำนี้ได้รับการประกาศเกียรติคุณครั้งแรกโดย Fischer ในปี 1918
ความแปรปรวนตัวอย่าง Dв คือค่าเฉลี่ยเลขคณิตของกำลังสองของการเบี่ยงเบนของค่าที่สังเกตได้ของคุณลักษณะจากค่าเฉลี่ย
หากมีค่าทั้งหมด x1, x2,..., xnคุณลักษณะการสุ่มตัวอย่างปริมาณ nแตกต่างกัน ดังนั้น:
หากค่าแอตทริบิวต์ทั้งหมด x1, x2,..., xnมีความถี่ที่สอดคล้องกัน n1, n2,..., nk, และ n1 + n2 +...+ nk = n, ที่
ความแปรปรวนแตกต่างกันไปตั้งแต่ศูนย์ถึงอนันต์ ค่าสุดขีดของ 0 หมายความว่าไม่มีความแปรปรวนเมื่อค่าของตัวแปรคงที่
ค่าเบี่ยงเบนกำลังสองเฉลี่ย (ค่าเบี่ยงเบนมาตรฐาน) (จากค่าเบี่ยงเบนมาตรฐานภาษาอังกฤษ) คำนวณเป็นรากที่สองของความแปรปรวน
ยิ่งความแปรปรวนหรือค่าเบี่ยงเบนมาตรฐานสูง ค่าของตัวแปรจะกระจัดกระจายรอบๆ ค่าเฉลี่ยมากขึ้น
คุณลักษณะที่ไม่ใช่พารามิเตอร์ของตำแหน่งคือโหมดและค่ามัธยฐาน
แฟชั่น โมตัวเลือกที่มีความถี่สูงสุดหรือความถี่สัมพัทธ์เรียกว่า
ค่ามัธยฐาน ฉันเรียกว่าตัวแปร ซึ่งแบ่งอนุกรมของรูปแบบออกเป็นสองส่วน โดยมีจำนวนเท่ากับตัวแปร
ถ้าเป็นเลขคี่ ตัวเลือก (n=2k+1)
ฉัน = xk+1,
และถ้าเป็นเลขคู่ ตัวเลือก (n=2k)
ฉัน = (xk + xk+1)/2.
2. การวิเคราะห์สหสัมพันธ์และการถดถอย
2.1 การวิเคราะห์สหสัมพันธ์
ความสัมพันธ์ระหว่างการจัดกลุ่มทางสถิติทางคณิตศาสตร์
การวิเคราะห์ความสัมพันธ์เกี่ยวข้องกับการสร้างความสัมพันธ์ทางสถิติระหว่างตัวแปรสุ่ม สามารถใช้ในการวิจัยเชิงการสอนเพื่อประเมินอิทธิพลของปัจจัยบางอย่างที่มีต่อปัจจัยอื่นๆ และสร้างการเชื่อมโยงระหว่างปัจจัยเหล่านั้นร่วมกับพารามิเตอร์อื่นๆ เช่น ความคาดหวังทางคณิตศาสตร์และค่าเบี่ยงเบนมาตรฐาน การวิเคราะห์สหสัมพันธ์ไม่สามารถใช้โดยตรงในการระบุความสัมพันธ์ระหว่างเหตุและผลระหว่างกระบวนการสุ่มได้ มันสร้างการเชื่อมโยงระหว่างคุณลักษณะทางสถิติของกระบวนการสุ่มที่เกี่ยวข้องเท่านั้น
ให้มีตัวแปรสุ่มสองตัวคือ X และ Y พร้อมด้วยความคาดหวังทางคณิตศาสตร์ mx และ my ตามลำดับ ช่วงเวลาแห่งความสัมพันธ์
Kxy =M((X-mx)(Y-ของฉัน))
จะกำหนดลักษณะความสัมพันธ์ระหว่างปริมาณ X และ Y เพื่อความสะดวกในการใช้งานโมเมนต์สหสัมพันธ์จะถูกทำให้เป็นมาตรฐานตามสูตร
โดยที่ yx และ yy คือค่าเบี่ยงเบนมาตรฐานของค่า X และ Y ค่า Kk เรียกว่าสัมประสิทธิ์สหสัมพันธ์ของค่า X และ Y
สำหรับตัวแปรสุ่มแบบไม่ต่อเนื่องที่เรากำลังเผชิญอยู่ การประมาณค่าสัมประสิทธิ์สหสัมพันธ์จะคำนวณโดยใช้สูตร
สูตรในการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์นั้นใช้ได้โดยมีเงื่อนไขว่าความสัมพันธ์ระหว่างตัวแปรสุ่มนั้นเป็นเส้นตรงและแต่ละค่าเหล่านี้อยู่ภายใต้กฎปกติ
เพื่อประเมินความสัมพันธ์ทางสถิติระหว่างระดับการเตรียมตัวเข้าโรงเรียนกับผลการปฏิบัติงานของนักเรียนชั้นปีที่ 1 ในสาขาวิชา “สารสนเทศ” การเตรียมตัวเข้าโรงเรียนได้รับการประเมินโดยการทดสอบเมื่อเข้าศึกษาในมหาวิทยาลัย (ค่า X) ประเมินผลการปฏิบัติงานของนักเรียนตามผลการสอบหลังภาคการศึกษาแรก (ค่า Y) หมายเลขนักเรียนถูกกำหนดไว้ N.
ข้อมูลเบื้องต้นสำหรับการคำนวณสรุปไว้ในตาราง
การแทนที่ข้อมูลจากตารางเป็นนิพจน์ (1) เราจะได้ Kk=0.78
เราจะเห็นว่าลักษณะทางสถิติของค่า X และ Y นั้นอยู่ใกล้กัน
2.2 การวิเคราะห์การถดถอย
การวิเคราะห์การถดถอยกำหนดหน้าที่ในการศึกษาความสัมพันธ์ระหว่างตัวแปรตามและตัวแปรอิสระทางสถิติ (ตัวถดถอยหรือตัวแสดง) ในกรณีที่ง่ายที่สุด สันนิษฐานว่าการพึ่งพานี้เป็นเส้นตรง ปัญหาของการสร้างความสัมพันธ์เชิงเส้นในรูปแบบ y=ax+b กำลังได้รับการแก้ไข โดยที่ xi และ yi เป็นตัวแปรอิสระและตัวแปรตาม ตามลำดับ (i=1,2,3,...) วิธีแก้หาได้โดยวิธีกำลังสองน้อยที่สุด ค่าจะลดลง
นาที พบสัมประสิทธิ์ a และ b
สูตรการคำนวณมีดังนี้:
โดยพื้นฐานแล้ว ชุดของคะแนนที่ได้รับจากการทดลองจะถูกแทนที่ด้วยการพึ่งพาเชิงวิเคราะห์ y=ax+b โดยประมาณ การแทนที่นี้ทำให้การแปลงทางคณิตศาสตร์ง่ายขึ้นอย่างมาก และสามารถใช้ในการสร้างแบบจำลองเชิงวิเคราะห์ได้ ในกรณีทั่วไป ไม่เพียงแต่เชิงเส้นเท่านั้น แต่ยังสามารถเลือกฟังก์ชันอื่นๆ เพื่อสร้างการพึ่งพาการถดถอยได้ โดยปกติแล้วสูตรในการคำนวณพารามิเตอร์ที่ต้องการจะซับซ้อนมากขึ้น
3. วิธีการทางคณิตศาสตร์เพื่อเพิ่มประสิทธิภาพการทดลอง
3.1 วิธีการเพิ่มประสิทธิภาพ Simplex
ซิมเพล็กซ์คือรูปทรงหลายเหลี่ยมปกติที่มี n+1ด้านบนอยู่ที่ไหน พี -ปัจจัยหลายประการที่มีอิทธิพลต่อกระบวนการ ตัวอย่างเช่น หากมีปัจจัยสองประการ เริมก็เป็นรูปสามเหลี่ยมปกติ
ข้าว. 1 การเพิ่มประสิทธิภาพโดยใช้วิธีซิมเพล็กซ์
ชุดการทดลองเริ่มแรกสอดคล้องกับจุดยอดของซิมเพล็กซ์เริ่มต้น (คะแนน 1, 2 และ 3)เงื่อนไขของการทดลองครั้งแรกเหล่านี้นำมาจากช่วงของค่าปัจจัยที่สอดคล้องกับโหมดที่ทราบดีที่สุดของกระบวนการที่กำลังปรับให้เหมาะสม เปรียบเทียบผลการทดลองที่จุดที่ 1, 2 และ 3, พวกเขาพบสิ่งที่ "แย่ที่สุด" ในหมู่พวกเขา จากมุมมองของเกณฑ์การปรับให้เหมาะสมที่เลือกไว้ ตัวอย่างเช่น ให้ประสบการณ์ที่ "ล้มเหลว" ที่สุดอยู่ในจุดนั้น 1. ประสบการณ์นี้ไม่รวมอยู่ในการพิจารณา และประสบการณ์ ณ จุดนั้นจะถูกนำเข้าสู่ซิมเพล็กซ์แทน 4, ซึ่งสมมาตรกับจุดที่ 1 สัมพันธ์กับด้านตรงข้ามของสามเหลี่ยมที่เชื่อมจุดนั้น 2 และ 3.
จากนั้นพวกเขาจะเปรียบเทียบผลการทดลองที่จุดยอดของซิมเพล็กซ์ใหม่ ละทิ้งส่วนที่ "ไม่สำเร็จ" มากที่สุดและย้ายจุดยอดที่สอดคล้องกันของซิมเพล็กซ์ไปยังจุดนั้น 5. จากนั้นทำซ้ำขั้นตอนข้างต้นตลอดกระบวนการปรับให้เหมาะสม
หากถึงจุดสุดยอดของเกณฑ์การปรับให้เหมาะสมที่สุด การเคลื่อนที่ต่อไปของซิมเพล็กซ์จะหยุดลง ซึ่งหมายความว่าขั้นตอนใหม่จะนำผู้วิจัยกลับไปยังจุดก่อนหน้าในพื้นที่ตัวประกอบ
หากมีเกณฑ์การปรับให้เหมาะสมที่สุดหลายวิธีวิธีนี้จะช่วยให้คุณค้นหาเกณฑ์ที่อยู่ใกล้กับจุดของซิมเพล็กซ์ดั้งเดิมมากขึ้น ดังนั้นหากมีข้อสงสัยเกี่ยวกับการมีอยู่ของเกณฑ์การปรับให้เหมาะสมที่สุดหลายจุด จำเป็นต้องค้นหาเกณฑ์เหล่านี้ในแต่ละครั้งที่เริ่มการปรับให้เหมาะสมจากพื้นที่ใหม่ของพื้นที่ปัจจัย จากนั้นคุณควรเปรียบเทียบเงื่อนไขที่เหมาะสมที่สุดที่พบและเลือกเงื่อนไขที่ดีที่สุดจากตัวเลือกทั้งหมด
เมื่อทำการออปติไมซ์ จำเป็นต้องคำนึงถึงข้อจำกัดที่กำหนดโดยปัจจัยที่มีอิทธิพลและฟังก์ชันการตอบสนอง
สิ่งสำคัญคือต้องทราบว่าเมื่อใช้วิธีซิมเพล็กซ์ ไม่จำเป็นการทดลองซ้ำ ความจริงก็คือข้อผิดพลาดในการทดสอบแยกต่างหากอาจทำให้การเพิ่มประสิทธิภาพช้าลงบ้างเท่านั้น หากการทดลองครั้งต่อๆ ไปดำเนินไปอย่างไร้ที่ติ การเคลื่อนไหวไปสู่จุดที่เหมาะสมจะดำเนินต่อไป
เมทริกซ์ของการทดลองของซิมเพล็กซ์ดั้งเดิมในตัวแปรที่เข้ารหัสได้รับไว้ในตารางที่ 11
ค่าที่รวมอยู่ในตารางนี้คำนวณโดยใช้สูตรต่อไปนี้:
โดยที่ i คือจำนวนปัจจัยในเมทริกซ์การวางแผน สัญลักษณ์ 0 ระบุพิกัดของจุดศูนย์กลางของแผน เช่น ระดับหลัก
ตารางที่ 11
เมทริกซ์ของซิมเพล็กซ์ดั้งเดิม
หมายเลขประสบการณ์ |
เอ็กซ์2 |
ฟังก์ชั่นตอบสนอง |
|||||
เค2 |
|||||||
เค2 |
|||||||
การทดลองที่นำเสนอในตาราง 11 สอดคล้องกับจุดยอดของซิมเพล็กซ์ ซึ่งด้านเท่ากับ 1 และจุดศูนย์กลางตรงกับจุดกำเนิดของพิกัด (ในตัวแปรที่เข้ารหัส)
ผลลัพธ์ของการคำนวณดำเนินการตามตาราง 11 และสูตร (*) แสดงไว้ในตาราง 12.
ตารางที่ 12
เงื่อนไขของการทดลองชุดแรก
หมายเลขประสบการณ์ |
|||||
แน่นอนว่าต้องมีการทดลองจำนวนมากที่สุดในช่วงเริ่มต้นของการทดลอง จากนั้น ในแต่ละขั้นตอนการเพิ่มประสิทธิภาพ จะทำการทดสอบเพียงครั้งเดียวเท่านั้น
เมื่อเริ่มต้นการปรับให้เหมาะสม คุณต้องใช้ตาราง 11 หรือ 12 คำนวณเมทริกซ์ของชุดการทดลองเริ่มต้นในตัวแปรทางกายภาพโดยใช้สูตร
ในอนาคต การดำเนินการทั้งหมดจะดำเนินการกับการดำเนินการทางกายภาพเท่านั้น1 ตัวแปร
เงื่อนไขของประสบการณ์ใหม่แต่ละรายการคำนวณโดยใช้สูตร:
ที่ไหน พ--จำนวนปัจจัยในเมทริกซ์การวางแผน
j -- หมายเลขการทดลอง;
หมายเลขตัวประกอบ i;
ค่าของปัจจัย i-th ในประสบการณ์ที่ "ไม่สำเร็จ" ที่สุดของซิมเพล็กซ์ก่อนหน้า
ควรสังเกตว่าในขั้นตอนการเพิ่มประสิทธิภาพใด ๆ ที่ดำเนินการโดยวิธี simplex สามารถรวมขั้นตอนใหม่ไว้ในโปรแกรมการวิจัยได้ ปัจจัย , ซึ่งถึงตอนนั้นก็ไม่ได้นำมาพิจารณาแต่ก็ยังคงอยู่ในระดับคงที่
ในกรณีนี้ค่าของปัจจัยที่พิจารณาก่อนหน้านี้ทั้งหมดจะถูกคำนวณโดยใช้สูตร:
โดยที่ 1= 1, 2,..., พีนั่นคือเป็นค่าเฉลี่ยเลขคณิตของพิกัดที่สอดคล้องกันของซิมเพล็กซ์ก่อนหน้า
ค่าของปัจจัยที่เพิ่งแนะนำถูกกำหนดโดยสูตร:
โดยที่ x0(n+1) คือระดับหลักของปัจจัยนี้
Dxn+1—ขั้นตอนการเปลี่ยนแปลงที่เลือกสำหรับปัจจัยที่กำหนด
ร+1, KN+1 --ค่าคำนวณโดยใช้สูตร (*)
โปรดทราบว่าการเพิ่มปัจจัยใหม่ให้กับ "การทดสอบแฟคทอเรียล" ที่สมบูรณ์จะมาพร้อมกับจำนวนการทดลองที่เพิ่มขึ้นสองเท่า . ในแง่นี้ วิธีซิมเพล็กซ์มีข้อได้เปรียบที่ชัดเจน .
ตัวอย่างที่ 3.2 ปล่อยให้จำเป็นต้องปรับผลผลิตของผลิตภัณฑ์เป้าหมายให้เหมาะสมโดยใช้วิธีซิมเพล็กซ์ ที่(%) ซึ่งได้มาจากปฏิกิริยาระหว่างรีเอเจนต์สองตัวที่มีความเข้มข้น x1 และ x2 () ที่อุณหภูมิ x3 (°C)
ให้เราเลือกระดับหลักและขั้นตอนของปัจจัยต่างๆ แล้วสรุปลงในตาราง 13.
ตารางที่ 13
ค่าระดับปัจจัยและขั้นตอนการแปรผัน
ระดับหลัก |
ขั้นตอนการเปลี่ยนแปลง |
||
โดยใช้สูตร (3.5) และตาราง ในรูปที่ 12 เราคำนวณเงื่อนไขสำหรับการดำเนินการทดลองสี่ครั้งแรกและสรุปผลลัพธ์ที่ได้รับในตาราง 14. ตัวอย่างเช่น สำหรับการทดลองครั้งที่สาม
x31=1+0.1*0==1; x32==1.50 +0.2 (--0.578) ==1.38; x33=60+5*0.204==61.
ตารางที่ 14
การเพิ่มประสิทธิภาพโดยใช้วิธีซิมเพล็กซ์
หมายเลขประสบการณ์ |
ฟังก์ชั่นตอบสนอง |
||||
เมื่อเปรียบเทียบผลลัพธ์ของการทดลองสี่ครั้งแรก เราจะเห็นว่าผลผลิตเป้าหมายต่ำที่สุดได้รับในการทดลองครั้งที่สาม ประสบการณ์นี้ควรถูกแยกออกจากการพิจารณาเพิ่มเติม
ให้เราแทนที่ด้วยการทดลองที่ 5 เงื่อนไขที่เราจะคำนวณโดยใช้สูตร (**):
ในซิมเพล็กซ์ใหม่ที่เกิดจากการทดลองที่ 1, 2, 4 และ 5 สิ่งที่ "ไม่สำเร็จ" มากที่สุดคือการทดลองที่ 4 เราจะแทนที่ด้วยการทดลองที่ 6 ซึ่งจะพบเงื่อนไขโดยใช้สูตรเดียวกัน (**)
ตอนนี้ให้เราพิจารณาคำถามว่าจะรวมปัจจัยอื่นในโครงการวิจัยอย่างไร เช่น ความเร็วการหมุนของเครื่องกวน ให้จนถึงตอนนี้มันคงที่และเท่ากับ 500 รอบต่อนาทีตอนนี้เราจะพิจารณาค่านี้เป็นปัจจัย x4 และใช้ขั้นตอนการเปลี่ยนแปลง Dx4 = 100 rpm
ซิมเพล็กซ์ก่อนหน้าสำหรับปัจจัยสามตัว (ดูตารางที่ 14) ประกอบด้วยการทดลองที่ 1, 2, 5 และ 6 เพื่อให้ได้ซิมเพล็กซ์ใหม่สำหรับปัจจัยสี่ตัว จากนั้นเราจะแนะนำการทดลองที่ 7 (ตารางที่ 15)
ตารางที่ 15
การเพิ่มปัจจัยใหม่ให้กับโปรแกรมเพิ่มประสิทธิภาพ
หมายเลขประสบการณ์ |
ฟังก์ชั่นตอบสนอง |
|||||
เราพบเงื่อนไขในการทำการทดลองครั้งที่ 7 โดยใช้สูตร (3.7) และ (3.8):
โพสต์บน Allbest.ru
...เอกสารที่คล้ายกัน
วิธีทางคณิตศาสตร์ในการจัดระบบและการใช้ข้อมูลทางสถิติเพื่อข้อสรุปทางวิทยาศาสตร์และการปฏิบัติ กฎการกระจายของตัวแปรสุ่มแบบไม่ต่อเนื่อง แนวคิดของประชากรทั่วไป ปัญหาการสังเกตทางสถิติ การกระจายตัวอย่าง
บทคัดย่อ เพิ่มเมื่อ 12/10/2010
แนวคิดของสถิติทางคณิตศาสตร์ในฐานะวิทยาศาสตร์เกี่ยวกับวิธีการจัดระบบทางคณิตศาสตร์และการใช้ข้อมูลทางสถิติเพื่อการสรุปทางวิทยาศาสตร์และการปฏิบัติ การประมาณค่าพารามิเตอร์ของการแจกแจงทางสถิติ การวิเคราะห์การคำนวณค่าเฉลี่ย
งานหลักสูตร เพิ่มเมื่อ 12/13/2014
สถิติทางคณิตศาสตร์เป็นศาสตร์แห่งวิธีการทางคณิตศาสตร์ในการจัดระบบข้อมูลทางสถิติตัวชี้วัด วาดการแจกแจงเชิงสถิติเชิงบูรณาการของประชากรตัวอย่าง สร้างฮิสโตแกรม การคำนวณค่าประมาณจุดของพารามิเตอร์
งานหลักสูตร เพิ่มเมื่อ 04/10/2011
การวิเคราะห์เบื้องต้นและลักษณะสำคัญของข้อมูลทางสถิติ การประมาณค่าพารามิเตอร์การกระจายจุด ช่วงความเชื่อมั่นสำหรับค่าคาดหวังทางคณิตศาสตร์ที่ไม่ทราบค่าและค่าเบี่ยงเบนมาตรฐาน การทดสอบสมมติฐานทางสถิติ
วิทยานิพนธ์เพิ่มเมื่อ 18/01/2559
สถิติเป็นศาสตร์แห่งปรากฏการณ์มวลชนในธรรมชาติและสังคม การรับ การประมวลผล การวิเคราะห์ข้อมูล สถิติประชากร การพยากรณ์ประชากรของรัสเซีย วิธีการประมวลผลข้อมูลทางสถิติ: องค์ประกอบของตรรกะ เชิงผสม ทฤษฎีความน่าจะเป็น
การนำเสนอเพิ่มเมื่อ 12/19/2012
การประยุกต์วิธีการเฉพาะทางสถิติตามงาน วิธีการสังเกตมวล การจัดกลุ่ม ตัวบ่งชี้ทั่วไป อนุกรมเวลา วิธีดัชนี การวิเคราะห์ความสัมพันธ์และความแปรปรวน การคำนวณค่าสถิติเฉลี่ย
ทดสอบเพิ่มเมื่อ 09.21.2009
การได้รับข้อมูลทางสถิติสำหรับคำอธิบายทั่วไปเกี่ยวกับสถานะและการพัฒนาของปรากฏการณ์ ประเภท วิธีการ และรูปแบบการจัดองค์กรของการสังเกตทางสถิติ รูปแบบทางสถิติ สรุป และการจัดกลุ่มข้อมูล ตารางสถิติและกราฟ
บทคัดย่อ เพิ่มเมื่อ 11/12/2552
การหาค่าคาดหวังทางคณิตศาสตร์และส่วนเบี่ยงเบนมาตรฐาน เพื่อเลือกกฎการกระจายสำหรับตัวอย่างข้อมูลทางสถิติเกี่ยวกับความล้มเหลวของส่วนประกอบของยานพาหนะ ค้นหาจำนวนเหตุการณ์ในช่วงเวลาที่กำหนด การคำนวณมูลค่าของเกณฑ์เพียร์สัน
ทดสอบเพิ่มเมื่อ 04/01/2014
วิธีการนำเสนอข้อมูลสถิติทางกฎหมายแบบตาราง ตัวชี้วัดที่แน่นอนและทั่วไป ปริมาณสัมพัทธ์ ประเภทหลัก และการใช้งาน ค่าเฉลี่ยเรขาคณิต โหมด และค่ามัธยฐาน วิธีการสังเกตตัวอย่าง การจำแนกอนุกรมไดนามิกส์
ทดสอบเพิ่มเมื่อ 29/03/2556
การประมวลผลข้อมูลทางสถิติเบื้องต้นเกี่ยวกับจำนวนเทอร์มินัลสมาชิกเซลลูล่าร์ที่ลงทะเบียนในปี 2551 ต่อประชากร 1,000 คนในภูมิภาครัสเซีย การประมาณค่าพารามิเตอร์ช่วง สมมติฐานเกี่ยวกับประเภทของการกระจาย การวิเคราะห์การถดถอย
สถิติทางคณิตศาสตร์เป็นสาขาหนึ่งของคณิตศาสตร์ที่พัฒนาวิธีการบันทึก อธิบาย และวิเคราะห์ข้อมูลเชิงสังเกตและการทดลอง เพื่อสร้างแบบจำลองความน่าจะเป็นของปรากฏการณ์และกระบวนการสุ่ม ขึ้นอยู่กับลักษณะทางคณิตศาสตร์ของผลการสังเกตเฉพาะ สถิติทางคณิตศาสตร์แบ่งออกเป็นสถิติของตัวเลข การวิเคราะห์ทางสถิติหลายตัวแปร การวิเคราะห์ฟังก์ชัน (กระบวนการ) และอนุกรมเวลา สถิติของวัตถุที่มีลักษณะที่ไม่ใช่ตัวเลข สถิติทางคณิตศาสตร์ผสมผสานวิธีต่างๆ ของการวิเคราะห์ทางสถิติโดยอิงจากการใช้รูปแบบทางสถิติหรือคุณลักษณะของรูปแบบเหล่านั้น
ประวัติความเป็นมาของสถิติมักจะพิจารณาโดยเริ่มจากปัญหาในการกู้คืนการพึ่งพาเนื่องจากการพัฒนาโดย K. Gauss ในปี พ.ศ. 2337 (อ้างอิงจากแหล่งข้อมูลอื่น - ในปี พ.ศ. 2338) วิธีกำลังสองน้อยที่สุดการพัฒนาวิธีการประมาณข้อมูลและลดขนาดคำอธิบายเริ่มขึ้นเมื่อกว่า 100 ปีที่แล้วเมื่อ K. Pearson สร้างขึ้น วิธีองค์ประกอบหลักต่อมาก็ได้รับการพัฒนา การวิเคราะห์ปัจจัยวิธีการก่อสร้างต่างๆ (การวิเคราะห์คลัสเตอร์)การวิเคราะห์และการใช้งาน (การวิเคราะห์จำแนก)การจำแนกประเภท (ประเภท)และอื่น ๆ ในช่วงต้นศตวรรษที่ 20 ทฤษฎีสถิติทางคณิตศาสตร์ได้รับการพัฒนาโดย A. A. Chuprov การมีส่วนร่วมที่สำคัญในทฤษฎีกระบวนการสุ่มจัดทำโดย A. A. Markov, E. E. Slutsky, A. N. Kolmogorov, A. Ya. Khinchin และคนอื่น ๆ พัฒนาขึ้นในช่วงสามแรกของศตวรรษที่ 20 ทฤษฎีการวิเคราะห์ข้อมูลเรียกว่า สถิติพาราเมตริกเนื่องจากวัตถุประสงค์หลักของการศึกษาคือตัวอย่างจากการแจกแจงที่อธิบายโดยพารามิเตอร์หนึ่งตัวหรือจำนวนเล็กน้อย ลักษณะที่พบบ่อยที่สุดคือกลุ่มของเส้นโค้ง Pearson ซึ่งกำหนดโดยพารามิเตอร์สี่ตัว ความนิยมมากที่สุดคือการแจกแจงแบบปกติ เพื่อทดสอบสมมติฐาน จะใช้การทดสอบแบบเพียร์สัน นักศึกษา และฟิชเชอร์ มีการเสนอวิธีความน่าจะเป็นสูงสุดและการวิเคราะห์ความแปรปรวน และแนวคิดพื้นฐานของการวางแผนการทดลองได้รับการกำหนด
ในปี 1954 นักวิชาการของ Academy of Sciences ของยูเครน SSR B.V. Gnedenko ให้คำจำกัดความต่อไปนี้: "สถิติประกอบด้วยสามส่วน:
- 1) การรวบรวมข้อมูลทางสถิติ ได้แก่ ข้อมูลที่แสดงลักษณะแต่ละหน่วยของมวลรวมใด ๆ
- 2) การศึกษาทางสถิติของข้อมูลที่ได้รับซึ่งประกอบด้วยการระบุรูปแบบที่สามารถสร้างขึ้นบนพื้นฐานของข้อมูลการสังเกตมวล
- 3) การพัฒนาเทคนิคในการสังเกตและวิเคราะห์ข้อมูลทางสถิติ
อันที่จริงส่วนสุดท้ายประกอบด้วยเนื้อหาของสถิติทางคณิตศาสตร์"
ตามระดับความจำเพาะของวิธีการที่เกี่ยวข้องกับการแช่ในปัญหาเฉพาะกิจกรรมทางวิทยาศาสตร์และประยุกต์สามประเภทในสาขาวิธีการวิเคราะห์ข้อมูลทางสถิติมีความโดดเด่น:
- ก) การพัฒนาและการวิจัยวิธีการทั่วไป โดยไม่คำนึงถึงลักษณะเฉพาะของสาขาที่ประยุกต์ใช้
- b) การพัฒนาและการวิจัยแบบจำลองทางสถิติของปรากฏการณ์และกระบวนการจริงตามความต้องการของกิจกรรมเฉพาะด้าน
- ค) การประยุกต์วิธีการและแบบจำลองทางสถิติสำหรับการวิเคราะห์ทางสถิติของข้อมูลเฉพาะ
วิธีการวิเคราะห์ทางสถิติที่พบบ่อยที่สุดคือ:
- การวิเคราะห์การถดถอย (ขึ้นอยู่กับการเปรียบเทียบความคาดหวังทางคณิตศาสตร์)
- การวิเคราะห์ความแปรปรวน (ขึ้นอยู่กับการเปรียบเทียบความแปรปรวน)
- การวิเคราะห์ความสัมพันธ์ (คำนึงถึงความคาดหวังทางคณิตศาสตร์ ความแปรปรวน และลักษณะของการเชื่อมโยงระหว่างเหตุการณ์หรือกระบวนการ)
- การวิเคราะห์ปัจจัย (การประมวลผลทางสถิติของการทดลองหลายปัจจัย)
- ความสัมพันธ์อันดับ (การรวมกันของความสัมพันธ์และการวิเคราะห์ปัจจัย)
เมื่อใช้วิธีการต่าง ๆ ของสถิติทางคณิตศาสตร์ รูปแบบทางสถิติหรือลักษณะเฉพาะของรูปแบบจะได้รับหลายวิธี: โดยการสังเกตและศึกษาตัวอย่างโดยใช้วิธีการประมาณโดยใช้วิธีการต่าง ๆ ในการแปลงหรือแบ่งตัวอย่างให้อยู่ในรูปของชุดการแปรผัน การแบ่งตัวอย่างออกเป็นกระแส , ส่วนต่างๆ , ช่วงเวลาสุ่ม และอื่นๆ
สถิติทางคณิตศาสตร์ถูกนำมาใช้ในด้านต่างๆของการจัดการ
เดิมคำว่า "สถิติ" ใช้เพื่ออธิบายภาวะเศรษฐกิจและการเมืองของรัฐหรือบางส่วน ตัวอย่างเช่น คำจำกัดความย้อนกลับไปถึงปี 1792: “สถิติอธิบายสถานะของรัฐในปัจจุบันหรือ ณ จุดใดจุดหนึ่งที่ทราบในอดีต” และในปัจจุบันกิจกรรมการบริการทางสถิติของรัฐก็สอดคล้องกับคำจำกัดความนี้ สถิติถูกกำหนดให้เป็นสาขาวิชาความรู้ที่เกี่ยวข้องกับประเด็นทั่วไปในการรวบรวม วัด และวิเคราะห์ข้อมูลทางสถิติจำนวนมาก (เชิงปริมาณหรือเชิงคุณภาพ) การศึกษาด้านปริมาณของปรากฏการณ์ทางสังคมมวลชนในรูปแบบตัวเลข
คำว่า "สถิติ" มาจากภาษาละติน สถานะ -สถานะของกิจการ คำว่า "สถิติ" ถูกนำมาใช้ในวิทยาศาสตร์โดยนักวิทยาศาสตร์ชาวเยอรมัน Gottfried Achenwall ในปี ค.ศ. 1746 โดยเสนอให้แทนที่ชื่อของหลักสูตร "รัฐศึกษา" ที่สอนในมหาวิทยาลัยในเยอรมนีด้วย "สถิติ" จึงเป็นจุดเริ่มต้นของการพัฒนาสถิติในฐานะ สาขาวิชาวิทยาศาสตร์และวิชาการ
สถิติใช้วิธีการพิเศษสำหรับการวิจัยและการประมวลผลวัสดุ: การสังเกตทางสถิติมวล, วิธีการจัดกลุ่ม, ค่าเฉลี่ย, ดัชนี, วิธีสมดุล, วิธีภาพกราฟิก และวิธีการอื่น ๆ ในการวิเคราะห์ข้อมูลทางสถิติ
การพัฒนาเทคโนโลยีคอมพิวเตอร์มีผลกระทบอย่างมากต่อสถิติ ก่อนหน้านี้ แบบจำลองทางสถิติจะแสดงด้วยแบบจำลองเชิงเส้นเป็นหลัก การเพิ่มขึ้นของความเร็วของคอมพิวเตอร์และการพัฒนาอัลกอริธึมเชิงตัวเลขที่สอดคล้องกันได้นำไปสู่ความสนใจที่เพิ่มขึ้นในแบบจำลองไม่เชิงเส้น เช่น โครงข่ายประสาทเทียม และได้นำไปสู่การพัฒนาแบบจำลองทางสถิติที่ซับซ้อน เช่น แบบจำลองเชิงเส้นทั่วไปและแบบจำลองลำดับชั้น วิธีการคำนวณจากการสุ่มตัวอย่างซ้ำๆ แพร่หลายมากขึ้น ปัจจุบัน สถิติเชิงคำนวณกำลังพัฒนา และมีซอฟต์แวร์ทางสถิติหลากหลายสำหรับวัตถุประสงค์ทั่วไปและเฉพาะทาง วิธีการทางสถิติใช้ในทิศทางที่เรียกว่า "การขุดข้อมูล" (ดูบทที่ 8)
สถิติทางคณิตศาสตร์เป็นสาขาหนึ่งของคณิตศาสตร์ประยุกต์ที่อยู่ติดกันโดยตรงและอิงตามทฤษฎีความน่าจะเป็น เช่นเดียวกับทฤษฎีทางคณิตศาสตร์อื่นๆ สถิติทางคณิตศาสตร์พัฒนาขึ้นภายในกรอบของแบบจำลองบางอย่างที่อธิบายปรากฏการณ์จริงช่วงหนึ่ง ในการกำหนดแบบจำลองทางสถิติและอธิบายปัญหาเฉพาะในสถิติทางคณิตศาสตร์ ให้เรานึกถึงบทบัญญัติบางประการจากทฤษฎีความน่าจะเป็น
แบบจำลองทางคณิตศาสตร์ของปรากฏการณ์สุ่มที่ศึกษาในทฤษฎีความน่าจะเป็นนั้นมีพื้นฐานมาจากแนวคิดเรื่องปริภูมิความน่าจะเป็น ยิ่งไปกว่านั้น ในแต่ละสถานการณ์ ความน่าจะเป็นถือเป็นฟังก์ชันตัวเลขที่ทราบโดยสมบูรณ์ในพีชคณิต นั่นคือ สำหรับตัวเลขใดๆ ก็ตาม ตัวเลขจะถูกกำหนดโดยสมบูรณ์ งานหลักของทฤษฎีความน่าจะเป็นคือการพัฒนาวิธีการค้นหาความน่าจะเป็นของเหตุการณ์ที่ซับซ้อนต่างๆ จากความน่าจะเป็นที่ทราบของเหตุการณ์ที่ง่ายกว่า (เช่น การใช้กฎการกระจายตัวของตัวแปรสุ่มที่ทราบ คุณลักษณะเชิงตัวเลขและกฎการกระจายฟังก์ชันของตัวแปรสุ่มคือ มุ่งมั่น).
อย่างไรก็ตาม ในทางปฏิบัติ เมื่อศึกษาการทดลองสุ่มที่เฉพาะเจาะจง ตามกฎแล้วความน่าจะเป็นคือไม่ทราบหรือทราบเพียงบางส่วน เราคิดได้แค่ว่าความน่าจะเป็นที่แท้จริงนั้นเป็นองค์ประกอบของความน่าจะเป็นบางระดับ (ที่เลวร้ายที่สุด - คลาสของความน่าจะเป็นที่เป็นไปได้ทั้งหมดที่สามารถระบุได้ใน ) ระดับ เรียกว่าชุด ยอมรับได้ เพื่ออธิบายการทดลองที่กำหนดความน่าจะเป็น และเซต - แบบจำลองทางสถิติ การทดลอง. โดยทั่วไป งานของสถิติทางคณิตศาสตร์คือการปรับแต่งแบบจำลองความน่าจะเป็นของปรากฏการณ์สุ่มที่กำลังศึกษาอยู่ (นั่นคือ เพื่อค้นหาความน่าจะเป็นจริงหรือใกล้เคียงกัน) โดยใช้ข้อมูลที่ได้มาจากผลลัพธ์ที่สังเกตได้ของการทดลอง ซึ่งเรียกว่าข้อมูลทางสถิติ .
ในสถิติทางคณิตศาสตร์คลาสสิกซึ่งเราจะศึกษาเพิ่มเติม เราจะจัดการกับการทดลองสุ่มซึ่งประกอบด้วยการดำเนินการ nการสังเกตอิสระซ้ำๆ ของตัวแปรสุ่มบางตัวที่มีการแจกแจงความน่าจะเป็นที่ไม่ทราบสาเหตุ เช่น ฟังก์ชันการกระจายที่ไม่รู้จัก ในกรณีนี้จะเรียกชุดของค่าที่เป็นไปได้ทั้งหมดของตัวแปรสุ่มที่สังเกตได้ ประชากรทั่วไป มีฟังก์ชันการกระจายหรือกระจายตาม ตัวเลข ซึ่งเป็นผลมาจากการสังเกตอิสระของตัวแปรสุ่มเรียกว่า การสุ่มตัวอย่าง จากประชาชนทั่วไปหรือ เลือกสรร (ทางสถิติ) ข้อมูล เรียกว่าจำนวนการสังเกต ปริมาณ ตัวอย่าง
งานหลักของสถิติทางคณิตศาสตร์คือการใช้ตัวอย่างเพื่ออะไร จากประชากรทั่วไป โดยดึงข้อมูลออกมามากที่สุดเท่าที่จะเป็นไปได้ เพื่อสรุปข้อสรุปเกี่ยวกับลักษณะความน่าจะเป็นที่ไม่ทราบของตัวแปรสุ่มที่สังเกตได้
โดยแบบจำลองทางสถิติที่สอดคล้องกับการสังเกตอิสระซ้ำของตัวแปรสุ่ม มันเป็นเรื่องธรรมดาที่จะเข้าใจแทนเซต โดยที่ประชากรทั่วไปคือพีชคณิตของเซตย่อย Borel ของ เป็นคลาสของฟังก์ชันการแจกแจงที่ยอมรับได้สำหรับตัวแปรสุ่มที่กำหนด ซึ่งมีฟังก์ชันการแจกแจงที่ไม่รู้จักจริงอยู่ด้วย
ทั้งสามมักเรียกว่าการทดลองทางสถิติ
หากระบุฟังก์ชันการแจกแจงจากจนถึงค่าของพารามิเตอร์บางตัวนั่นคือ ( เป็นชุดพารามิเตอร์) แบบจำลองดังกล่าวจะถูกเรียก พารามิเตอร์ . พวกเขาบอกว่าในกรณีนี้มันเป็นที่รู้จัก พิมพ์ การกระจายของตัวแปรสุ่มที่สังเกตได้ และไม่ทราบเฉพาะพารามิเตอร์ที่การแจกแจงขึ้นอยู่กับเท่านั้น พารามิเตอร์อาจเป็นสเกลาร์หรือเวกเตอร์ก็ได้
แบบจำลองทางสถิติเรียกว่า อย่างต่อเนื่อง หรือ ไม่ต่อเนื่อง ถ้าเป็นส่วนประกอบทั้งหมดของคลาสฟังก์ชันการแจกแจงตามลำดับ
ตัวอย่างที่ 1. สมมติว่าการแจกแจงของตัวแปรสุ่มที่สังเกตได้เป็นแบบเกาส์เซียนโดยมีค่าความแปรปรวนที่ทราบและค่าที่คาดหวังที่ไม่ทราบ
ในกรณีนี้ แบบจำลองทางสถิติมีความต่อเนื่องและมีรูปแบบ:
หากไม่ทราบความแปรปรวน แบบจำลองทางสถิติจะมีรูปแบบ:
และฟังก์ชันการแจกแจงมีความหนาแน่นของความน่าจะเป็น
นี่คือสิ่งที่เรียกว่าโมเดลปกติทั่วไป ซึ่งแสดงไว้
ตัวอย่างที่ 2. สมมติว่าการกระจายตัวของตัวแปรสุ่มที่สังเกตได้คือปัวซองโดยมีพารามิเตอร์ที่ไม่รู้จัก ในกรณีนี้ แบบจำลองทางสถิติไม่ต่อเนื่องและมีรูปแบบ: , ตัวแปรสุ่ม (พวกเขากล่าวว่าตัวแปรสุ่มเป็นการคัดลอก) และยังไม่ได้ใช้ค่าเฉพาะอันเป็นผลมาจากการทดลอง การเปลี่ยนจากตัวอย่างเฉพาะ เพื่อสุ่มตัวอย่างจะถูกนำไปใช้ซ้ำในภายหลังในการแก้คำถามและปัญหาเชิงทฤษฎีเพื่อให้ได้ข้อสรุปที่ถูกต้องสำหรับตัวอย่างใด ๆ จากประชากรทั่วไป
ปัญหาหลักที่พิจารณาในสถิติทางคณิตศาสตร์สามารถแบ่งออกเป็นสองกลุ่มใหญ่:
1. ปัญหาที่เกี่ยวข้องกับการกำหนดกฎการกระจายที่ไม่รู้จักของตัวแปรสุ่มที่สังเกตได้และพารามิเตอร์ที่รวมอยู่ในนั้น (พิจารณาภายใต้กรอบของทฤษฎีการประมาณค่าทางสถิติ)
2. ปัญหาที่เกี่ยวข้องกับการทดสอบสมมติฐานเกี่ยวกับกฎการกระจายของตัวแปรสุ่มที่สังเกตได้ (แก้ไขภายในกรอบของทฤษฎีการทดสอบสมมติฐานทางสถิติ)
4.1.1. แบบจำลองทางสถิติในการสร้างแบบจำลองทางสถิติ (สุ่ม) วัตถุหลักของการสร้างแบบจำลองคือเหตุการณ์สุ่ม ตัวแปรสุ่ม และฟังก์ชันสุ่ม
เมื่อทำการทดลองผู้วิจัยจะบันทึกการเกิดขึ้นหรือไม่เกิดขึ้นของเหตุการณ์ที่สนใจและยังวัดค่าของพารามิเตอร์ที่มีลักษณะสุ่มและเป็นค่าการใช้งานของตัวแปรสุ่มบางตัวเป็นหลัก
การสร้างแบบจำลองทางสถิติช่วยให้ได้รับข้อมูลที่เกี่ยวข้องกับการเกิดขึ้นหรือไม่เกิดขึ้นของเหตุการณ์บางอย่างที่เกิดขึ้นในวัตถุจริงโดยไม่ต้องทำการทดลองจริงกับวัตถุที่กำลังศึกษา (ซึ่งในกรณีส่วนใหญ่ต้องใช้วัสดุและต้นทุนทางการเงินจำนวนมาก) เกี่ยวกับค่าตัวอย่างของตัวแปรสุ่มตามลักษณะความน่าจะเป็นที่มีอยู่ของเหตุการณ์จำลองและตัวแปรสุ่ม การสร้างแบบจำลองประเภทนี้เกี่ยวข้องกับการรวบรวมข้อมูลเบื้องต้นเกี่ยวกับตัวบ่งชี้แบบจำลองและการประมวลผลทางสถิติเพิ่มเติมของผลลัพธ์ที่ได้รับ เพื่อให้ได้ค่าประมาณทางสถิติที่เหมาะสมซึ่งจำเป็นสำหรับการสร้างแบบจำลองคุณลักษณะความน่าจะเป็น
โมเดล Stochastic ส่วนใหญ่จะใช้ในสองกรณี:
1) วัตถุประสงค์ของการสร้างแบบจำลองได้รับการศึกษาไม่ดี - ไม่มีกฎหมายเชิงปริมาณที่ได้รับการพัฒนาอย่างดีเพียงพอซึ่งอธิบายกระบวนการและปรากฏการณ์ที่อยู่ระหว่างการพิจารณาและยังไม่มีความเป็นไปได้ในการค้นหาวิธีแก้ไขปัญหาเชิงวิเคราะห์ที่ยอมรับได้สำหรับปัญหานี้
2) วัตถุแบบจำลองได้รับการศึกษาค่อนข้างดีในลักษณะที่กำหนด แต่ไม่คำนึงถึงปัจจัยสุ่มที่มีอิทธิพลต่อกระบวนการและปรากฏการณ์ที่กำลังศึกษา
ในกรณีแรกตามคำอธิบายด้วยวาจาของวัตถุที่กำลังศึกษา ตัวบ่งชี้เชิงปริมาณจะถูกเลือกด้วยการคำนวณมิติทางกายภาพซึ่งประกอบด้วยสองกลุ่ม กลุ่มหนึ่งถือเป็นปริมาณอินพุตของแบบจำลอง และอีกกลุ่มถือเป็นปริมาณเอาท์พุต นอกจากนี้ การใช้ผลลัพธ์ทางทฤษฎีทางวิทยาศาสตร์ที่ได้รับจากนักวิจัยคนอื่นๆ ในสาขานี้ และอาจใช้สมมติฐานที่จำเป็นจำนวนหนึ่ง ตลอดจนข้อมูลการทดลองที่มีอยู่แล้วเกี่ยวกับปริมาณอินพุตและเอาต์พุต (เช่น กฎการกระจาย) จะสร้างการพึ่งพาเชิงกำหนดหรือสุ่มระหว่าง ปริมาณอินพุตและเอาต์พุตของโมเดล ชุดของความสัมพันธ์ที่ได้รับระหว่างปริมาณอินพุตและเอาต์พุต (โดยปกติจะเขียนในรูปแบบของสมการ) เรียกว่า แบบจำลองทางสถิติ
ในระหว่างการนำแบบจำลองทางสถิติไปใช้ตามกฎที่เลือกของการแจกแจงตัวแปรสุ่มและความน่าจะเป็นที่เลือกของเหตุการณ์จำลอง วิธีการทางสถิติทางคณิตศาสตร์จะกำหนดค่าตัวอย่างก่อนการทดลองของตัวแปรสุ่มและลำดับเสมือนเชิงประจักษ์ของการเกิดขึ้น หรือการไม่มีเหตุการณ์จำลองเกิดขึ้น ถัดไป ค่าตัวอย่างที่สอดคล้องกันของปริมาณเอาต์พุตจะถูกกำหนดโดยใช้สมการแบบจำลอง และการนำแบบจำลองที่สร้างขึ้นไปใช้ซ้ำช่วยให้ผู้วิจัยสามารถสร้างตัวอย่างแบบจำลองของค่าเอาต์พุต ซึ่งจะต้องได้รับการวิเคราะห์ทางสถิติอีกครั้ง (สหสัมพันธ์ การถดถอย การกระจายตัว สเปกตรัม) เพื่อให้ได้ค่าประมาณลักษณะของพารามิเตอร์เอาต์พุตของแบบจำลองหรือ ทดสอบสมมติฐานที่นำเสนอ จากผลลัพธ์ที่ได้รับ จะมีการสรุปข้อสรุปเกี่ยวกับวัตถุประสงค์ของการศึกษา รวมถึงเหตุผลสำหรับการใช้งานจริงของแบบจำลองที่สร้างขึ้น
วิธีการสร้างแบบจำลองทางสถิติถูกนำมาใช้กันอย่างแพร่หลายในการแก้ปัญหาการเข้าคิว ทฤษฎีการหาค่าเหมาะที่สุด ทฤษฎีการควบคุม ฟิสิกส์เชิงทฤษฎี ฯลฯ
พื้นฐานทางทฤษฎีของวิธีการสร้างแบบจำลองทางสถิติบนคอมพิวเตอร์คือทฤษฎีบทขีดจำกัดของทฤษฎีความน่าจะเป็น
4.1.2. ความไม่เท่าเทียมกันของ Chebyshev. สำหรับฟังก์ชันที่ไม่เป็นลบของตัวแปรสุ่ม ก็คืออสมการ
.
4.1.3. ทฤษฎีบทของเบอร์นูลลี. หากทำการทดสอบอิสระ ซึ่งในแต่ละเหตุการณ์มีเหตุการณ์บางอย่างเกิดขึ้นด้วยความน่าจะเป็น ดังนั้นความบริสุทธิ์สัมพัทธ์ของการเกิดขึ้นของเหตุการณ์ (จำนวนผลการทดสอบที่น่าพอใจ) ที่มาบรรจบกันในความน่าจะเป็น เช่น ที่
4.1.4. ทฤษฎีบทของปัวซอง. หากทำการทดสอบอิสระและความน่าจะเป็นของเหตุการณ์ที่เกิดขึ้นในการทดสอบนั้นเท่ากับ ความบริสุทธิ์สัมพัทธ์ของการเกิดเหตุการณ์นั้น (จำนวนผลลัพธ์ที่น่าพอใจของการทดสอบ) ที่มาบรรจบกันในความน่าจะเป็นเป็นค่าเฉลี่ยของความน่าจะเป็น , เช่น. ที่
4.1.5. ทฤษฎีบทของเชบีเชฟ. หากสังเกตค่าของตัวแปรสุ่มในการทดสอบอิสระจากนั้นที่ค่าเฉลี่ยเลขคณิตของค่าของตัวแปรสุ่มจะมาบรรจบกันในความน่าจะเป็นกับความคาดหวังทางคณิตศาสตร์นั่นคือ ที่
4.1.6. ทฤษฎีบทของเชบีเชฟแบบทั่วไป. หากตัวแปรสุ่มอิสระที่มีความคาดหวังและความแปรปรวนทางคณิตศาสตร์ถูกขอบเขตจากด้านบนด้วยจำนวนเดียวกัน จากนั้นเมื่อค่าเฉลี่ยเลขคณิตของค่าของตัวแปรสุ่มมาบรรจบกันในความน่าจะเป็นกับค่าเฉลี่ยเลขคณิตของความคาดหวังทางคณิตศาสตร์
4.1.7. ทฤษฎีบทของมาร์คอฟ.. ทฤษฎีบทของเชบีเชฟยังใช้ได้กับตัวแปรสุ่มตามถ้า
4.1.8. ทฤษฎีบทขีดจำกัดกลาง. หากตัวแปรสุ่มแจกแจงอย่างอิสระเหมือนกันโดยมีค่าคาดหวังและความแปรปรวนทางคณิตศาสตร์ จากนั้นเมื่อกฎการกระจายของผลรวมเข้าใกล้กฎการแจกแจงแบบปกติอย่างไม่มีกำหนด
ฟังก์ชันลาปลาซอยู่ที่ไหน
4.1.9. ทฤษฎีบทของลาปลาซ. หากในการทดลองอิสระแต่ละครั้ง มีเหตุการณ์เกิดขึ้นด้วยความน่าจะเป็น ดังนั้น