Saturday 29 July 2017

ตัวอย่าง ของ ทั้ง เส้น ถดถอย และ the เคลื่อนไหว ค่าเฉลี่ย และ เรียบ เทคนิค


การคาดการณ์โดย Smoothing Techniques เว็บไซต์นี้เป็นส่วนหนึ่งของ JavaScript E-labs การเรียนรู้วัตถุสำหรับการตัดสินใจ JavaScript อื่น ๆ ในชุดนี้จัดอยู่ในส่วนต่างๆของแอ็พพลิเคชันในส่วน MENU ในหน้านี้ชุดข้อมูลเวลาคือชุดของข้อสังเกตที่ มีการสั่งซื้อในเวลาที่สืบทอดมาในชุดของข้อมูลที่ถ่ายเมื่อเวลาผ่านไปคือรูปแบบของรูปแบบการสุ่มบางอย่างมีอยู่วิธีการในการลดการยกเลิกผลกระทบเนื่องจากรูปแบบการสุ่มเทคนิคที่ใช้กันอย่างแพร่หลายคือ smoothing เทคนิคเหล่านี้เมื่อใช้อย่างถูกต้องเปิดเผยอย่างชัดเจนมากขึ้นแนวโน้มพื้นฐาน ใส่ชุดข้อมูลลำดับแถวตามลำดับจากมุมซ้ายบนและพารามิเตอร์ s จากนั้นคลิกที่ปุ่มคำนวณเพื่อขอรับการคาดการณ์ล่วงหน้าหนึ่งรอบล่วงหน้ากล่อง Bowl ไม่รวมอยู่ในการคำนวณ แต่มีศูนย์อยู่ ในการป้อนข้อมูลของคุณเพื่อย้ายจากเซลล์ไปยังเซลล์ในข้อมูลเมทริกซ์ใช้แป้น Tab ไม่ใช่ลูกศรหรือป้อนคีย์ลักษณะของชุดเวลาซึ่งอาจถูกเปิดเผยโดย examini กราฟของค่าคาดการณ์และลักษณะการตกค้างของการคาดการณ์สภาพอากาศการคำนวณค่าเฉลี่ยการเลื่อนอันดับเฉลี่ยระหว่างเทคนิคที่นิยมใช้มากที่สุดสำหรับการประมวลผลล่วงหน้าของชุดข้อมูลเวลาพวกเขาใช้เพื่อกรองสัญญาณรบกวนแบบสุ่มจากข้อมูลเพื่อให้ชุดข้อมูลเวลา นุ่มนวลหรือแม้กระทั่งการเน้นองค์ประกอบข้อมูลบางอย่างที่มีอยู่ในชุดข้อมูลเวลา Exponential Smoothing นี่เป็นโครงการที่ได้รับความนิยมมากในการผลิตชุดเวลาที่ราบรื่นโดยที่ค่าเฉลี่ยเคลื่อนที่ของการสังเกตการณ์ในอดีตมีการถ่วงน้ำหนักเท่ากัน Exponential Smoothing กำหนดค่าน้ำหนักที่ลดลงอย่างมากเมื่อการสังเกตมีอายุมากขึ้น กล่าวอีกนัยหนึ่งการสังเกตล่าสุดมีน้ำหนักมากขึ้นในการคาดการณ์มากกว่าการสังเกตที่เก่ากว่า Double Exponential Smoothing ดีกว่าในการจัดการกับแนวโน้ม Triple Exponential Smoothing จะดีกว่าในการจัดการกับแนวโน้มของพาราโบลาค่าเฉลี่ยเคลื่อนที่ที่ถ่วงน้ำหนักแบบเร้าซ้อนด้วยการปรับให้เรียบสม่ำเสมอสอดคล้องกับแบบเรียบง่าย ค่าเฉลี่ยเคลื่อนที่ของความยาวเช่น ระยะเวลา n โดยที่ a และ n มีความสัมพันธ์กันโดย 2 n 1 หรือ n 2 - a. ตัวอย่างเช่นค่าเฉลี่ยเคลื่อนที่ถ่วงน้ำหนักที่มีค่าความยาวคลื่นและค่าคงที่ที่ราบเรียบเท่ากับ 0 1 จะเท่ากับค่าเฉลี่ยเคลื่อนที่ 19 วันและ ค่าเฉลี่ยเคลื่อนที่เฉลี่ย 40 วันจะสอดคล้องกับค่าเฉลี่ยเคลื่อนที่แบบถ่วงน้ำหนักแบบยกกำลังยกโดยมีค่าคงที่ที่ราบเรียบเท่ากับ 0 04878.Holt s Linear Exponential Smoothing สมมติว่าลำดับเวลาไม่ใช่ตามฤดูกาล แต่เป็นวิธีการแสดงแนวโน้มของ Holt s ประมาณทั้งปัจจุบัน ระดับและแนวโน้มปัจจุบันข้อสังเกตุว่าค่าเฉลี่ยเคลื่อนที่ที่เรียบง่ายเป็นกรณีพิเศษของการเพิ่มความลําชี้แจงโดยกําหนดระยะเวลาของค่าเฉลี่ยเคลื่อนที่เป็นส่วนจํานวนเต็มของอัลฟ่าอัลฟ่าอัลฟา 2 สำหรับข้อมูลธุรกิจส่วนใหญ่พารามิเตอร์อัลฟ่าน้อยกว่า 0 40 มักเป็น มีประสิทธิภาพ แต่หนึ่งอาจดำเนินการค้นหาตารางพื้นที่พารามิเตอร์ด้วย 0 1 ถึง 0 9 ด้วยการเพิ่มขึ้นของ 0 1 แล้ว alpha ที่ดีที่สุดมีค่าเฉลี่ยน้อยที่สุดข้อผิดพลาด Absolute MA Error. How เพื่อเปรียบเทียบวิธีการเรียบหลายแม้ว่าจะมี เป็นตัวชี้วัดเชิงตัวเลขสำหรับการประเมินความถูกต้องของเทคนิคการคาดการณ์วิธีที่กว้างที่สุดคือการใช้การเปรียบเทียบภาพของการคาดการณ์ต่างๆเพื่อประเมินความถูกต้องและเลือกวิธีการคาดการณ์ต่างๆในแนวทางนี้ต้องใช้พล็อตเช่น Excel ในกราฟเดียวกัน ค่าเดิมของตัวแปรชุดเวลาและค่าที่คาดการณ์ไว้จากวิธีการคาดการณ์ที่แตกต่างกันจำนวนมากซึ่งจะช่วยให้สามารถเปรียบเทียบภาพได้คุณอาจต้องการใช้การคาดการณ์ที่ผ่านมาโดยเทคนิค Smoothing JavaScript เพื่อดูค่าพยากรณ์ที่ผ่านมาโดยใช้เทคนิคการปรับให้เรียบโดยใช้พารามิเตอร์เดียว Holt และ Winters ใช้พารามิเตอร์สองและสามตามลำดับดังนั้นจึงไม่ใช่เรื่องง่ายที่จะเลือกค่าที่ดีที่สุดหรือใกล้เคียงกับค่าทดลองโดยรวมและข้อผิดพลาดสำหรับพารามิเตอร์การปรับความเรียบแบบเอกซ์โพเน็นเชียลเดี่ยวเน้นมุมมองในระยะสั้น กำหนดระดับการสังเกตสุดท้ายและขึ้นอยู่กับเงื่อนไขที่ไม่มีแนวโน้มการถอยหลังแบบเส้นตรง ion ซึ่งเหมาะกับเส้นสี่เหลี่ยมเล็ก ๆ น้อย ๆ กับข้อมูลทางประวัติศาสตร์หรือเปลี่ยนข้อมูลทางประวัติศาสตร์เป็นระยะทางยาวซึ่งขึ้นอยู่กับแนวโน้มพื้นฐานการจับภาพเชิงเส้นแบบละเอียดของ Holt จะรวบรวมข้อมูลเกี่ยวกับแนวโน้มล่าสุดพารามิเตอร์ในรูปแบบของ Holt คือพารามิเตอร์ระดับ ควรจะลดลงเมื่อปริมาณของการเปลี่ยนแปลงข้อมูลมีขนาดใหญ่และแนวโน้มควรเพิ่มขึ้นหากแนวโน้มทิศทางล่าสุดได้รับการสนับสนุนจากปัจจัยที่เป็นสาเหตุบางประการการคาดการณ์ในระยะสั้นให้สังเกตว่า JavaScript ทุกหน้าจะมีขั้นตอนเดียวล่วงหน้า เมื่อต้องการได้รับการคาดการณ์สองขั้นตอนเพียงแค่เพิ่มค่าที่คาดไว้ในตอนท้ายของข้อมูลชุดข้อมูลเวลาของคุณแล้วคลิกปุ่มคำนวณเดียวกันคุณอาจทำซ้ำขั้นตอนนี้สองสามครั้งเพื่อให้ได้การคาดการณ์ในระยะสั้นที่จำเป็น วิธีการแบบซีรีส์เป็นเทคนิคทางสถิติที่ใช้ประโยชน์จากข้อมูลทางประวัติศาสตร์ที่สะสมอยู่ในช่วงเวลาหนึ่งวิธีคิดแบบเวลาสมมติว่าสิ่งที่เกิดขึ้นใน อดีตจะยังคงเกิดขึ้นต่อไปในอนาคตเนื่องจากชุดเวลาชื่อแสดงให้เห็นถึงวิธีการเหล่านี้เกี่ยวข้องกับการคาดการณ์ถึงปัจจัยเพียงอย่างเดียวเวลาพวกเขารวมถึงค่าเฉลี่ยเคลื่อนที่เฉลี่ยที่ชี้แจงและเส้นแนวโน้มเชิงเส้นและเป็นหนึ่งในวิธีที่นิยมมากที่สุดสำหรับสั้น การพยากรณ์อากาศระหว่าง บริษัท ผู้ให้บริการและ บริษัท ผู้ผลิตวิธีการเหล่านี้อนุมานได้ว่ารูปแบบหรือแนวโน้มทางประวัติศาสตร์ที่สามารถบ่งชี้ตัวบ่งชี้ความต้องการในช่วงเวลาหนึ่ง ๆ จะเกิดขึ้นซ้ำ ๆ ได้ค่าเฉลี่ย Average average การคาดการณ์ชุดข้อมูลอนุกรมเวลาอาจทำได้เพียงแค่ใช้ความต้องการในช่วงเวลาปัจจุบันเพื่อคาดการณ์ความต้องการในช่วงต่อไป นี่คือบางครั้งเรียกว่าการคาดเดาที่ไร้เดียงสาหรือใช้งานง่าย 4 ตัวอย่างเช่นถ้าความต้องการเป็น 100 หน่วยในสัปดาห์นี้การคาดการณ์สำหรับความต้องการในสัปดาห์หน้าคือ 100 หน่วยถ้าความต้องการเปลี่ยนเป็น 90 หน่วยแทนความต้องการในสัปดาห์ต่อมาคือ 90 หน่วย , และอื่น ๆ วิธีการคาดการณ์แบบนี้ไม่ได้คำนึงถึงพฤติกรรมความต้องการในอดีตมันอาศัยเพียงความต้องการในช่วงเวลาปัจจุบันมันตอบสนองโดยตรงกับปกติสุ่ม m ovements ในความต้องการวิธีการเฉลี่ยเคลื่อนที่แบบง่ายใช้ค่าความต้องการหลายค่าในช่วงไม่กี่ปีที่ผ่านมาเพื่อคาดการณ์การคาดการณ์นี้มีแนวโน้มลดลงหรือทำให้การเพิ่มขึ้นและการลดลงของการคาดการณ์โดยใช้เพียงช่วงเดียวค่าเฉลี่ยเคลื่อนที่ที่เรียบง่ายจะเป็นประโยชน์สำหรับ พยากรณ์ความต้องการที่มีเสถียรภาพและไม่แสดงพฤติกรรมความต้องการที่เด่นชัดใด ๆ เช่นแนวโน้มหรือรูปแบบตามฤดูกาลค่าเฉลี่ยขั้นต่ำจะคำนวณสำหรับช่วงเวลาที่ระบุเช่นสามเดือนหรือห้าเดือนขึ้นอยู่กับระยะเวลาที่นักพยากรณ์ต้องการที่จะเรียบข้อมูลความต้องการ ค่าเฉลี่ยของค่าเฉลี่ยเคลื่อนที่ง่ายขึ้นโดยใช้สูตรคำนวณค่าเฉลี่ยเคลื่อนที่แบบเรียบง่าย บริษัท กระดาษออฟฟิศออฟฟิศออฟฟิศซัพพลายขายและให้บริการอุปกรณ์สำนักงานแก่ บริษัท โรงเรียนและหน่วยงานต่างๆภายในระยะทาง 50 ไมล์ รัศมีของคลังสินค้าธุรกิจจัดหาวัสดุสำนักงานมีความสามารถในการแข่งขันและความสามารถในการส่งมอบคำสั่งซื้อได้รวดเร็วเป็นปัจจัยในการสร้างลูกค้าใหม่และรักษาสภาพเดิม คนสำนักงานมักจะไม่ได้เมื่อพวกเขาทำงานต่ำเสบียง แต่เมื่อพวกเขาหมดสิ้นผลเป็นผลให้พวกเขาต้องการคำสั่งของพวกเขาได้ทันทีผู้จัดการของ บริษัท ต้องการที่จะขับรถบางพอและยานพาหนะที่มีอยู่เพื่อส่งมอบคำสั่งซื้อทันทีและพวกเขามีเพียงพอ สินค้าคงคลังในสต็อกดังนั้นผู้จัดการต้องการที่จะสามารถคาดการณ์จำนวนคำสั่งที่จะเกิดขึ้นในช่วงเดือนถัดไปเช่นการคาดการณ์ความต้องการในการจัดส่งจากการบันทึกคำสั่งซื้อการจัดการได้สะสมข้อมูลต่อไปนี้สำหรับ 10 เดือนที่ผ่านมา, จากนั้นจะคำนวณค่าเฉลี่ยเคลื่อนที่ 3 และ 5 เดือนโดยสมมติว่าเป็นช่วงปลายเดือนตุลาคมการคาดการณ์ที่เกิดจากค่าเฉลี่ยเคลื่อนที่ 3 หรือ 5 เดือนโดยปกติแล้วจะเป็นเดือนถัดไปตามลำดับ ซึ่งในกรณีนี้คือเดือนพฤศจิกายนค่าเฉลี่ยเคลื่อนที่คำนวณจากความต้องการสั่งซื้อล่วงหน้า 3 เดือนตามลำดับดังนี้ค่าเฉลี่ยเคลื่อนที่ 5 เดือนคำนวณจากค่า pr ข้อมูลความต้องการใช้เวลา 5 เดือนดังต่อไปนี้การคาดการณ์ค่าเฉลี่ยเคลื่อนที่ 3 และ 5 เดือนสำหรับข้อมูลความต้องการเดือนทั้งหมดจะแสดงในตารางต่อไปนี้จริงแล้วการคาดการณ์สำหรับเดือนพฤศจิกายนตามความต้องการรายเดือนล่าสุดเท่านั้นที่จะใช้งานได้ ผู้จัดการอย่างไรก็ตามการคาดการณ์ในช่วงหลายเดือนก่อน ๆ ช่วยให้เราสามารถเปรียบเทียบการคาดการณ์กับความต้องการที่เกิดขึ้นจริงเพื่อดูว่าวิธีการพยากรณ์ถูกต้องอย่างไรนั่นคือดีแค่ไหนมีค่าเฉลี่ยทั้งสามและค่าเฉลี่ยในรอบ 5 เดือน ตารางด้านบนมีแนวโน้มที่จะทำให้ความแปรปรวนเกิดขึ้นได้ในข้อมูลที่เกิดขึ้นจริงผลการปรับให้เรียบนี้สามารถสังเกตได้จากรูปต่อไปนี้ซึ่งเป็นค่าเฉลี่ยของ 3 เดือนและ 5 เดือนบนกราฟของข้อมูลต้นฉบับ 5 เดือน ค่าเฉลี่ยของค่าเฉลี่ยในรอบ 3 เดือนสะท้อนให้เห็นถึงข้อมูลล่าสุดที่มีให้กับผู้จัดการฝ่ายจัดหาสำนักงานโดยทั่วไปคาดการณ์ว่า usin g ค่าเฉลี่ยเคลื่อนที่ในระยะยาวจะตอบสนองต่อการเปลี่ยนแปลงความต้องการได้ช้ากว่าค่าเฉลี่ยที่เกิดขึ้นเมื่อใช้ค่าเฉลี่ยเคลื่อนที่ที่สั้นลงช่วงเวลาพิเศษของข้อมูลทำให้ความเร็วที่คาดการณ์ตอบสนองได้ดีขึ้นการกำหนดจำนวนงวดที่เหมาะสมที่จะใช้ในการเคลื่อนย้าย ข้อเสียของวิธีเฉลี่ยเคลื่อนที่คือไม่ตอบสนองต่อการเปลี่ยนแปลงที่เกิดขึ้นด้วยเหตุผลเช่นรอบการทำงานและผลตามฤดูกาลปัจจัยที่ทำให้เกิดการเปลี่ยนแปลงโดยทั่วไปจะละเลย โดยทั่วไปวิธีการทางกลซึ่งสะท้อนถึงข้อมูลทางประวัติศาสตร์ในลักษณะที่สอดคล้องกันอย่างไรก็ตามวิธีเฉลี่ยเคลื่อนที่จะมีข้อดีคือใช้ง่ายรวดเร็วและไม่แพงนักโดยทั่วไปวิธีการนี้สามารถให้การคาดการณ์ได้ดีในระยะสั้น แต่ ไม่ควรผลักดันให้ไกลเกินไปในอนาคตค่าเฉลี่ยของค่าเฉลี่ยที่เปลี่ยนแปลงได้วิธีการเฉลี่ยโดยเฉลี่ยสามารถปรับเปลี่ยนให้สอดคล้องกับความผันผวนของข้อมูลได้มากขึ้น ในวิธีถัวเฉลี่ยเคลื่อนที่ถ่วงน้ำหนักน้ำหนักถูกกำหนดให้เป็นข้อมูลล่าสุดตามสูตรต่อไปนี้ข้อมูลความต้องการสำหรับ PM Computer Services ที่แสดงในตารางสำหรับตัวอย่างที่ 10 3 ดูเหมือนจะทำตามแนวโน้มเชิงเส้นที่เพิ่มขึ้น บริษัท ต้องการคำนวณเส้นตรง เส้นแนวโน้มเพื่อดูว่ามีความถูกต้องมากยิ่งขึ้นกว่าการคาดการณ์การปรับให้เรียบและชี้แจงที่ได้รับการพัฒนาขึ้นในตัวอย่าง 10 3 และ 10 4. ค่าที่จำเป็นสำหรับการคำนวณกำลังสองน้อยที่สุดมีดังนี้ใช้ค่าเหล่านี้พารามิเตอร์สำหรับเส้นแนวโน้มเชิงเส้น จะคำนวณดังนี้ดังนี้ดังนั้นสมการเส้นแนวโน้มเส้นเป็นเมื่อคำนวณการคาดการณ์สำหรับรอบระยะเวลา 13 ให้ x 13 ในเส้นแนวโน้มเชิงเส้นกราฟต่อไปนี้แสดงเส้นแนวโน้มเชิงเส้นเมื่อเทียบกับข้อมูลจริงเส้นแนวโน้มจะปรากฏขึ้นเพื่อสะท้อน ใกล้เคียงกับข้อมูลที่เกิดขึ้นจริงนั่นคือจะเป็นแบบอย่างที่ดีและเป็นแบบจำลองการคาดการณ์ที่ดีสำหรับปัญหานี้อย่างไรก็ตามข้อเสียของเส้นแนวโน้มแบบเส้นตรงคือจะไม่เกิดปัญหา st เพื่อการเปลี่ยนแปลงในแนวโน้มเป็นวิธีการคาดการณ์การทำให้ราบเรียบชี้แจงที่จะเป็นสมมติว่าการคาดการณ์ในอนาคตทั้งหมดจะเป็นไปตามเส้นตรงข้อ จำกัด นี้ใช้วิธีนี้เป็นกรอบเวลาที่สั้นลงซึ่งคุณสามารถค่อนข้างมั่นใจได้ว่า แนวโน้มจะไม่เปลี่ยนแปลงการปรับระดับเหตุผลรูปแบบตามฤดูกาลคือการเพิ่มขึ้นที่ซ้ำ ๆ และความต้องการลดลงรายการอุปสงค์จำนวนมากแสดงพฤติกรรมตามฤดูกาลขายเสื้อผ้าตามรูปแบบฤดูกาลประจำปีโดยมีความต้องการเสื้อผ้าอุ่นที่เพิ่มขึ้นในฤดูใบไม้ร่วงและฤดูหนาวและลดลงในฤดูใบไม้ผลิและฤดูใบไม้ผลิ ฤดูร้อนเนื่องจากอุปสงค์เสื้อผ้าเย็นขึ้นความต้องการสินค้าปลีกหลายประเภทรวมทั้งของเล่นอุปกรณ์กีฬาเสื้อผ้าเครื่องใช้อิเล็กทรอนิกส์แฮมตุรกีไวน์และผลไม้เพิ่มขึ้นในช่วงเทศกาลวันหยุดความต้องการบัตรอวยพรเพิ่มขึ้นพร้อมกับวันพิเศษเช่น วันวาเลนไทน์และวันแม่รูปแบบตามฤดูกาลอาจเกิดขึ้นได้ทุกเดือนทุกวันหรือทุกวันร้านอาหารบางแห่งมีความต้องการสูงกว่าใน vening กว่าในช่วงกลางวันหรือในวันหยุดสุดสัปดาห์เป็นนอกคู่วันธรรมดาการจราจร - จึงขาย - ที่ห้างสรรพสินค้าหยิบขึ้นในวันศุกร์และวันเสาร์มีหลายวิธีเพื่อสะท้อนรูปแบบตามฤดูกาลในการคาดการณ์ชุดเวลาเราจะอธิบายหนึ่งในวิธีการที่ง่ายขึ้นโดยใช้ ปัจจัยฤดูกาลปัจจัยด้านฤดูกาลคือค่าตัวเลขที่คูณกับการคาดการณ์ตามปกติเพื่อให้ได้รับการปรับฤดูกาลตามฤดูกาลวิธีหนึ่งในการพัฒนาความต้องการปัจจัยตามฤดูกาลคือการแบ่งความต้องการสำหรับแต่ละฤดูกาลตามความต้องการโดยรวมเป็นรายปี สูตรต่อไปนี้ปัจจัยทางฤดูกาลที่เกิดขึ้นระหว่าง 0 ถึง 1 0 เป็นผลส่วนหนึ่งของความต้องการรายปีทั้งหมดที่กำหนดให้กับแต่ละฤดูกาลปัจจัยฤดูกาลเหล่านี้จะคูณกับความต้องการที่คาดการณ์ไว้เป็นรายปีเพื่อให้ได้ผลตอบแทนที่ปรับตามฤดูกาลในแต่ละฤดูกาลที่มีการคาดการณ์กับการปรับฤดูกาล Wishbone Farms เติบโตไก่งวงเพื่อขายให้กับ บริษัท แปรรูปเนื้อสัตว์ตลอดทั้งปีอย่างไรก็ตามยอดขายของฤดูกาลจะเห็นได้ชัดในช่วงไตรมาสที่สี่ของปี ปีตั้งแต่เดือนตุลาคมถึงเดือนธันวาคม Wishbone Farms ประสบปัญหาความต้องการไก่งวงในช่วงสามปีที่ผ่านมาแสดงในตารางต่อไปนี้เนื่องจากเรามีข้อมูลความต้องการเป็นเวลา 3 ปีเราจึงสามารถคำนวณหาปัจจัยตามฤดูกาลได้โดยแบ่งความต้องการรายไตรมาสทั้งหมดเป็นเวลาสามปี โดยความต้องการรวมตลอดทั้งสามปีถัดไปเราต้องการเพิ่มความต้องการที่คาดการณ์สำหรับปีหน้าในปี 2000 โดยปัจจัยแต่ละฤดูกาลเพื่อให้ได้ความต้องการที่คาดการณ์ไว้สำหรับแต่ละไตรมาสเพื่อให้บรรลุเป้าหมายนี้เราจำเป็นต้องมีการคาดการณ์ความต้องการสำหรับปี 2000 ใน กรณีนี้เนื่องจากข้อมูลความต้องการในตารางดูเหมือนจะแสดงแนวโน้มที่เพิ่มขึ้นโดยทั่วไปเราคำนวณเส้นแนวโน้มเชิงเส้นสำหรับสามปีของข้อมูลในตารางที่จะได้รับประมาณการคาดการณ์คร่าวๆดังนั้นการคาดการณ์สำหรับปี 2000 เป็น 58 17, หรือ 58,170 ไก่งวงโดยใช้การพยากรณ์ความต้องการประจำปีของอุปสงค์นี้การคาดการณ์ตามฤดูกาลของ SF i สำหรับปีพ. ศ. 2543 มีการคาดการณ์รายไตรมาสดังกล่าวโดยมีค่าความต้องการที่แท้จริงอยู่ในตารางพวกเขาดูเหมือนจะเป็นประมาณการที่ค่อนข้างดี คู่สมรสสะท้อนถึงความผันผวนของข้อมูลและแนวโน้มโดยรวมที่เพิ่มขึ้นตามฤดูกาล 10-12 วิธีการคำนวณค่าเฉลี่ยเคลื่อนที่แบบเดียวกับการเพิ่มความเป็นเอกลัษณ์ชี้แจง 10-13 ผลกระทบใดที่ทำให้รูปแบบการให้ราบเรียบแบบทวีคูณเพิ่มขึ้น การปรับการชดเชยความละเอียดทำได้แตกต่างจากการจัดแจงแบบเสวนาชี้แจง 10-15 อะไรกำหนดทางเลือกของค่าคงที่ที่ราบเรียบสำหรับแนวโน้มในรูปแบบการปรับรูปแบบเลขแจงที่ปรับได้ 10-16 ในตัวอย่างบทสำหรับวิธีการแบบอนุกรมเวลาการคาดการณ์เริ่มต้นถือว่าเป็นไปอย่างสม่ำเสมอ เช่นเดียวกับความต้องการที่เกิดขึ้นจริงในช่วงแรกแนะนำวิธีอื่น ๆ ที่คาดการณ์เริ่มต้นอาจได้มาจากการใช้งานจริง 10-17 รูปแบบการคาดการณ์ของเส้นแนวโน้มเชิงเส้นแตกต่างจากรูปแบบการถดถอยเชิงเส้นสำหรับการคาดการณ์ 10-18 ในช่วงเวลา โมเดลที่นำเสนอในบทนี้รวมทั้งค่าเฉลี่ยเคลื่อนที่และค่าเฉลี่ยเคลื่อนที่ถ่วงน้ำหนักการปรับให้เรียบที่เป็นเอกลัษณ์และการปรับความเรียบที่เพิ่มขึ้นเรื่อย ๆ และเส้นแนวโน้มแบบเส้นตรงซึ่งคุณทำร่วมกัน nsider ที่ดีที่สุด Why.10-19 ข้อดีอะไรที่ทำให้การปรับค่าเสียดทานชี้แจงมีมากกว่าเส้นแนวโน้มเชิงเส้นสำหรับความต้องการที่คาดการณ์ไว้ซึ่งแสดงถึงแนวโน้ม 4 KB Kahn และ JT Mentzer การคาดการณ์ในตลาดผู้บริโภคและอุตสาหกรรมวารสารของ Business Forecasting 14 no. 2 ฤดูร้อน 1995 21-28 การวิเคราะห์การถดถอยเชิงเส้นเป็นส่วนใหญ่ที่ใช้กันอย่างแพร่หลายของเทคนิคทางสถิติทั้งหมดคือการศึกษาความสัมพันธ์ระหว่างสารเติมแต่งตัวแปรระหว่างตัวแปร Let Y หมายถึงตัวแปรตามที่มีค่าที่คุณต้องการทำนายและปล่อยให้ X 1, X k แสดงว่า ตัวแปรอิสระที่คุณต้องการทำนายโดยมีค่าของตัวแปร Xi ในช่วง t หรือในแถว t ของชุดข้อมูลที่แสดงโดย X นั้นสมการคำนวณค่าที่คาดการณ์ไว้ของ Y t คือสูตรนี้มี คุณสมบัติที่ทำนายสำหรับ Y เป็นฟังก์ชันเส้นตรงของแต่ละตัวแปร X ถืออื่น ๆ คงที่และการมีส่วนร่วมของตัวแปร X ที่แตกต่างกันไปการคาดการณ์เป็น additive ลาดของแต่ละเส้นตรง - ความสัมพันธ์ระหว่างเส้นตรงกับ Y คือค่าคงที่ b 1 b 2, bk ค่าสัมประสิทธิ์ที่เรียกว่าตัวแปรนั่นคือ bi คือการเปลี่ยนแปลงในค่าที่คาดการณ์ของ Y ต่อหน่วยของการเปลี่ยนแปลงใน X i สิ่งอื่นที่เท่ากันค่าคงที่เพิ่มเติม b 0 สิ่งที่เรียกว่า intercept คือการทำนายว่าโมเดลจะทำถ้า xs ทั้งหมดเป็นศูนย์ถ้าเป็นไปได้ค่าสัมประสิทธิ์และ intercept จะประมาณด้วยจำนวนน้อยที่สุดคือการตั้งค่าให้เท่ากับค่าเฉพาะที่ลดผลรวมของความผิดพลาดภายใน ตัวอย่างของข้อมูลที่มีการติดตั้งแบบจำลองและข้อผิดพลาดในการคาดการณ์ของแบบจำลองมักจะสันนิษฐานว่าเป็นแบบกระจายอย่างเป็นอิสระและเหมือนกันสิ่งแรกที่คุณควรทราบเกี่ยวกับการถดถอยเชิงเส้นคือการถดถอยคำแปลก ๆ มาประยุกต์ใช้กับโมเดลเช่น นี่เป็นครั้งแรกที่พวกเขาได้ศึกษาในเชิงลึกโดยนักวิทยาศาสตร์ในยุคศตวรรษที่ 19 เซอร์ฟรานซิส Galton Galton เป็นนักธรรมชาตินิยมนักมานุษยวิทยานักดาราศาสตร์และนักสถิติและชีวิตจริงของตัวละคร Indiana Jones เขาเป็นคนที่มีชื่อเสียงสำหรับการสำรวจของเขาและเขาเขียนหนังสือที่ขายดีที่สุดให้กับการอยู่รอดในถิ่นทุรกันดารศิลปะการท่องเที่ยวและสิ่งอำนวยความสะดวกต่างๆที่มีอยู่ในสถานที่แห่งป่าและผลสืบเนื่องของศิลปะการท่องเที่ยวหยาบจากปฏิบัติการไปสู่ความแปลกใหม่ พวกเขายังอยู่ในการพิมพ์และยังคงถือเป็นแหล่งข้อมูลที่มีประโยชน์พวกเขาให้คำแนะนำที่มีประโยชน์มากมายสำหรับการมีชีวิตอยู่เช่นวิธีการรักษาแผลหอกหรือดึงม้าออกจากทรายดูดและนำแนวคิดของถุงนอนไปสู่โลกตะวันตกคลิกที่ ภาพเหล่านี้สำหรับรายละเอียดเพิ่มเติม Galton เป็นผู้ริเริ่มในการใช้วิธีการทางสถิติในการวัดในหลายสาขาของวิทยาศาสตร์และในการศึกษาข้อมูลเกี่ยวกับขนาดญาติของผู้ปกครองและลูกหลานของพวกเขาในพืชชนิดต่างๆและสัตว์เขาสังเกตเห็นปรากฏการณ์ต่อไปนี้ ผู้ปกครองที่มีขนาดใหญ่กว่าค่าเฉลี่ยมีแนวโน้มที่จะผลิตลูกที่มีขนาดใหญ่กว่าค่าเฉลี่ย แต่เด็กอาจจะมีขนาดน้อยกว่าพ่อแม่ในแง่ของตำแหน่งสัมพัทธ์ภายในกลุ่มของตัวเอง n ตัวอย่างเช่นถ้าขนาดของผู้ปกครองมีค่า x เบี่ยงเบนมาตรฐานจากค่าเฉลี่ยในรุ่นของตัวเองคุณควรคาดเดาว่าขนาดของเด็กจะเป็น rx r เท่า x ค่าเบี่ยงเบนมาตรฐานจากค่าเฉลี่ยภายในชุดของเด็กเหล่านั้น พ่อแม่ที่ r เป็นจำนวนน้อยกว่า 1 ในขนาด r คือสิ่งที่จะถูกกำหนดไว้ด้านล่างเป็นความสัมพันธ์ระหว่างขนาดของผู้ปกครองกับขนาดของเด็กเช่นเดียวกับการวัดจริงใด ๆ ทางกายภาพและในกรณีของมนุษย์, นี่คือภาพที่ตีพิมพ์เผยแพร่เป็นครั้งแรกของบรรทัดการถดถอยที่แสดงให้เห็นถึงผลกระทบนี้จากการบรรยายที่นำเสนอโดย Galton ในปี พ. ศ. 2420 สัญลักษณ์ R ในแผนภูมินี้มีค่าเท่ากับ 0 33 หมายถึงค่าสัมประสิทธิ์ความลาดชันไม่ใช่ความสัมพันธ์แม้ว่าทั้งสองจะเหมือนกันถ้าทั้งสองประชากรมีส่วนเบี่ยงเบนมาตรฐานเดียวกันดังที่แสดงไว้ด้านล่างนี้ Galton เรียกปรากฏการณ์นี้ว่ามีการถดถอยต่อความสามัญซึ่งใน mod คำศัพท์เหล่านี้หมายถึงการถดถอยไปสู่ความหมายที่ผู้สังเกตการณ์บนพื้นหลังอาจแนะนำว่าคนในรุ่นต่อไปจะแสดงความแปรปรวนน้อยกว่าคนธรรมดาสามัญมากกว่าคนก่อนหน้า แต่ไม่ใช่กรณีมันเป็นปรากฏการณ์ทางสถิติอย่างหมดจดยกเว้นเด็กทุกคน เป็นขนาดเดียวกับผู้ปกครองในแง่ญาติเช่นถ้าความสัมพันธ์ไม่เท่ากับ 1 การคาดการณ์จะต้องถอยหลังถึงค่าเฉลี่ยโดยไม่คำนึงถึงชีววิทยาถ้าข้อผิดพลาด squared เฉลี่ยจะลดลงกลับไปด้านบนของหน้าการปฏิเสธความหมาย เป็นความจริงที่หลีกเลี่ยงไม่ได้ของชีวิตบุตรหลานของคุณอาจคาดหวังว่าจะได้รับการยกเว้นน้อยลงเพื่อให้ดีขึ้นหรือแย่กว่าคุณคะแนนของคุณในการสอบครั้งสุดท้ายในหลักสูตรสามารถคาดหวังว่าจะไม่ดีหรือไม่ดีเท่าคะแนนของคุณในการสอบมิดเทอมเทียบกับ ส่วนที่เหลือของชั้นเบสบอลเฉลี่ยของนักแม่นปืนในช่วงครึ่งหลังของฤดูกาลสามารถคาดว่าจะใกล้เคียงกับค่าเฉลี่ยสำหรับผู้เล่นทั้งหมดกว่าค่าเฉลี่ยแม่นของเขาในช่วงครึ่งแรกของฤดูกาลและอื่น ๆ คำสำคัญที่นี่ คาดว่าจะไม่ได้หมายความว่าจะมีการถดถอยถดถอยที่จะเกิดขึ้น แต่นั่นคือวิธีที่จะเดิมพันเราได้เห็นข้อเสนอแนะของการถดถอยไปที่ค่าเฉลี่ยในบางส่วนของแบบจำลองการคาดการณ์แบบอนุกรมที่เราได้ศึกษา การคาดการณ์มีแนวโน้มที่จะนุ่มนวลกว่าซึ่งแสดงถึงความแปรปรวนน้อยกว่าข้อมูลเดิมข้อมูลนี้ไม่ได้เป็นความจริงในแบบจำลองการเดินแบบสุ่ม แต่โดยทั่วไปแล้วจะเป็นแบบจำลองที่มีค่าเฉลี่ยเคลื่อนที่และแบบจำลองอื่น ๆ ที่อิงกับการคาดการณ์ของพวกเขา คำอธิบายที่ใช้งานง่ายสำหรับผลการถดถอยเป็นเรื่องง่ายสิ่งที่เรากำลังพยายามที่จะทำนายมักจะประกอบด้วยสัญญาณส่วนประกอบที่คาดการณ์ได้และเสียงส่วนประกอบที่ไม่สามารถคาดการณ์ได้ทางสถิติอย่างที่ดีที่สุดที่เราสามารถคาดหวังได้คือการทำนายเฉพาะส่วนของ ความแปรปรวนซึ่งเป็นเพราะสัญญาณดังนั้นการคาดการณ์ของเราจะมีแนวโน้มที่จะแสดงความแปรปรวนน้อยกว่าค่าจริงซึ่งหมายถึงการถดถอยไป mean. Another วิธีคิดผลการถดถอยเป็นระยะ ความสามารถในการเลือกของผู้เล่นในช่วงเวลาใดเวลาหนึ่งสามารถนำมาประกอบกับการรวมกันของทักษะและโชคสมมติว่าเราเลือกตัวอย่างของนักกีฬามืออาชีพที่มีประสิทธิภาพการทำงานได้ดีกว่าค่าเฉลี่ยหรือนักเรียนที่มีคะแนนดีกว่า ค่าเฉลี่ยในช่วงครึ่งแรกของปีความจริงที่ว่าพวกเขาทำได้ดีในช่วงครึ่งแรกของปีทำให้โอกาสทั้งทักษะและโชคดีกว่าค่าเฉลี่ยในช่วงเวลานั้นในช่วงครึ่งปีหลังเราอาจคาดหวังได้ แต่เราไม่ควรคาดหวังว่าพวกเขาจะมีความสุขเท่าเทียมกันดังนั้นเราควรคาดการณ์ว่าในช่วงครึ่งหลังการแสดงของพวกเขาจะใกล้เคียงกับค่าเฉลี่ยขณะที่ผู้เล่นที่มีผลการปฏิบัติงานเพียงแค่เฉลี่ยในช่วงครึ่งปีแรกอาจมีทักษะและโชคดีในการทำงาน ในทิศทางตรงกันข้ามกับพวกเขาดังนั้นเราจึงควรคาดหวังประสิทธิภาพการทำงานของพวกเขาในช่วงครึ่งหลังเพื่อให้ห่างจากค่าเฉลี่ยในทิศทางเดียวหรืออีกนัยหนึ่งในขณะที่เราได้รับการทดสอบที่เป็นอิสระอีก ทักษะของพวกเขาเราไม่ทราบทิศทางที่พวกเขาจะย้ายแม้ว่าดังนั้นแม้สำหรับพวกเขาเราควรคาดการณ์ว่าผลการดำเนินงานในครึ่งหลังของพวกเขาจะใกล้เคียงกับผลการดำเนินงานครึ่งแรกของพวกเขาอย่างไรก็ตามประสิทธิภาพที่แท้จริงของผู้เล่นควรคาดว่าจะมี ความแตกต่างอย่างเท่าเทียมกันในช่วงครึ่งหลังของปีเช่นเดียวกับในช่วงครึ่งปีแรกเพราะเป็นผลมาจากการแจกจ่ายโชคสุ่มแบบสุ่มระหว่างผู้เล่นที่มีการแจกจ่ายทักษะเหมือนกันเช่นก่อนการอภิปรายที่ดีของการถดถอยไปสู่ความหมายในวงกว้าง บริบทของการวิจัยทางสังคมศาสตร์สามารถพบได้ที่นี่กลับไปด้านบนของหน้าการยืนยันสมมติฐานการถดถอย. ทำไมเราควรสมมติว่าความสัมพันธ์ระหว่างตัวแปรเป็นเส้นตรงเนื่องจากความสัมพันธ์เชิงเส้นเป็นความสัมพันธ์ที่ไม่ง่ายเพียงเล็กน้อยที่สามารถจินตนาการได้ง่ายที่สุดในการทำงาน กับและเนื่องจากความสัมพันธ์ที่แท้จริงระหว่างตัวแปรของเรามักจะมีเส้นตรงเป็นระยะ ๆ อย่างน้อยที่สุดในช่วงของค่าที่น่าสนใจ กับเราและแม้ว่าจะไม่ได้ก็ตามเราก็สามารถเปลี่ยนตัวแปรได้เช่นเดียวกับการทำให้ความสัมพันธ์เป็นแบบ linearize นี่เป็นสมมติฐานที่ดีและขั้นตอนแรกในการสร้างแบบจำลองการถดถอยควรพิจารณาถึงการกระจายตัวของตัวแปรและ ในกรณีของข้อมูลอนุกรมเวลาแปลงของตัวแปรกับเวลาเพื่อให้แน่ใจว่ามันเป็นเหตุผลที่เหมาะสมและหลังจากติดตั้งรูปแบบจุดของข้อผิดพลาดควรจะศึกษาเพื่อดูว่ามีรูปแบบไม่เชิงเส้นที่ไม่ได้อธิบายนี่คือสิ่งสำคัญโดยเฉพาะอย่างยิ่งเมื่อ เป้าหมายคือการทำให้การคาดการณ์สำหรับสถานการณ์นอกช่วงของข้อมูลทางประวัติศาสตร์ที่ออกจากเส้นตรงที่สมบูรณ์แบบมีแนวโน้มที่จะมีผลมากที่สุดหากคุณเห็นหลักฐานของความสัมพันธ์ไม่เชิงเส้นเป็นไปได้แม้ว่าจะไม่รับประกันว่าการแปลงตัวแปรจะตรงพวกเขาออกมา วิธีที่จะให้ประโยชน์ในการอนุมานและการคาดการณ์ผ่านการถดถอยเชิงเส้นกลับไปด้านบนของหน้าและเหตุผลที่เราควรจะสมมติว่าผลกระทบของตัวแปรอิสระต่าง ๆ ใน expec ted ค่าของตัวแปรขึ้นอยู่กับ additive นี่เป็นสมมติฐานที่แข็งแกร่งมากแข็งแรงกว่าคนส่วนใหญ่ตระหนักถึงนัยที่ผลกระทบเล็กน้อยของตัวแปรอิสระเช่นค่าสัมประสิทธิ์ความชันของมันไม่ได้ขึ้นอยู่กับค่าปัจจุบันของตัวแปรอิสระอื่น ๆ แต่ทำไม shouldn t มัน ตัวแปรที่เป็นอิสระสามารถเพิ่มผลกระทบของตัวแปรอื่นหรือผลของมันอาจแตกต่างกันไปอย่างเป็นระบบในช่วงเวลาในแบบจำลองการถดถอยพหุคูณสัมประสิทธิ์ประมาณของตัวแปรอิสระที่กำหนดควรจะวัดผลในขณะที่ควบคุมการปรากฏตัวของคนอื่นอย่างไรก็ตาม วิธีการที่การควบคุมจะดำเนินการเป็นเรื่องง่ายมาก multiples ของตัวแปรอื่น ๆ จะถูกเพิ่มหรือหักออกผู้ใช้จำนวนมากเพียงแค่โยนตัวแปรอิสระจำนวนมากในรูปแบบโดยไม่ต้องคิดอย่างรอบคอบเกี่ยวกับปัญหานี้ราวกับว่าซอฟต์แวร์ของพวกเขาโดยอัตโนมัติจะคิดออกว่า พวกเขาจะเกี่ยวข้องกับมันได้รับรางวัล t แม้วิธีการเลือกรูปแบบอัตโนมัติเช่น regres ขั้นตอน ssion ต้องการให้คุณมีความเข้าใจที่ดีเกี่ยวกับข้อมูลของคุณเองและเพื่อใช้เป็นแนวทางในการวิเคราะห์พวกเขาทำงานเฉพาะกับตัวแปรที่ได้รับในรูปแบบที่พวกเขาได้รับแล้วพวกเขาก็มองเฉพาะในรูปแบบ additive บวก พวกเขาในบริบทของแต่ละอื่น ๆ แบบจำลองการถดถอยไม่เพียงสมมติว่า Y เป็นฟังก์ชันบางส่วนของ X มันสมมติว่าเป็นชนิดพิเศษมากของการทำงานของ X s ปฏิบัติทั่วไปคือการรวมตัวแปรอิสระที่มีผลต่อการคาดการณ์เหตุผล ไม่สามารถเสริมพูดบางอย่างที่เป็นผลรวมและอื่น ๆ ที่มีอัตราหรือร้อยละบางครั้งอาจเป็นเหตุผลโดยอาร์กิวเมนต์ประมาณแรกคำสั่งท้องถิ่นและบางครั้งก็สามารถ t. You จำเป็นต้องเก็บรวบรวมข้อมูลที่เกี่ยวข้องเข้าใจสิ่งที่มาตรการ, ทำความสะอาดขึ้นถ้าจำเป็นดำเนินการวิเคราะห์เชิงพรรณนาเพื่อค้นหารูปแบบก่อนที่จะติดตั้งแบบจำลองใด ๆ และศึกษาการทดสอบการวินิจฉัยของสมมติฐานของแบบจำลองหลังจากนั้นโดยเฉพาะอย่างยิ่งสถิติและแปลงข้อผิดพลาดคุณควร พยายามที่จะใช้เหตุผลที่เหมาะสมทางเศรษฐกิจหรือทางกายภาพเพื่อกำหนดว่าสมการทำนาย additive ทำให้เหมาะสมที่นี่เกินไปก็เป็นไปได้ แต่ไม่รับประกันว่าการแปลงตัวแปรหรือการรวมของเงื่อนไขการปฏิสัมพันธ์อาจแยกผลกระทบของพวกเขาในรูปแบบ additive ถ้าพวกเขาไม่ได้ มีรูปแบบดังกล่าวเริ่มต้น แต่ต้องใช้ความคิดและความพยายามบางอย่างในส่วนของคุณกลับไปด้านบนของหน้าและเหตุผลที่เราควรถือว่าข้อผิดพลาดของโมเดลเชิงเส้นเป็นไปอย่างอิสระและเหมือนกันตามปกติ 1 ข้อสมมติฐานนี้มักถูกต้องตามคำร้องขอ ทฤษฎีบทข้อ จำกัด กลางของสถิติซึ่งระบุว่าผลรวมหรือค่าเฉลี่ยของตัวแปรสุ่มอิสระจำนวนมากที่มีการแจกแจงแบบปกติจะมีข้อมูลทางธุรกิจและเศรษฐศาสตร์และวิศวกรรมศาสตร์และวิทยาศาสตร์ธรรมชาติมากพอสมควร การเพิ่มหรือการวัดเชิงตัวเลขโดยเฉลี่ยสำหรับบุคคลหรือผลิตภัณฑ์หรือสถานที่ต่าง ๆ หรือช่วงเวลา rvals ตราบเท่าที่กิจกรรมที่สร้างการวัดอาจเกิดขึ้นค่อนข้างสุ่มและค่อนข้างเป็นอิสระเราอาจคาดหวังว่าการเปลี่ยนแปลงในผลรวมหรือค่าเฉลี่ยที่จะกระจายค่อนข้างปกติ 2 มันเป็นอีกทางคณิตศาสตร์สะดวกมันหมายถึงค่าสัมประสิทธิ์สัมบูรณ์ที่ดีที่สุดสำหรับรูปแบบเชิงเส้น เป็นผู้ที่ลดข้อผิดพลาด squared เฉลี่ยที่มีการคำนวณได้อย่างง่ายดายและมัน justifies ใช้โฮสต์ของการทดสอบทางสถิติตามครอบครัวปกติของการแจกจ่ายครอบครัวนี้รวมถึงการกระจาย t, การกระจาย F และการกระจาย Chi - square.3 แม้ว่ากระบวนการข้อผิดพลาดที่แท้จริงไม่ใช่เรื่องปกติในแง่ของหน่วยข้อมูลเดิม แต่อาจเป็นไปได้ที่จะแปลงข้อมูลเพื่อให้ข้อผิดพลาดในการคาดคะเนของโมเดลของคุณใกล้เคียงปกติอย่างไรก็ตามควรใช้ความระมัดระวังเป็นพิเศษแม้ว่าจะมีการใช้รูปแบบที่ไม่ได้อธิบาย ในตัวแปรตามมีการแจกแจงตามปกติโดยปกติจะไม่รับประกันว่าจะมีการแจกแจงแบบปกติเหมือนกัน ted สำหรับค่าทั้งหมดของตัวแปรอิสระบางทีรูปแบบที่ไม่สามารถอธิบายได้มีขนาดใหญ่ภายใต้เงื่อนไขบางกว่าเงื่อนไขอื่น ๆ เงื่อนไขที่เรียกว่า heteroscedasticity ตัวอย่างเช่นถ้าตัวแปรตามประกอบด้วยยอดขายรายวันหรือรายเดือนอาจมีรูปแบบวันสำคัญของสัปดาห์อย่างมีนัยสำคัญ หรือรูปแบบตามฤดูกาลในกรณีเช่นความแปรปรวนของผลรวมจะมีขนาดใหญ่ขึ้นในวันหรือในฤดูกาลที่มีกิจกรรมทางธุรกิจที่มากขึ้น - เป็นผลมาจากทฤษฎีบทข้อ จำกัด กลางอื่น ๆ การแปลงตัวแปรเช่นการบันทึกและหรือการปรับฤดูกาลมักใช้เพื่อจัดการกับปัญหานี้ นอกจากนี้ยังไม่รับประกันว่ารูปแบบที่สุ่มจะเป็นอิสระทางสถิติคำถามนี้เป็นคำถามที่สำคัญอย่างยิ่งเมื่อข้อมูลประกอบด้วยชุดข้อมูลเวลาถ้าแบบระบุไม่ถูกต้องอาจเป็นไปได้ว่าข้อผิดพลาดหรือข้อผิดพลาดที่ต่อเนื่องกันโดยบางช่วงเวลาอื่นจะมี มีแนวโน้มอย่างเป็นระบบที่มีเครื่องหมายเดียวกันหรือมีแนวโน้มอย่างเป็นระบบในการมีสัญญาณตรงกันข้ามกับปรากฏการณ์ ไม่เป็นที่รู้จักกันในนาม autocorrelation หรือ correlation. Regard ที่สำคัญมากคือข้อมูลราคาหุ้นที่มีการเปลี่ยนแปลงเปอร์เซ็นต์มากกว่าการเปลี่ยนแปลงแบบสัมบูรณ์มักจะมีการแจกจ่ายแบบปกติซึ่งหมายความว่าช่วงเวลาในระดับปานกลางถึงขนาดใหญ่การเคลื่อนไหวในราคาหุ้นมีการกระจายอย่างไม่เป็นทางการ กว่าการกระจายแบบปกติการแปลง log มักใช้กับข้อมูลราคาหุ้นย้อนหลังเมื่อศึกษาการเติบโตและความผันผวนข้อควรระวังแม้ว่าแบบจำลองการถดถอยแบบง่ายมักจะพอดีกับผลตอบแทนของหุ้นย้อนหลังเพื่อประมาณค่าเบต้าซึ่งเป็นตัวชี้วัดความเสี่ยงที่สัมพันธ์กันในบริบทของพอร์ตการลงทุนที่หลากหลาย ไม่แนะนำให้คุณใช้การถดถอยเพื่อพยายามที่จะคาดการณ์ผลตอบแทนของหุ้นในอนาคตดูรูปแบบทางเดินแบบสุ่มทางเรขาคณิตแทนคุณอาจจะยังคงคิดว่าการเปลี่ยนแปลงในคุณค่าของพอร์ตการลงทุนของหุ้นจะมีแนวโน้มที่จะกระจายตามปกติโดยอาศัยอำนาจตามทฤษฎีบทขีด จำกัด กลาง, แต่ทฤษฎีบทขีด จำกัด กลางเป็นจริงค่อนข้างช้าที่จะกัดใน lognormal distr ibution เนื่องจากเป็นแบบ asymmetrically long-tailed ผลรวมของ 10 หรือ 20 ตัวแปรที่มีการแจกแจงแบบ lognormally อย่างอิสระและเหมือนกันมีการแจกจ่ายที่ยังค่อนข้างใกล้เคียงกับ lognormal หากคุณไม่เชื่อเรื่องนี้ให้ลองทดสอบด้วยการจำลอง Monte Carlo คุณจะต้องประหลาดใจ เนื่องจากข้อสมมติฐานของการถดถอยเชิงเส้นแบบเชิงเส้นความสัมพันธ์แบบเสริมกับข้อผิดพลาดในการแจกแจงแบบปกติของ iid จึงมีความสำคัญมากดังนั้นจึงเป็นเรื่องสำคัญมากที่จะต้องทดสอบความถูกต้องของแบบจำลองดังกล่าวซึ่งเป็นหัวข้อที่กล่าวถึงในรายละเอียดเพิ่มเติมเกี่ยวกับหน้าทดสอบสมมติฐานสมมติฐานและแจ้งเตือน ความเป็นไปได้ที่คุณอาจต้องการข้อมูลที่มากขึ้นเพื่อให้บรรลุวัตถุประสงค์ของคุณคุณจะได้รับอะไรบางอย่างจากสิ่งที่ไม่เป็นผลบ่อยครั้งที่ผู้ใช้การวิเคราะห์การถดถอยพิจารณาเห็นว่าเป็นกล่องดำที่สามารถทำนายตัวแปรใดก็ได้จากตัวแปรอื่น ๆ เป็นอาหารเข้ามันเมื่อในความเป็นจริงแบบจำลองการถดถอยเป็นชนิดที่พิเศษมากและโปร่งใสมากของการทำนายกล่องผลลัพธ์ของมันไม่มีข้อมูลมากกว่าคือ โดยปัจจัยการผลิตและกลไกภายในของมันจะต้องถูกนำมาเปรียบเทียบกับความเป็นจริงในแต่ละสถานการณ์ที่มีการประยุกต์ใช้กลับไปด้านบนของหน้าความสัมพันธ์และสูตรการถดถอยแบบง่ายตัวแปรคือตามปริมาณที่อาจแตกต่างจากการวัดหนึ่งไป อีกกรณีที่ตัวอย่างต่าง ๆ ถูกนำมาจากประชากรหรือการสังเกตที่จุดต่าง ๆ ในเวลาในแบบจำลองทางสถิติที่เหมาะสมซึ่งใช้ตัวแปรบางอย่างในการทำนายคนอื่น ๆ สิ่งที่เราหวังจะหาคือตัวแปรต่าง ๆ ไม่แตกต่างกันไปอย่างอิสระใน ความรู้สึกทางสถิติ แต่ที่พวกเขามีแนวโน้มที่จะแตกต่างกันโดยเฉพาะอย่างยิ่งเมื่อกระชับโมเดลเชิงเส้นเราหวังว่าจะพบว่าตัวแปรหนึ่งกล่าวว่า Y จะแตกต่างกันเป็นฟังก์ชันเส้นตรงของตัวแปรอื่นพูด X ในคำอื่น ๆ ถ้าทั้งหมดอื่น ๆ ตัวแปรที่มีความสัมพันธ์กันอาจจะถือได้คงที่เราจะหวังว่าจะหากราฟของ Y กับ X เป็นเส้นตรงนอกเหนือจากข้อผิดพลาดแบบสุ่มที่หลีกเลี่ยงไม่ได้หรือ noise. A ของจำนวนเงินที่แน่นอนของ varia bility ในตัวแปรคือความแปรปรวนตามธรรมชาติซึ่งหมายถึงค่าเบี่ยงเบนความเบี่ยงเบนเฉลี่ยจากค่าเฉลี่ยของตัวมันเองเราสามารถวัดความแปรปรวนได้ในแง่ของส่วนเบี่ยงเบนมาตรฐานซึ่งกำหนดไว้เป็นรากที่สองของค่าความแปรปรวนส่วนเบี่ยงเบนมาตรฐานมีข้อได้เปรียบ วัดในหน่วยเดียวกับตัวแปรเดิมแทนที่จะเป็นหน่วยที่มีหน่วยเป็นสี่ส่วนงานของเราในการทำนาย Y อาจอธิบายได้ว่าเป็นการอธิบายความแปรปรวนบางส่วนหรือทั้งหมดนั่นคือเหตุผลหรือสิ่งที่เงื่อนไขไม่เบี่ยงเบนไปจากค่าเฉลี่ย มันไม่คงที่นั่นคือเราต้องการที่จะสามารถปรับปรุงในแบบจำลองการทำนายไร้เดียงสา t CONSTANT ซึ่งในค่าที่ดีที่สุดสำหรับค่าคงที่น่าจะเป็นค่าเฉลี่ยทางประวัติศาสตร์ของ Y อย่างแม่นยำมากขึ้นเราหวังว่าจะหารูปแบบที่มีข้อผิดพลาดการทำนาย มีความหมายน้อยกว่าค่าความแปรปรวนของค่าความแปรปรวนของตัวแปรเดิมจากค่าเฉลี่ยของค่าเฉลี่ยในการใช้แบบจำลองเชิงเส้นสำหรับการทำนายจะทำให้ความสะดวกในการคำนวณค่าสถิติที่น่าสนใจอย่างน้อย f หรือค่าสัมประสิทธิ์สหสัมพันธ์ระหว่าง X และ Y เป็นค่าเฉลี่ยและความแปรปรวนของแต่ละตัวแปรโดยค่าสัมประสิทธิ์สหสัมพันธ์ระหว่าง X และ Y แสดงโดย r XY และวัดความสัมพันธ์เชิงเส้นระหว่าง พวกเขาในญาติคือขนาด unitless จาก -1 ถึง 1 นั่นคือมาตรการขอบเขตที่แบบเชิงเส้นสามารถใช้ในการทำนายการเบี่ยงเบนของตัวแปรหนึ่งจากค่าเฉลี่ยของความรู้ที่ได้รับจากส่วนเบี่ยงเบนอื่น ๆ จากค่าเฉลี่ยของที่เดียวกัน point ในเวลาค่าสัมประสิทธิ์สหสัมพันธ์สามารถคำนวณได้ง่ายที่สุดถ้าเรากำหนดตัวแปรมาตรฐานเป็นอันดับแรกซึ่งหมายถึงการแปลงค่าเป็นหน่วยของค่าเบี่ยงเบนมาตรฐานจากค่าเฉลี่ยโดยใช้ค่าส่วนเบี่ยงเบนมาตรฐานของประชากรมากกว่าค่าส่วนเบี่ยงเบนมาตรฐานตัวอย่างเช่นการใช้ สถิติที่มีสูตรของ n มากกว่า n-1 ในส่วนที่ n เป็นขนาดตัวอย่าง X รุ่นมาตรฐานจะแสดงที่นี่โดย X และค่าในช่วง t ถูกกำหนดไว้ใน Excel notation as. where STDEV P เป็นฟังก์ชัน Excel สำหรับส่วนเบี่ยงเบนมาตรฐานของประชากรที่นี่และที่อื่น ๆ ฉันจะใช้ฟังก์ชัน Excel แทนสัญลักษณ์คณิตศาสตร์ทั่วไปในบางสูตรเพื่อแสดงวิธีการคำนวณที่จะทำในสเปรดชีต ตัวอย่างเช่นสมมุติว่า AVERAGE X 20 และ STDEV PX 5 ถ้า X t 25 แล้ว X t 1 ถ้า X t 10 แล้ว X t -2 และอื่น ๆ Y จะแสดงถึงค่ามาตรฐานที่เหมือนกันของ Y. Now ค่าสัมประสิทธิ์สหสัมพันธ์ เท่ากับค่าเฉลี่ยของค่ามาตรฐานของสองตัวแปรภายในตัวอย่างที่กำหนดของการสังเกต n ตัวอย่างเช่นถ้า X และ Y ถูกจัดเก็บไว้ในคอลัมน์ในสเปรดชีตคุณสามารถใช้ฟังก์ชัน AVERAGE และ STDEV P เพื่อคำนวณ their averages and population standard deviations, then you can create two new columns in which the values of X and Y in each row are computed according to the formula above Then create a third new column in which X is multiplied by Y in every row The average of the values in the last column is the correlation between X and Y Of course, in Excel, you can just use the formula CORREL X, Y to calculate a correlation coefficient, where X and Y denote the cell ranges of the data for the variables Note in some situations it might be of interest to standardize the data relative to the sample standard deviation, which is STDEV S in Excel, but the population statistic is the correct one to use in the formula above Return to top of page. If the two variables tend to vary on the same sides of their respective means at the same time, then the average product of their deviations and hence the correlation between them will be positive since the product of two numbers with the same sign is positive Conversely, if they tend to vary on opposite sides of their respective means at the same time, their correlation will be negative If they vary independently with respect to their means--that is, if one is equally likely to be above or below its mean regardless of what t he other is doing--then the correlation will be zero And if Y is an exact linear function of X, then either Y t X t for all t or else Y t - X t for all t in which case the formula for the correlation reduces to 1 or -1.The correlation coefficient can be said to measure the strength of the linear relationship between Y and X for the following reason The linear equation for predicting Y from X that minimizes mean squared error is simply. Thus, if X is observed to be 1 standard deviation above its own mean, then we should predict that Y will be r XY standard deviations above its own mean if X is 2 standard deviations below its own mean, then we should be predict that Y will be 2 r XY standard deviations below its own mean, and so on. In graphical terms, this means that, on a scatterplot of Y versus X the line for predicting Y from X so as to minimize mean squared error is the line that passes through the origin and has slope r XY This fact is not supposed to be obvious, but it is easily prov ed by elementary differential calculus. Here is an example on a scatterplot of Y versus X the visual axis of symmetry is a line that passes through the origin and whose slope is equal to 1 i e a 45-degree line , which is the gray dashed line on the plot below It passes through the origin because the means of both standardized variables are zero, and its slope is equal to 1 because their standard deviations are both equal to 1 The latter fact means that the points are equally spread out horizontally and vertically in terms of mean squared deviations from zero, which forces their pattern to appear roughly symmetric around the 45-degree line if the relationship between the variables really is linear However, the gray dashed line is the not the best line to use for predicting the value of Y for a given value of X The best line for predicting Y from X has a slope of less than 1 it regresses toward the X axis The regression line is shown in red, and its slope is the correlation between X and Y which is 0 46 in this case Why is this true Because, that s the way to bet if you want to minimize the mean squared error measured in the Y direction If instead you wanted to predict X from Y so as to minimize mean squared error measured in the X direction, the line would regress in the other direction relative to the 45-degree line, and by exactly the same amount. If we want to obtain the linear regression equation for predicting Y from X in unstandardized terms we just need to substitute the formulas for the standardized values in the preceding equation, which then becomes. By rearranging this equation and collecting constant terms, we obtain. is the estimated slope of the regression line, and. is the estimated Y - intercept of the line. Notice that, as we claimed earlier, the coefficients in the linear equation for predicting Y from X depend only on the means and standard deviations of X and Y and on their coefficient of correlation. The additional formulas that are needed to compute sta ndard errors t-statistics and P-values statistics that measure the precision and significance of the estimated coefficients are given in the notes on mathematics of simple regression and also illustrated in this spreadsheet file. Perfect positive correlation r XY 1 or perfect negative correlation r XY -1 is only obtained if one variable is an exact linear function of the other, without error, in which case they aren t really different variables at all. In general we find less-than-perfect correlation, which is to say, we find that r XY is less than 1 in absolute value Therefore our prediction for Y is typically smaller in absolute value than our observed value for X That is, the prediction for Y is always closer to its own mean, in units of its own standard deviation, than X was observed to be, which is Galton s phenomenon of regression to the mean. So, the technical explanation of the regression-to-the-mean effect hinges on two mathematical facts i the correlation coefficient, calculated in the manner described above, happens to be the coefficient that minimizes the squared error in predicting Y from X and ii the correlation coefficient is never larger than 1 in absolute value, and it is only equal to 1 when Y is an exact noiseless linear function of X. The term regression has stuck and has even mutated from an intransitive verb into a transitive one since Galton s time We don t merely say that the predictions for Y regress to the mean --we now say that we are regressing Y on X when we estimate a linear equation for predicting Y from X and we refer to X as a regressor in this case. When we have fitted a linear regression model, we can compute the variance of its errors and compare this to the variance of the dependent variable the latter being the error variance of an intercept-only model The relative amount by which the regression model s error variance is less than the variance of the dependent variable is referred to as the fraction of the variance that was explained by the independent variable s For example, if the error variance is 20 less than the original variance, we say we have explained 20 of the variance. It turns out that in a simple regression model, the fraction of variance explained is precisely the square of the correlation coefficient --i e the square of r Hence, the fraction-of-variance-explained has come to be known as R-squared The interpretation and use of R-squared are discussed in more detail here. In a multiple regression model one with two or more X variables , there are many correlation coefficients that must be computed, in addition to all the means and variances For example, we must consider the correlation between each X variable and the Y variable, and also the correlation between each pair of X variables In this case, it still turns out that the model coefficients and the fraction-of-variance-explained statistic can be computed entirely from knowledge of the means, standard deviations, and correlation coefficients among t he variables--but the computations are no longer easy We will leave those details to the computer Return to top of page. Go on to a nearby topic.

No comments:

Post a Comment