სტატისტიკა დიდი ხანია ცხოვრების განუყოფელი ნაწილია. ხალხი მას ყველგან აწყდება. სტატისტიკაზე დაყრდნობით კეთდება დასკვნები იმის შესახებ, თუ სად და რა დაავადებებია გავრცელებული, რა არის უფრო მოთხოვნადი კონკრეტულ რეგიონში თუ მოსახლეობის გარკვეულ სეგმენტში. სახელმწიფო ორგანოების კანდიდატების პოლიტიკური პროგრამების აგებაც კი სტატისტიკურ მონაცემებს ეფუძნება. მათ ასევე იყენებენ საცალო ქსელები საქონლის შეძენისას და მწარმოებლები თავიანთ წინადადებებში ხელმძღვანელობენ ამ მონაცემებით.
სტატისტიკა მნიშვნელოვან როლს ასრულებს საზოგადოების ცხოვრებაში და გავლენას ახდენს მის თითოეულ ცალკეულ წევრზე, თუნდაც წვრილმანებზე. მაგალითად, თუ სტატისტიკის მიხედვით, ადამიანების უმეტესობა უპირატესობას ანიჭებს მუქ ფერებს ტანსაცმელში კონკრეტულ ქალაქში ან რეგიონში, მაშინ ადგილობრივ მაღაზიებში ძალიან რთული იქნება ღია ყვითელი საწვიმარის პოვნა ყვავილების პრინტით. მაგრამ რა რაოდენობითაქვს თუ არა ამ მონაცემებს ასეთი გავლენა? მაგალითად, რა არის „სტატისტიკურად მნიშვნელოვანი“? კონკრეტულად რა იგულისხმება ამ განმარტებაში?
რა არის ეს?
სტატისტიკა, როგორც მეცნიერება, შედგება სხვადასხვა რაოდენობისა და ცნებების ერთობლიობისგან. ერთ-ერთი მათგანია „სტატისტიკური მნიშვნელობის“ცნება. ეს არის ცვლადების მნიშვნელობის სახელი, სხვა ინდიკატორების გამოჩენის ალბათობა, რომლებშიც უმნიშვნელოა.
მაგალითად, 10-დან 9 ადამიანი იცვამს ფეხზე რეზინის ფეხსაცმელს შემოდგომის ტყეში, წვიმიანი ღამის შემდეგ სოკოს მოსავლელად დილით. ალბათობა იმისა, რომ რაღაც მომენტში მათგან 8-მა ტილოზე მოკასინი დადო, უმნიშვნელოა. ამრიგად, ამ კონკრეტულ მაგალითში, რიცხვი 9 არის ის, რასაც ეწოდება "სტატისტიკური მნიშვნელობა".
შესაბამისად, თუ მოცემულ პრაქტიკულ მაგალითს შემდგომ განვავითარებთ, ფეხსაცმლის მაღაზიები ზაფხულის სეზონის ბოლომდე ყიდულობენ რეზინის ჩექმებს უფრო დიდი რაოდენობით, ვიდრე წლის სხვა დროს. ამრიგად, სტატისტიკური მნიშვნელობის სიდიდე გავლენას ახდენს ჩვეულებრივ ცხოვრებაზე.
რა თქმა უნდა, კომპლექსურ გამოთვლებში, ვთქვათ, ვირუსების გავრცელების პროგნოზირებისას გათვალისწინებულია ცვლადების დიდი რაოდენობა. მაგრამ სტატისტიკური მონაცემების მნიშვნელოვანი ინდიკატორის განსაზღვრის არსი მსგავსია, მიუხედავად გამოთვლების სირთულისა და ცვლადი მნიშვნელობების რაოდენობისა.
როგორ გამოითვლება?
გამოიყენება განტოლების "სტატისტიკური მნიშვნელობის" ინდიკატორის მნიშვნელობის გამოთვლისას. ანუ შეიძლება ითქვას, რომ ამ შემთხვევაში ყველაფერს მათემატიკა წყვეტს.გაანგარიშების უმარტივესი ვარიანტია მათემატიკური ოპერაციების ჯაჭვი, რომელშიც ჩართულია შემდეგი პარამეტრები:
- 2 ტიპის გამოკითხვებით ან ობიექტური მონაცემების შესწავლით მიღებული შედეგი, როგორიცაა შესყიდვების რაოდენობა, აღინიშნება a და b;
- ნიმუშის ზომის მაჩვენებელი ორივე ჯგუფისთვის – n;
- კომბინირებული ნიმუშის წილის მნიშვნელობა - p;
- სტანდარტული შეცდომა - SE.
შემდეგი ნაბიჯი არის ტესტის საერთო ქულის განსაზღვრა - t, მისი მნიშვნელობა შედარებულია რიცხვთან 1.96. 1.96 არის საშუალო მნიშვნელობა, რომელიც გადმოსცემს დიაპაზონს 95%, Student-ის t-განაწილების ფუნქციის მიხედვით.
ხშირად ჩნდება კითხვა, რა განსხვავებაა n და p მნიშვნელობებს შორის. ამ ნიუანსის გარკვევა მარტივია მაგალითით. ვთქვათ, გამოითვლება ლოიალობის სტატისტიკური მნიშვნელობა მამაკაცისა და ქალის რომელიმე პროდუქტის ან ბრენდის მიმართ.
ამ შემთხვევაში, ასოებს მოჰყვება შემდეგი:
- n - გამოკითხულთა რაოდენობა;
- p - პროდუქტით კმაყოფილთა რაოდენობა.
გამოკითხული ქალების რაოდენობა ამ შემთხვევაში იქნება n1. შესაბამისად, მამაკაცები - n2. იგივე მნიშვნელობა ექნება p სიმბოლოს "1" და "2" რიცხვებს.
ტესტის ქულის შედარება სტუდენტის ცხრილების საშუალოდ ხდება ის, რასაც ეწოდება "სტატისტიკური მნიშვნელობა".
რა იგულისხმება გადამოწმებაში?
ნებისმიერი მათემატიკური გამოთვლის შედეგების შემოწმება ყოველთვის შეიძლება, ამას ასწავლიან ბავშვებს დაწყებით სკოლაში. ლოგიკურია ვივარაუდოთრომ რადგან სტატისტიკა განისაზღვრება გამოთვლების ჯაჭვის გამოყენებით, მაშინ ისინი შემოწმდება.
თუმცა, სტატისტიკური მნიშვნელოვნების ტესტირება არ არის მხოლოდ მათემატიკა. სტატისტიკა ეხება ცვლადების დიდ რაოდენობას და სხვადასხვა ალბათობას, რომლებიც ყოველთვის შორს არიან გამოთვლებისთვის. ანუ, თუ დავუბრუნდებით სტატიის დასაწყისში რეზინის ფეხსაცმლის მაგალითს, მაშინ სტატისტიკური მონაცემების ლოგიკური აგებულება, რომელსაც დაეყრდნონ მაღაზიების საქონლის მყიდველები, შეიძლება შეფერხდეს მშრალი და ცხელი ამინდით, რაც არ არის დამახასიათებელი შემოდგომისთვის.. ამ ფენომენის შედეგად შემცირდება რეზინის ჩექმების შემსყიდველთა რიცხვი და ზარალს განიცდიან მაღაზიები. რა თქმა უნდა, მათემატიკური ფორმულა ვერ ახერხებს ამინდის ანომალიის განჭვრეტას. ამ მომენტს უწოდებენ "შეცდომას".
ეს მხოლოდ ასეთი შეცდომების ალბათობაა და ითვალისწინებს გათვლილი მნიშვნელობის დონის შემოწმებას. იგი ითვალისწინებს როგორც გამოთვლილ ინდიკატორებს, ასევე მნიშვნელობის მიღებულ დონეებს, ასევე რაოდენობებს, რომლებსაც პირობითად უწოდებენ ჰიპოთეზებს.
რა არის მნიშვნელობის დონე?
„დონის“ცნება შედის სტატისტიკური მნიშვნელოვნების ძირითად კრიტერიუმებში. იგი გამოიყენება გამოყენებით და პრაქტიკულ სტატისტიკაში. ეს არის ერთგვარი მნიშვნელობა, რომელიც ითვალისწინებს შესაძლო გადახრების ან შეცდომების ალბათობას.
დონე ეფუძნება მზა ნიმუშებში განსხვავებების იდენტიფიცირებას, ის საშუალებას გაძლევთ დაადგინოთ მათი მნიშვნელობა ან, პირიქით, შემთხვევითობა. ამ კონცეფციას აქვს არა მხოლოდ ციფრული მნიშვნელობა, არამედ მათი თავისებური ინტერპრეტაცია. განმარტავენროგორ უნდა გაიგოთ მნიშვნელობა და თავად დონე განისაზღვრება შედეგის საშუალო ინდექსთან შედარებით, ეს ცხადყოფს განსხვავებების სანდოობის ხარისხს.
ამგვარად, ჩვენ შეგვიძლია წარმოვიდგინოთ დონის კონცეფცია მარტივად - ეს არის მისაღები, სავარაუდო შეცდომის ან შეცდომის მაჩვენებელი მიღებული სტატისტიკური მონაცემებიდან გამოტანილ დასკვნებში.
მნიშვნელობის რა დონეებია გამოყენებული?
შეცდომის ალბათობის კოეფიციენტების სტატისტიკური მნიშვნელობა პრაქტიკაში ემყარება სამ ძირითად დონეს.
პირველი დონე არის ბარიერი, რომლის მნიშვნელობა არის 5%. ანუ შეცდომის ალბათობა არ აღემატება მნიშვნელოვნების 5%-ს. ეს ნიშნავს, რომ სტატისტიკური კვლევის მონაცემების საფუძველზე გაკეთებული დასკვნების უმწიკვლობასა და უტყუარობაში ნდობა არის 95%..
მეორე დონე არის 1%-იანი ბარიერი. შესაბამისად, ეს მაჩვენებელი ნიშნავს, რომ სტატისტიკური გამოთვლების დროს მიღებული მონაცემებით შეიძლება იხელმძღვანელო 99%-იანი ნდობით.
მესამე დონე - 0.1%. ამ მნიშვნელობით, შეცდომის ალბათობა უდრის პროცენტის წილადს, ანუ შეცდომები პრაქტიკულად აღმოიფხვრება.
რა არის ჰიპოთეზა სტატისტიკაში?
შეცდომები, როგორც კონცეფცია, იყოფა ორ სფეროდ, რაც შეეხება ნულოვანი ჰიპოთეზის მიღებას ან უარყოფას. ჰიპოთეზა არის კონცეფცია, რომლის მიღმაც, განმარტების მიხედვით, იმალება კვლევის შედეგების, სხვა მონაცემების ან განცხადებების ერთობლიობა. ანუ სტატისტიკური აღრიცხვის საგანთან დაკავშირებული რაიმეს ალბათობის განაწილების აღწერა.
უბრალო გამოთვლებში ორი ჰიპოთეზაა - ნული და ალტერნატივა. მათ შორის განსხვავება ისაა, რომ ნულოვანი ჰიპოთეზა ემყარება იმ აზრს, რომ სტატისტიკური მნიშვნელობის განსაზღვრაში ჩართულ ნიმუშებს შორის ფუნდამენტური განსხვავებები არ არსებობს და ალტერნატიული სრულიად საპირისპიროა. ანუ, ალტერნატიული ჰიპოთეზა ემყარება ამ ნიმუშებში მნიშვნელოვანი განსხვავების არსებობას.
რა არის შეცდომები?
შეცდომები, როგორც ცნება სტატისტიკაში, პირდაპირპროპორციულია ამა თუ იმ ჰიპოთეზის ჭეშმარიტად მიღებასთან. ისინი შეიძლება დაიყოს ორ მიმართულებად ან ტიპად:
- პირველი ტიპი გამოწვეულია ნულოვანი ჰიპოთეზის მიღებით, რომელიც აღმოჩნდა არასწორი;
- წამი - გამოწვეულია ალტერნატივის მიყოლებით.
შეცდომის პირველ ტიპს ეწოდება ცრუ დადებითი და საკმაოდ გავრცელებულია ყველა სფეროში, სადაც სტატისტიკა გამოიყენება. შესაბამისად მეორე ტიპის შეცდომას ცრუ უარყოფითი ეწოდება.
რატომ გვჭირდება რეგრესია სტატისტიკაში?
რეგრესიის სტატისტიკური მნიშვნელობა იმაში მდგომარეობს, რომ მისი დახმარებით შესაძლებელია დადგინდეს, რამდენად შეესაბამება მონაცემების საფუძველზე გამოთვლილი სხვადასხვა დამოკიდებულების მოდელი რეალობას; საშუალებას გაძლევთ დაადგინოთ აღრიცხვისა და დასკვნების ფაქტორების საკმარისი ან ნაკლებობა.
რეგრესიის მნიშვნელობა განისაზღვრება შედეგების შედარებით ფიშერის ცხრილებში ჩამოთვლილ მონაცემებთან. ან დისპერსიის ანალიზის გამოყენებით. რეგრესიის ინდიკატორები მნიშვნელოვანია, როდესაცრთული სტატისტიკური კვლევები და გამოთვლები, რომლებიც მოიცავს ცვლადების დიდ რაოდენობას, შემთხვევით მონაცემებს და სავარაუდო ცვლილებებს.