Socjologia
  Statystyka
 
Statystyka
- nauka, której przedmiotem zainteresowania są metody pozyskiwania i prezentacji, a przede wszystkim analizy danych opisujących zjawiska masowe.
Dominanta
(wartość modalna, moda, wartość najczęstsza) jedna z miar tendencji centralnej, statystyka dla zmiennych o rozkładzie dyskretnym, wskazująca na wartość o największym prawdopodobieństwie wystąpienia, lub wartość najczęściej występująca w próbie. Dla zmiennej losowej o rozkładzie ciągłym jest to wartość, dla której funkcja gęstości prawdopodobieństwa ma wartość największą.
Przykład
: Dana jest zmienna losowa, która przyjmuje pięć wartości z pewnymi prawdopodobieństwami:wartość prawdopodobieństwo 1 0.2 2 0.3 3 0.1 4 0.11 5 0.29 Moda dla tego rozkładu wynosi 2 ponieważ jest tam największe prawdopodobieństwo Moda może być szczególnie użyteczna gdy wartości zmiennej obserwowanej nie są liczbowe - co uniemożliwia (bez przypisania wartości liczbowych) zastosowania m.in. mediany czy średniej arytmetycznej. Np. dla realizacji (ciągu zaobserwowanych wartości) {jabłko, gruszka, jabłko, pomarańcza, gruszka, banan, jabłko} dominantą jest jabłko.
Mediana
(zwana też wartością środkową lub drugim kwartylem) to w statystyce wartość cechy w szeregu uporządkowanym, powyżej i poniżej której znajduje się jednakowa liczba obserwacji. Mediana jest kwantylem rzędu 1/2. Aby obliczyć medianę ze zbioru n obserwacji, sortujemy je w kolejności od najmniejszej do największej i numerujemy od 1 do n. Następnie, jeśli n jest nieparzyste, medianą jest wartość obserwacji w środku (czyli obserwacji numer (n+1)/2). Jeśli natomiast n jest parzyste, wynikiem jest średnia arytmetyczna między dwiema środkowymi obserwacjami, czyli obserwacją numer n/2 i obserwacją numer n/2+1.Mediana (zwana też wartością środkową lub drugim kwartylem) to w statystyce wartość cechy w szeregu uporządkowanym, powyżej i poniżej której znajduje się jednakowa liczba obserwacji. Mediana jest kwantylem rzędu 1/2. Aby obliczyć medianę ze zbioru n obserwacji, sortujemy je w kolejności od najmniejszej do największej i numerujemy od 1 do n. Następnie, jeśli n jest nieparzyste, medianą jest wartość obserwacji w środku (czyli obserwacji numer (n+1)/2). Jeśli natomiast n jest parzyste, wynikiem jest średnia arytmetyczna między dwiema środkowymi obserwacjami, czyli obserwacją numer n/2 i obserwacją numer n/2+1.
MIARY POLOŻENIA (kwartyle) I MIARY ASYMETRII (skośność)
MIARA SKOŚNOŚCI – wykorzystuje trzeci moment. Uzasadnienie tej statystyki opiera się na zaobserwowanym fakcie, że gdy rozkład jest symetryczny, to suma odchyleń powyżej średniej podniesiona do trzeciej potęgi jest równoważna sumie odchyleń poniżej średniej podniesionych do trzeciej potęgi. Zatem dla rozkładu symetrycznego m3 =0 i g1=0. Jeżeli rozkład jest asymetryczny, to sumy odchyleń powyżej i poniżej średniej podniesionych do trzeciej potęgi nie są sobie równoważne. ROZKŁADY PRAWDOPODOBIEŃSTWA (zero-jedynkowe, skokowe, ciągle) ROZKŁAD NORMALNY PRAWO TRZECH SIGM. STANDARYZACJA ROZKŁADU Terminu prawdopodobieństwo można używać subiektywnie, określając nim pewną postawę albo wątpliwość dotyczącą jakiegoś zdarzenia przyszłego. ROZKŁAD NORMALNY –(właściwości) 1) Krzywa jest symetryczna. Średnia, mediana i wartość modalna zbiegają się w jednym punkcie. 2) Najwyższa rzędna krzywej występuje w punkcie średniej, czyli gdy z=0 i w jednostkowej krzywej normalnej równa jest 0,3989 3) Krzywa jest asymptotyczna. Zbliża się ona do osi poziomej, lecz nigdy do niej nie dochodzi i rozciąga się od minus nieskończoności do plus nieskończoności. 4) Punkty zagięcia krzywej znajdują się w miejscach plus lub minus jedną jednostkę odchylenia standardowego powyżej lub poniżej średniej. W tych miejscach krzywa zmienia się względem osi poziomej z wypukłej we wklęsłą. 5) Mniej więcej 68% powierzchni pod krzywą mieści się w granicach plus lub minus jednej jednostki odchylenia standardowego od średniej 6) W jednostkowej krzywej normalnej granice z= +1,96 obejmują 95%, a granice z=+2,58 obejmują 99% całkowitej powierzchni pod krzywą, przy czym odpowiednio 5% i 1% powierzchni mieści się poza tymi granicami. STANDARYZACJA – O teście psychologicznym mówimy, że jest standaryzowany, gdy dysponujemy wynikami przekształconymi, opartymi na odpowiednio dużej grupie odniesienia. Same wyniki przekształcone nazywamy normami.
PRAWO TRZECH SIGM
– 3 odchylenia w prawo od średniej , 3 odchylenia w lewo od średniej
MIARY DESPERSJI ( odchylenie standardowe, odchylenie ćwiartkowe)
ODCHYLENIE STANDARDOWE – (s) jest miarą stopnia zmienności najpowszechniej stosowaną i najbardziej rzetelną. To znaczy zmienia się ono najmniej między próbami pobranymi losowo z tej samej populacji. Jest rodzajem przeciętnej wszystkich odchyleń od średniej w próbie. ODCHYLENIE ĆWIARTKOWE – WSPÓŁCZYNNIK ZMIENNOŚCI – nie powinien być stosowany, jeśli nie jesteśmy dość pewni, że nasza skala pomiarowa posiada równe jednostki, a przede wszystkim, jeśli nie występuje punkt zera bezwzględnego.
MIARY TENDENCJI CENTRALNEJ
( średnia arytmetyczna, mediana, wartość modalna) ŚREDNIA ARYTMETYCZNA – to suma zbiorów pomiarów podzielona przez liczbę pomiarów w zbiorze. CECHY: 1. Suma odchyleń wszystkich pomiarów w zbiorze od ich średniej arytmetycznej równa jest 0. 3. Suma kwadratów odchyleń od średniej arytmetycznej jest mniejsza niż suma kwadratów odchyleń od dowolnej innej wartości. 4. Każda średnia obliczona z próby o liczebności N stanowi estymator średniej w populacji. 5. W przypadku większości rozkładów średnia jest dokładniejsza bądź skuteczniejsza jako estymator średniej w populacji aniżeli takie miary tendencji centralnej, jak mediana i wartość modalna jako estymatory odpowiadających im wartości w populacji. MEDIANA – jest wartością dzielącą wszystkie pomiary na pół, czyli tak, że połowa pomiarów mieści się poniżej niej, a połowa powyżej. WARTOŚĆ MODALNA – w sytuacjach, w których różne wartości zmiennej X występują więcej niż raz, wartość modalna jest wartością występującą najczęściej.
GRAFICZNA PREZENTACJA DANYCH
(histogram, wielobok liczebności i krzywa kumulatywna) HISTOGRAM – rodzaj wykresu, często wykorzystywany w badaniach opinii społecznej do prezentacji danych statystycznych, w którym różnym wartościom danej zmiennej odpowiadają różne wysokości pionowych prostokątów. W histogramie zakładamy, że wszystkie przypadki w obrębie przedziału klasowego rozkładają się równomiernie. WIELOBOK LICZEBNOŚCI – przyjmujemy, że wszystkie przypadki w każdym przedziale skupiają się w jego środku.
 
   
 
Ta strona internetowa została utworzona bezpłatnie pod adresem Stronygratis.pl. Czy chcesz też mieć własną stronę internetową?
Darmowa rejestracja