hello quizlet
Home
Subjects
Expert solutions
Create
Study sets, textbooks, questions
Log in
Sign up
Upgrade to remove ads
Only $35.99/year
Statistika
Flashcards
Learn
Test
Match
Flashcards
Learn
Test
Match
Terms in this set (70)
- Sběr, zpracování a vyhodnocení statistických údajů
- Statistika je teoretická disciplína, která se zabývá metodami sloužícími k popisu zákonitosti při působení podstatných činitelů a hromadných jev
- Číselné údaje o hromadných jevech
Co je to statistika
- Základní charakteristika získaných dat
- Vyčerpávající šetření
Popisná statistika
- Charakterizace určitého vzorku populace, ze které usuzujeme na vlastnosti celého základního souboru
- Výběr
Analytická statistika
- Rozlišení, co je na výsledku pozorování náhodné a co zákonité
- Nižší pravděpodobnost náhodného vzniku - výsledek pokládáme za zákonitý
- Vyšší pravděpodobnost náhodné vzniku - výsledek pokládáme za náhodný
Základní myšlenka statistického šetření
- výběrový soubor - výběr prvků (jednotek) ze základního souboru - soubor výběrový ...rozsah ...n
- základní soubor - celý původní statistický soubor, který je podroben statistickému zkoumání ... rozsah...N
Statistický soubor
- reprezentativní výběr
- náhodný výběr jednotek ze základního souboru
Vytváření výběrových souborů
- Rychlost.
- Lze provádět i tehdy, jestliže je šetření destrukční.
- Šetření základního souboru prakticky nemožné (značný rozsah).
- Dosažené výsledky nejsou zcela přesné
Výhody a nevýhody výběrového šetření
- Znaky kvantitativní - normální rozdělení
- Znaky kvalitativní - binomické rozdělení, zpravidla dvě rozdílná vyjádření znaků, které vyplňují celý pravděpodobnostní prostor
Statistické jednotky/znaky
- hodnoty
- průměrný měsíční příjem
Kvantitativní znaky
- slovní vyjádření
- ano/ne
- chodíte rádi do divadla
Kvalitativní znaky
- Urychlí samotnou analýzu dat
- Můžeme činit závěry s větší jistotou
- Můžeme je i následně doplňovat o další/novější údaje
- Minimalizují chyby při analýze
Výhody kvalitně sebraných dat:
- Jsou číselné charakteristiky, které jediným číslem vyjadřují určitou vlastnost zkoumaného statistického znaku.
- Většinou jsou použitelné pro kvantitativní statistické znaky a jen pro některé statistické znaky kvalitativní.
Popisné charakteristiky (obecně)
- Charakteristiky polohy
- Charakteristiky variability
- Charakteristiky šikmosti
- Charakteristiky špičatosti
Popisné charakteristiky
- Střední hodnoty
- Vyjadřují určitou polohu (úroveň) znaku, okolo které jsou ostatní hodnoty rozloženy
Charakteristiky polohy (obecně)
- Chronologický
- Aritmetický
- Geometrický
- Harmonický
Průměry
- Kvartily
- Modus
- Medián
- Minimum
Charakteristiky polohy
- Měly by být typickou hodnotou statistického souboru.
- Měly by sloužit k porovnání středních hodnot několika statistických souborů.
- Měly by co nejméně podléhat náhodnosti výběru.
Charakteristiky polohy (čím mají být)
- Průměr
Jaká charakteristika polohy se počítá ze všech hodnot v souboru
- prostá a vážená forma
- data v souboru nejsou utříděná
- data v souboru jsou setříděna
Aritmetický průměr
- modus
- je nejčastěji vyskytující se hodnota v souboru
Střední hodnota s označením X se stříškou (obr.)
- Nad prvním kvartilem leží první čtvrtina dat
- Medián je uprostřed a odděluje první polovinu dat (I. a II. kvartil) od druhé poloviny dat (III. a IV. kvartil)
Kvartily
- doplňují charakteristiky polohy
- rozšiřují informace o souboru.
- měří rozptýlení hodnot příslušného souboru okolo aritmetického průměru.
- jsou absolutní a relativní.
Charakteristiky variability
- variační koeficient
Relativní charakteristiky variability
- slouží k srovnávání variability různých statistických znaků a souborů.
- relativní míra variability.
- hodnota koeficientu se udává v procentech.
Variační koeficient
- Shrnuje hodnoty popisných charakteristik.
- Uprostřed boxplotu je medián.
- Tečky jsou odlehlá a extrémní pozorování.
Boxplot
- Absolutními četnostmi konkrétního znaku
- Relativními četnostmi konkrétního znaku
Kategoriální proměnné popisujeme
- znak, který nabývá číselného vyjádření
Náhodná veličina
- existují diskrétní a spojitá náhodná veličina
- spojitá náhodná veličina nabývá všech hodnot z konkrétního intervalu
Typy náhodných veličin
- počet narozených mláďat na vrh
Diskrétní náhodná veličina
- nabývá všech hodnot z konkrétního intervalu
- dojivost krav
Spojitá náhodná veličina
- váha zvířete
- dojivost krav
- váha vajec
Spojitá náhodná veličina
- Rozdělení diskrétních náhodných veličin
- Rozdělení spojitých náhodných veličin
- Hypergeometrické rozdělení
- Exponenciální rozdělení
Rozdělení náhodných veličin
- Alternativní rozdělení
- Binomické rozdělení
- Hypergeometrické rozdělení
Rozdělení diskrétních náhodných veličin
- Normální rozdělení
- Exponenciální rozdělení
- Normované normální rozdělení
Rozdělení spojitých náhodných veličin
- Náhodný pokus se dvěma možnými výsledky
- Náhodný jev nastane či nenastane / pokus byl úspěšný či neúspěšný
- Hod mincí (panna/orel), indikátor nemoc (zdravý/nemocný), pohlaví
Rozdělení diskrétních náhodných veličin - alternativní rozdělení
- Popisuje četnost náhodných jevů v nezávislých pokusech, v nichž má jev danou pravděpodobnost
- Barva očí (hnědé, modré, zelené...), známka ze zkoušky (výborně, velmi dobře, dobře ...) atd.
Rozdělení diskrétních náhodných veličin - binomické rozdělení
- Tabulkou pravděpodobností
- Pravděpodobností funkcí
- Distribuční funkcí
Lze popsat u diskrétní náhodné veličiny
- Hustotou pravděpodobností
- Distribuční funkcí
Lze popsat u spojité náhodné veličiny
- grafické vyjádření normálního rozdělení
- hustota pravděpodobností
Gaussova křivka
- bodový odhad
- intervalový odhad
- na základě hodnoty získané z dat výběrového souboru odhadneme hodnotu základního souboru
Formy odhadu
- parametr odhadneme tak, že stanovíme interval s určitou pravděpodobností, ve kterém se nachází hodnota základního souboru
Intervalový odhad
- nestranný - v průměru by měl být odhad správný, tzn., že by neměla vést k nadhodnocování či podhodnocování odhadu
- konzistentní - při dostatečném množství se snižuje pravděpodobnost chyby odhadu, při dostatečném výběru se odhad blíží hodnotám základního souboru
- vydatný - odhad je optimální, když minimalizujeme rozptyl chyby
- postačující - jestliže obsahuje všechny informace ze základního souboru
Vlastnosti odhadů
- Bodový odhad charakteristik ZS se rovná charakteristikám VS.
Bodový odhad
- základní soubor pochází z normálního rozdělení
- rozlišit výběr bez/s opakováním
- zjišťujeme jednostranný nebo oboustranný interval spolehlivosti
Předpoklady intervalových odhadů
- bodový a intervalový odhad průměru ZS
- bodový a intervalový odhad variačního koeficientu ZS
- bodový a intervalový odhad rozptylu ZS
- bodový a intervalový odhad mediánu ZS
Které charakteristiky lze odhadnout
- Neznáme charakteristiky ZS
Intervalový odhad průměru ZS
- testování je proces ověřování stanovené hypotézy
Testování statistických hypotéz
- Nulová hypotéza
Dané tvrzení o parametru, o jehož platnosti rozhodujeme (testujeme), neexistuje statisticky významný rozdíl, neliší se, neexistuje závislost
- možné výsledky pokusu, v případě, že nulovou hypotézu zamítáme
Kritický obor hodnot
- možné výsledky pokusu, v případě, že nulovou hypotézu nelze zamítnout
Obor přijetí
- je spojena se zamítnutím nulové hypotézy, která ve skutečnosti platí
- hladina významnosti
Chyba I. Druhu
- značí se β
- jedná se o pravděpodobnost, že přijímáme nulovou hypotézu, která ve skutečnosti neplatí (alespoň 0,8)
- je pravděpodobnost nesprávného přijetí nulové hypotézy (1- β) nazývá se síla testu
- závisí na velikosti výběru (s větším souborem klesá)
Chyba II. Druhu
- maximální dovolená pravděpodobnost chyby I. druhu, většinou je stanovena na 1% nebo 5%
Hladina významnosti
- pravděpodobnost zamítnutí neplatné nulové hypotézy
Síla testu
- nejmenší alfa, na které lze zamítnout nulovou hypotézu
P-hodnota
- Parametrické x Neparametrické
- Jednovýběrové x Dvouvýběrové x Vícevýběrové testování
- Jednostranné x Oboustranné
Dělení statistických testů
- p-hodnota > α => nelze zamítnout nulovou hypotézu
Výsledky testování
- porovnává stejný soubor jednotek, ale dvakrát (vždy po určité události/době)
Párový t-test
- test hypotézy o průměru ZS, porovnává skutečnost s předpokladem
- test hypotézy o parametru p
Jednovýběrové testy
- váha - závislá proměnná
- výška - nezávislá proměnná
Proměnné
- jednostranná - x - nezávislá, y - závislá
- oboustranná - závisle proměnná se změní v nezávisle proměnnou a naopak
Závislost
- Změna hodnoty znaku závisle proměnné při změně hodnoty znaku nezávisle proměnné pomocí regresní funkce.
- Průběh závislosti je možné vyjádřit graficky pomocí regresní čáry.
- Volba vhodné funkce pomoci korelačního pole.
Regresní analýza
- y - závislá proměnná
- x - nezávislá proměnná
- je nejjednodušší příklad regresní funkce
Lineární regrese
- Ano
Test významnosti regresního koeficientu. H0 zamítáme? (p menší než 0,05)
- y´ = 3,104 + 2,373x (hodnoty pod "b" v tabulce)
Rovnice:
- určuje sílu závislosti
- síla závislosti je vyjádřena koeficientem - Pearsonův koeficient
Korelační analýza
- značí se r
- -1 - lineární nepřímá závislost (klesající)
Pearsonův korelační koeficient
- Z kolika procent je závisle proměnná ovlivněna nezávisle proměnno
- Udává se v procentech
- Značí se r2
Koeficient determinace
- Závislá proměnná je modelována jako nelineární kombinace parametrů modelu.
- Některé modely nelineární v parametrech lze převést pomocí vhodné transformace na modely lineární v parametrech.
- Po transformaci nezávisle proměnné je možné sestavit přímku: hyperbola.
Nelineární regrese
- Totální korelační koeficient - jak je závisle proměnná ovlivněna nezávisle proměnnými.
- Závisle proměnná je ovlivněna větším počtem nezávisle proměnných.
Vícenásobná lineární regrese
Students also viewed
Obecná ekonomie
193 terms
Himpunan-Geometri
35 terms
karboxylové kyseliny a jejich deriváty + další slo…
44 terms
17. správa na úseku životního prostředí
24 terms
Other sets by this creator
Politika
41 terms
AHP pojmy
93 terms
Ochrana vod
48 terms
Léčivky
82 terms
Other Quizlet sets
Arizona Property Taxes
58 terms
Chapter 2
20 terms
Insurance w/A
36 terms
EMS Ch. 11 Review
43 terms