Ta strona wykorzystuje pliki cookies. Korzystając ze strony, zgadzasz się na ich użycie. OK Polityka Prywatności Zaakceptuj i zamknij X

Statystyczne systemy uczące się Ćwiczenia Pakiet R

08-05-2014, 6:47
Aukcja w czasie sprawdzania nie była zakończona.
Cena kup teraz: 21.50 zł     
Użytkownik ksiazka_gliwice
numer aukcji: 4192993358
Miejscowość Gliwice
Wyświetleń: 2   
Koniec: 08-05-2014 06:51:45

Dodatkowe informacje:
Stan: Nowy
Okładka: miękka
Rok wydania (xxxx): 2009
Kondycja: bez śladów używania
info Niektóre dane mogą być zasłonięte. Żeby je odsłonić przepisz token po prawej stronie. captcha

 

Statystyczne systemy uczące się. Ćwiczenia w oparciu o pakiet R

Jan Ćwik, Jan Mielniczuk


rok wydania: 2009
stron: 192
oprawa: miękka
format: B5
wydawnictwo: Politechnika Warszawska


Książka jest zbiorem ćwiczeń wraz z rozwiązaniami i dyskusją, dotyczących statystycznej analizy danych wielowymiarowych z perspektywy eksploatacji (ang. data mining). Problemy dotyczą min. analizy składowych głównych, metod klasyfikacji i analizy skupień oraz szacowania funkcji regresji. Cykle tematyczne poprzedzone są krótkim wstępem. Książka jest przeznaczona do wykorzystania w trakcie jednosemestralnych ćwiczeń laboratoryjnych z zaawansowanej algebry danych.


SPIS TREŚCI:

Przedmowa 7

1. Analiza składowych głównych 9
1.1. Przykładowa analiza 10
1.2. Regresja składowych głównych (PCR) i regresja częściowych najmniejszych kwadratów (PLSR) 17
1.3. Zadania 22

2. LDA i QDA 25
2.1. Dwie klasy, dwie zmienne 29
2.2. Trzy klasy, dwie zmienne 36
2.3. Trzy klasy, trzy zmienne 42
2.4. Wiele klas, wiele zmiennych 44
2.5. Zadania 46

3. Dyskryminacja logistyczna 51
3.1. Zadania 60

4. Ocena jakości klasyfikatorów. Krzywa ROC i parametr AUC 63
4.1. Ocena jakości reguły klasyfikacyjnej 63
4.2. Metody estymacji prawdopodobieństwa błędnej klasyfikacji 64
4.2.1. Kroswalidacja n-krotna (leave-one-out, one-leaving-out) 64
4.2.2. Kroswalidacja 10-krotna 66
4.2.3. Metoda oceny błędu na podstawie wielokrotnego podziału próby 68
4.3. Krzywe ROC 69
4.3.1. Binormalna krzywa ROC 72

5. Estymacja gęstości 77
5.1. Wprowadzenie 77
5.2. Estymacja gęstości jednowymiarowej 79
5.3. Klasyfikacja na podstawie gęstości jednowymiarowej 83
5.4. Estymacja gęstości dwuwymiarowej 84
5.5. Klasyfikacja na podstawie gęstości dwuwymiarowej 85
5.6. Metoda typu „najbliższy sąsiad” (kNN) 88
5.7. Zadania 90

6. Drzewa klasyfikacyjne i regresyjne 93
6.1. Drzewa regresyjne 93
6.2. Drzewa klasyfikacyjne 94
6.3. Drzewa regresyjne: dane fitness 95
6.4. Drzewa klasyfikacyjne: dane Cars93 105
6.5. Redukcja zmiennych w przypadku drzew klasyfikacyjnych 110
6.6. Zadania 114

7. Metody nieparametrycznej estymacji funkcji regresji 117
7.1. Nieliniowe parametryczne metody regresyjne 117
7.2. Nieparametryczne metody regresyjne 118
7.2.1. Metody nieparametryczne - niski wymiar wektora atrybutów 118
7.2.2. Metody nieparametryczne - wysoki wymiar wektora atrybutów 124
7.3. Zadania 132

8. Metody łączenia klasyfikatorów: bagging, boosting i lasy losowe 137
8.1. Klasyfikator AdaBoost dla drzewa 140
8.2. Klasyfikator AdaBoost dla LDA 142
8.3. Zadania 147

9. Analiza skupień i skalowanie wielowymiarowe 149
9.1. Zadania 156

10. Przykład analizy: dane Image Segmentation 159
10.1. Wczytanie danych i wybranie atrybutów 159
10.2. PCA 162
10.3. LDA 166
10.4. QDA 167
10.5. Drzewa klasyfikacyjne 169
10.5.1. LDA z pominięciem kilku klas 175
10.6. kNN 175
10.7. Klasyfikacja na podstawie składowych głównych 179

11. Dodatek 183
11.1. Używane zbiory danych 183