Wstęp (7)
1. Język R (13)
Język R w uczeniu maszynowym (14)
Pobieranie i instalowanie R (16)
Edytory plików tekstowych i środowiska programistyczne (19)
Ładowanie i instalowanie pakietów R (20)
Podstawy R w uczeniu maszynowym (23)
Dodatkowe materiały o R (36)
2. Eksplorowanie danych (39)
Analiza eksploracyjna i analiza potwierdzająca (39)
Czym są dane? (40)
Wnioskowanie o typach danych w kolumnach (43)
Wnioskowanie o znaczeniu wartości (45)
Podsumowania liczbowe (46)
Średnie, mediany i dominanty (46)
Kwantyle (48)
Odchylenia standardowe i wariancje (49)
Eksploracyjne wizualizacje danych (52)
Wizualizowanie powiązań pomiędzy kolumnami (67)
3. Klasyfikacja - odsiewanie spamu (73)
To czy nie to? Klasyfikacja binarna (73)
Płynne przejście do prawdopodobieństwa warunkowego (77)
Nasz pierwszy bayesowski klasyfikator spamu (78)
Definiowanie i testowanie klasyfikatora na wątpliwych wiadomościach treściwych (84)
Testowanie klasyfikatora na wiadomościach wszystkich typów (88)
Polepszanie wyników klasyfikacji (91)
4. Układanie rankingu - priorytetowa skrzynka pocztowa (93)
Jak uporządkować, nie znając kryterium? (93)
Układanie wiadomości e-mail według ważności (94)
Cechy istotności wiadomości e-mail (95)
Implementacja skrzynki priorytetowej (99)
Funkcje wyłuskujące wartości cech (99)
Tworzenie mechanizmu nadawania wag (106)
Nadawanie wag na podstawie aktywności w wątku (110)
Uczenie i testowanie algorytmu układającego ranking (115)
5. Regresja - przewidywanie odsłon stron (123)
Wprowadzenie do regresji (123)
Model wyjściowy (123)
Regresja z użyciem zmiennych sztucznych (126)
Podstawy regresji liniowej (128)
Przewidywanie odwiedzin stron WWW (135)
Definiowanie korelacji (145)
6. Regularyzacja - regresja tekstu (149)
Nieliniowe zależności pomiędzy kolumnami - świat krzywych (149)
Wstęp do regresji wielomianowej (152)
Metody zapobiegania nadmiernemu dopasowaniu (158)
Zapobieganie nadmiernemu dopasowaniu przez regularyzację (162)
Regresja tekstu (166)
Pociecha w regresji logistycznej (170)
7. Optymalizacja - łamanie szyfrów (175)
Wprowadzenie do optymalizacji (175)
Regresja grzbietowa (181)
Łamanie szyfrów jako problem optymalizacji (185)
8. Analiza głównych składowych - budowanie indeksu rynku (195)
Uczenie nienadzorowane (195)
9. Skalowanie wielowymiarowe - uwidocznianie podobieństwa polityków (203)
Grupowanie na podstawie podobieństwa (203)
Wprowadzenie do miar odległości i skalowania wielowymiarowego (204)
Jak się grupują amerykańscy senatorzy? (209)
Analiza rejestrów głosowań w Senacie (kongresy 101. - 111.) (210)
10. kNN - systemy rekomendacyjne (219)
Algorytm kNN (219)
Dane o instalacjach pakietów języka R (224)
11. Analiza grafów społecznych (229)
Analiza sieci społecznych (229)
Myślenie grafowe (231)
Pozyskiwanie danych do grafu społecznego Twittera (233)
Praca z API usługi SocialGraph (236)
Analiza sieci Twittera (241)
Lokalna struktura społeczna (242)
Wizualizacja pogrupowanej sieci społecznej Twittera w programie Gephi (246)
Własny mechanizm rekomendacji wartościowych twitterowiczów (251)
12. Porównanie modeli (259)
SVM - maszyna wektorów nośnych (259)
Porównanie algorytmów (269)
Bibliografia (274)
Skorowidz (276)