Ta strona wykorzystuje pliki cookies. Korzystając ze strony, zgadzasz się na ich użycie. OK Polityka Prywatności Zaakceptuj i zamknij X

Rozpoznawanie obrazów i sygnałów mowy

02-04-2015, 0:10
Aukcja w czasie sprawdzania była zakończona.
Cena kup teraz: 30 zł     
Użytkownik ksiazka_gliwice
numer aukcji: 5142866031
Miejscowość Gliwice
Wyświetleń: 5   
Koniec: 01-04-2015 23:31:06

Dodatkowe informacje:
Stan: Nowy
Okładka: miękka
Rok wydania (xxxx): 2009
Kondycja: bez śladów używania
info Niektóre dane mogą być zasłonięte. Żeby je odsłonić przepisz token po prawej stronie. captcha

 

Rozpoznawanie obrazów i sygnałów mowy

Włodzimierz Kasprzak


rok wydanie: 2009
stron: 274
oprawa: miękka
format: B5
wydawnictwo: Oficyna Wydawnicza Politechniki Warszawskiej
  

W podręczniku omówiono problematykę rozpoznawania obiektów w obrazach cyfrowych i rozpoznawania komend głosowych.

Materiał został podzielony na trzy części: Rozpoznawanie wzorców, Rozpoznawanie obrazu, Rozpoznawanie sygnałów mowy. W pierwszej części omówiono podstawy teoretyczne i skoncentrowano się na zagadnieniu klasyfikacji wzorców. Druga część jest poświęcona metodom segmentacji obrazu i strategiom rozpoznawania 2- i 3-wymiarowych obiektów. W części trzeciej przedstawiono metody detekcji sygnału mowy, wyznaczania cech dla ramek sygnału, modelowania fonetycznego mowy oraz rozpoznawania sekwencji fonemów i słów.

Podręcznik zawiera liczne algorytmy analizy i wiele rysunków, obrazujących omawiane zagadnienie, oraz zadań.


SPIS TREŚCI:

Przedmowa 9

I. ROZPOZNAWANIE WZORCÓW 11

1. Podstawy rozpoznawania wzorców 13
1.1. Wprowadzenie 13
1.2. Pojęcie wzorca 14
1.3. Paradygmaty rozpoznawania wzorców 16
1.4. Analiza cyfrowych obrazów 20
1.5. Analiza sygnałów mowy 23
1.6. Statystyka sygnału/obrazu mowy 30
1.7. Próbkowanie i digitalizacja sygnału analogowego 35
1.8. Wybrane problemy optymalizacji 38
1.9. Zadania 41
Literatura uzupełniająca 43

2. Klasyfikacja prostych wzorców 45
2.1. Wprowadzenie 45
2.2. Przekształcenia wzorca zależne od dziedziny (*) 45
2.3. Problem klasyfikacji prostego wzorca 52
2.4. Klasyfikator według funkcji potencjału 55
2.5. Klasyfikator statystyczny Bayesa 58
2.6. Klasyfikator według minimalnej odległości 61
2.7. Klasyfikator "według k sąsiadów" 62
2.8. Maszyna wektorów wspierających SVM (*) 63
2.9. Klasyfikacja neuronowa 69
2.10. Zadania 78
Literatura uzupełniająca 79

II. ROZPOZNAWANIE OBRAZÓW 81

3. Reprezentacja obrazu cyfrowego 83
3.1. Akwizycja obrazu dla 3-wymiarowej sceny 83
3.2. Wewnętrzna reprezentacja obrazu 88
3.3. Zewnętrzna reprezentacja obrazu 91
3.4. Zadania 101
Literatura uzupełniająca 105

4. Segmentacja obrazu i detekcja cech 106
4.1. Przekształcenia początkowe obrazu 106
4.2. Obraz krawędziowy 112
4.3. Segmenty liniowe 123
4.4. Przekształcenia Hougha 130
4.5. Obszary jednorodne obrazu 136
4.6. Tekstura w obrazie 140
4.7. 2-wymiarowe kształty 146
4.8. Zadania 152
Literatura uzupełniająca 155

5. Rozpoznawanie 2- i 3-wymiarowych obiektów 157
5.1. Sekwencja wzorców i programowanie dynamiczne 157
5.2. Rozpoznawanie znanego obiektu sztywnego 162
5.3. Przeszukiwanie przestrzeni rozwiązań 167
5.4. Rozpoznawanie 3-wymiarowego obiektu o parametrycznym modelu (*) 169
5.5. Zadania 175
Literatura uzupełniająca 177

6. Estymacja ruchu w sekwencji obrazów 178
6.1. Wprowadzenie 178
6.2. Detekcja i estymacja ruchu w obrazie 178
6.3. Optyczny potok 180
6.4. Ruch dyskretnych cech obrazu 184
6.5. Zadania 189
Literatura uzupełniająca 191

III. ROZPOZNAWANIE SYGNAŁÓW MOWY 193

7. Reprezentacja sygnału mowy 195
7.1. Reprezentacja cyfrowego sygnału mowy 195
7.2. Układ słuchu człowieka 196
7.3. Transformata Fouriera 197
7.4. Transformata falkowa (*) 203
7.5. Zewnętrzna reprezentacja cyfrowego dźwięku 207
7.6. Zadania 208
Literatura uzupełniająca 209

8. Detekcja sygnału mowy 210
8.1. Usuwanie szumu i normowanie sygnału mowy 210
8.2. Cechy sygnału w dziedzinie czasu 213
8.3. Zadania 217
Literatura uzupełniająca 218

9. Wyznaczanie cech sygnału mowy 219
9.1. Cechy mel-cepstralne sygnału mowy 219
9.2. Cechy według liniowej predykcji (LPC) 227
9.3. Klasyfikacja cech ramki 230
9.4. Częstotliwość podstawowa mówcy 234
9.5. Zadania 237
Literatura uzupełniająca 238

10. Akustyczno-fonetyczny model mowy 239
10.1. Fonetyczne kategorie dźwięków 239
10.2. Typowe spektrogramy dla grup fonemów 242
10.3. Dekompozycja fonemu zależna od kontekstu 247
10.4. Zadania 249
Literatura uzupełniająca 250

11. Rozpoznawanie słów i zdań 251
11.1. Wprowadzenie 251
11.2. Metoda „marszczenia czasu” 251
11.3. Rozpoznawanie jako statystyczne wnioskowanie 253
11.4. Przeszukiwanie Viterbiego 261
11.5. Uczenie modelu HMM (*) 263
11.6. Zadania 268
Literatura uzupełniająca 270

Literatura podstawowa 271
Skorowidz 272