PSI

 0    41 fiszek    mateuszzarzecznymodliborzyce
ściągnij mp3 drukuj graj sprawdź się
 
Pytanie język polski Odpowiedź język polski
Drzewo decyzyjne
rozpocznij naukę
Model uczenia nadzorowanego podejmujący decyzje poprzez sekwencję pytań o cechy danych
Elementy drzewa decyzyjnego
rozpocznij naukę
Składa się z korzenia węzłów decyzyjnych oraz liści zawierających decyzję
Zasada działania drzewa
rozpocznij naukę
Dane są dzielone według cech tak aby jak najlepiej rozdzielić klasy lub zminimalizować błąd
Overfitting
rozpocznij naukę
Zbyt dobre dopasowanie modelu do danych treningowych skutkujące słabą generalizacją
Jak przeciwdziałać overfittingowi
rozpocznij naukę
Ograniczyć głębokość drzewa zastosować przycinanie lub minimalną liczbę próbek
Bagging
rozpocznij naukę
Metoda zespołowa polegająca na trenowaniu wielu modeli na losowych próbkach danych
Cel baggingu
rozpocznij naukę
Zmniejszenie wariancji modelu i ograniczenie overfittingu
Random Forest
rozpocznij naukę
Zespół drzew decyzyjnych uczonych metodą baggingu z losowym wyborem cech
Gradient Boosting
rozpocznij naukę
Metoda zespołowa w której kolejne modele uczą się na błędach poprzednich
Cel gradient boosting
rozpocznij naukę
Minimalizacja błędu poprzez stopniowe poprawianie słabych modeli
SVM
rozpocznij naukę
Metoda klasyfikacji i regresji oparta na maksymalizacji marginesu między klasami
SVR
rozpocznij naukę
Wersja regresyjna SVM przewidująca wartości ciągłe z tolerancją błędu
Różnica SVM i SVR
rozpocznij naukę
SVM służy do klasyfikacji a SVR do regresji
Model liniowy
rozpocznij naukę
Model opisujący zależność liniową pomiędzy cechami a wynikiem
Model wielomianowy
rozpocznij naukę
Model umożliwiający opisywanie zależności nieliniowych
Zmiana modelu liniowego na wielomianowy
rozpocznij naukę
Zwiększa elastyczność modelu ale grozi overfittingiem
Klasyfikacja
rozpocznij naukę
Przypisywanie obiektów do jednej z określonych klas
Regresja
rozpocznij naukę
Przewidywanie wartości liczbowych ciągłych
Klasteryzacja
rozpocznij naukę
Grupowanie danych bez etykiet na podstawie podobieństwa
Różnica klasyfikacji i klasteryzacji
rozpocznij naukę
Klasyfikacja używa etykiet a klasteryzacja nie
K means
rozpocznij naukę
Algorytm klasteryzacji dzielący dane na k klastrów minimalizując odległość od centroidów
Wady K means
rozpocznij naukę
Wymaga podania liczby klastrów i jest wrażliwy na obserwacje odstające
Klasteryzacja hierarchiczna
rozpocznij naukę
Metoda tworząca hierarchię klastrów poprzez ich łączenie lub dzielenie
Klasteryzacja gęstościowa
rozpocznij naukę
Metoda oparta na zagęszczeniu punktów danych np DBSCAN
Różnica hierarchicznej i gęstościowej
rozpocznij naukę
Hierarchiczna tworzy strukturę drzewa a gęstościowa wykrywa skupiska
Macierz pomyłek
rozpocznij naukę
Tabela przedstawiająca poprawne i błędne decyzje klasyfikatora
True Positive
rozpocznij naukę
Poprawnie wykryta klasa pozytywna
False Positive
rozpocznij naukę
Błędnie wykryta klasa pozytywna
False Negative
rozpocznij naukę
Niewykryta klasa pozytywna
True Negative
rozpocznij naukę
Poprawnie wykryta klasa negatywna
Accuracy
rozpocznij naukę
Stosunek poprawnych predykcji do wszystkich predykcji
Precision
rozpocznij naukę
Udział poprawnych predykcji pozytywnych we wszystkich pozytywnych
Recall
rozpocznij naukę
Udział wykrytych przypadków pozytywnych
F1 score
rozpocznij naukę
Średnia harmoniczna precision i recall
Zastosowanie precision
rozpocznij naukę
Stosowana gdy ważne jest ograniczenie fałszywych alarmów
Zastosowanie recall
rozpocznij naukę
Stosowana gdy ważne jest wykrycie wszystkich przypadków
Regresja liniowa
rozpocznij naukę
Model opisujący liniową zależność pomiędzy zmiennymi
Założenie regresji liniowej
rozpocznij naukę
Reszty mają rozkład normalny i stałą wariancję
Regresja odporna
rozpocznij naukę
Regresja niewrażliwa na obserwacje odstające
Błąd średniokwadratowy
rozpocznij naukę
Miara jakości regresji oparta na średnim kwadracie błędów
Różnica regresji i klasyfikacji
rozpocznij naukę
Regresja przewiduje wartości a klasyfikacja klasy

Musisz się zalogować, by móc napisać komentarz.