mapa myśli macierz błędów wskaźniki dokładność czułość precyzja

No dobrze, klasyfikuję tekst za pomocą metod machine learning. Ale raz to działa, a raz nie działa. Pojawiają się błędy. Jak sprawdzić, czy te błędy są duże? Które kategorie są najczęściej niedoszacowane? A do których trafiają najczęściej nasze teksty? Jaka jest dokładność naszej klasyfikacji?

Z jak najdokładniejszą analizą jakości naszej klasyfikacji pomoże nam macierz błędów (inaczej zwana tablicą pomyłek, a po angielsku confusion matrix).

Czytaj dalej
Please follow and like us:

grupa ucząca, walidacyjna, testowa

Cofnijmy się o jeden kroczek. Bo napisałam już ogólnie o machine learning. Napisałam również o klasyfikacji tekstu. Nie wspomniałam jednak ani słowem czym jest grupa ucząca, walidacyjna i testowa. A to przecież jedna z podstawowych informacji, które warto zrozumieć, kiedy zabieramy się za tematykę machine learning. Zwłaszcza, że przyda się nie tylko w przypadku klasyfikacji.

Czytaj dalej
Please follow and like us:

pojęcia z - ustawa o statystyce publicznej

Już jakiś czas temu opublikowałam wpis, w którym wyjaśniałam co to takiego jest GUS. Dzisiaj postanowiłam pójść o krok dalej i przeanalizować trochę dokładniej, o czym mówi ustawa o statystyce publicznej. Biorąc pod uwagę, że wszyscy bierzemy udział w spisach powszechnych, że wielu z nas podaje swoje dane w różnych urzędach – ustawa ta dotyczy każdego z nas. A jeśli ktoś chce pracować w ogranach statystyki publicznej – to dotyczy go jeszcze bardziej. Czytaj dalej

Please follow and like us: