Statystyczne modelowanie zawartości dokumentów tekstowych

Autor:
Paweł Lula
Wydawcy:
Wydawnictwo Uniwersytetu Ekonomicznego w Krakowie (2018)
IBUK Libra (2018)
ISBN:
978-83-7252-755-4
Autotagi:
dokumenty elektroniczne
druk
e-booki
książki
publikacje naukowe

W monografii przedstawiono zagadnienia dotyczące opisu treści dokumentów tekstowych za pomocą modeli statystycznych. Modele te znajdują zastosowanie we wszystkich warstwach języka – od warstwy morfologicznej, przez warstwę frazeologiczną i syntaktyczną, aż po warstwę semantyczną. Są przydatne do rozwiązywania różnych typów zadań, przy czym za najważniejsze zadanie należy uznać wyznaczanie podobieństwa pomiędzy wyrazami, zdaniami czy całymi dokumentami. Odpowiednio skonstruowany model może z powodzeniem opisywać zawartość pojedynczego dokumentu lub zbioru dokumentów określanego mianem korpusu. Pozwala również na ekstrakcję, porównywanie czy klasyfikowanie informacji pochodzących z dokumentów. Może stanowić także narzędzie służące do zmiany ich formy, czego przykładem może być automatyczna identyfikacja słów kluczowych lub wizualizacja. W pracy zaprezentowano wyniki przeprowadzonych prac obliczeniowych, które w każdym przypadku dotyczyły analizy dokumentów polskojęzycznych i zostały zrealizowane przy użyciu narzędzi dostępnych w języku R. Pozwoliło to na ocenę tych produktów pod względem ich przydatności do analizy tekstów przygotowanych w rodzimym języku. Przedstawione wyniki badań potwierdzają przydatność zaprezentowanych metod do analizy dokumentów przygotowanych w języku polskim.
Więcej...
Wypożycz w bibliotece
Dostęp online
Brak zasobów elektronicznych
dla wybranego dzieła.
Dodaj link
Kup
Brak ofert.
Recenzje

Brak recenzji - napisz pierwszą.

Nikt jeszcze nie obserwuje nowych recenzji tego dzieła.
Okładki
Kliknij na okładkę żeby zobaczyć powiększenie lub dodać ją na regał.

Projekt współfinansowany ze środków Unii Europejskiej w ramach Europejskiego Funduszu Rozwoju Regionalnego
Dotacje na innowacje - Inwestujemy w Waszą przyszłość
foo