[SlawKaus] Workshop NLP/digital humanities Polnisch
Ruprecht von Waldenfels
ruprecht.waldenfels at uni-jena.de
Fr Okt 23 07:48:46 CEST 2020
Liebe Alle,
für diejenigen, die sich für die Anwendung computerlinguistischer
Werkzeuge auf polnisches Textmaterial interessieren, sei auf folgenden
Workshop/folgende Schulung hingewiesen.
Mit freundlichen Grüßen,
Ruprecht von Waldenfels
Prof. Dr. Ruprecht von Waldenfels
Aleksander-Brückner-Zentrum für Polenstudien
Friedrich-Schiller-Universität Jena
Ernst-Abbe-Platz 8
D-07743 Jena
Studieren Sie Polen!
www.polenstudien.de
-------- Weitergeleitete Nachricht --------
Betreff: [Ling] Warsztaty CLARIN-PL (19-20 XI 2020r.) - zaproszenie
Datum: Thu, 22 Oct 2020 21:02:00 +0200
Von: CLARIN-PL <clarin-pl at pwr.edu.pl>
An: LING <ling at nlp.ipipan.waw.pl>
Szanowni Państwo,
zapraszamy do uczestnictwa w wirtualnych warsztatach organizowanych
przez CLARIN-PL.
*
data warsztatów: 19-20 listopada 2020
*
godziny trwania: orientacyjnie 9:30-17:00
*
miejsce: warsztaty online (o szczegółach poinformujemy
zarejestrowanych uczestników)
*
rejestracja: FORMULARZ
<https://forms.gle/NtgbKWfRh8q8RuJt6><https://forms.gle/NtgbKWfRh8q8RuJt6>(https://forms.gle/NtgbKWfRh8q8RuJt6)
*
opłaty: warsztaty są bezpłatne
*
organizatorzy: Centrum Technologii Językowych CLARIN-PL,
PolLinguaTec –Centrum Wiedzy CLARIN Technologii Językowej dla Języka
Polskiego
*
zgłoszenia przyjmujemy do 12 listopada
Warsztaty są skierowane do pracowników naukowych i doktorantów chcących
w swoich pracach badawczych oraz działalności dydaktycznej wykorzystać
technologię wspomagającą analizę zbiorów tekstów i nagrań mowy, tzw.
przetwarzania języka naturalnego (NLP –Natural Language Processing). Do
udziału zapraszamy przede wszystkim przedstawicieli nauk humanistycznych
i społecznych potrzebujących wsparcia w następujących działaniach:
*
tworzenie statystyk opisujących zbiory tekstów (słownictwo, związki
wyrazowe, kolokacje, konkordancje, listy frekwencyjne, tematyka i
wiele innych);
*
projektowanie krok po kroku badań z zakresu nauk społecznych i
humanistycznych z uwzględnieniem metod analizy ilościowej zbiorów
tekstów (korpusów) i mowy, a także analizy jakościowej wspieranej
maszynowym identyfikowaniem i wydobywaniem przykładów, cech
charakterystycznych, tendencji, itp.;
*
tworzenie, zarządzanie i anotacja (kodowanie, znakowanie) zbiorów
tekstów (korpusów);
*
wykorzystanie danych językowych i danych wydobytych z zapisów języka
(tekst i mowa) w badaniach społecznych i psychologicznych;
*
analiza tekstów: stylometryczna (m.in. autorstwo, styl, pochodzenie,
ślad społeczno-kulturowy) oraz tematyczna (w tym topic modeling);
*
identyfikacja określonych typów informacji w dużych kolekcjach
tekstów –maszynowa analiza treści kolekcji tekstów wg kryteriów badacza;
*
badania dyskursologiczne, genologiczne, tekstologiczne, semantyczne
przy zastosowaniu analiz ilościowych;
*
analiza wizerunku, obrazu świata, konceptu na podstawie danych
językowych;
*
wykorzystanie danych tekstowych w badaniach diachronicznych (nauki
historyczne, historia sztuki, historia języka i literatury itp.);
*
korzystanie ze słowników relacyjnych (wordnetów) jako narzędzi
badawczych oraz tworzenie własnych słowników;
*
praca z tekstami poddanymi procesowi optycznego rozpoznawania znaków
(OCR –optical character recognition);
*
przetwarzanie i analiza języka mówionego,
*
realizacja nieznanych nam jeszcze marzeń badawczych powiązanych z tą
dziedziną.
Dzięki możliwościom wynikającym z wirtualnego charakteru warsztatów,
planujemy poprowadzenie zajęć zarówno dla użytkowników początkujących,
którzy nie są zorientowani w tematyce przetwarzania języka, jak też dla
bardziej doświadczonych badaczy chcących rozszerzyć swoją wiedzę w tym
obszarze.W programie przewidujemy między innymi:
*
blok wprowadzający w tematykę przetwarzania języka naturalnego:
“CLARIN-PL: poznajmy się!”. W ramach zajęć składających się na ten
cykl chcielibyśmy zapewnić dostęp do podstawowej wiedzy oraz wskazać
możliwości wykorzystania infrastruktury. W skład bloku wejdą: wykład
wprowadzający, prezentacja dotychczasowych przykładów zastosowania
infrastruktury badawczej, konsultacje z twórcami narzędzi i zasobów,
konsultacje z doświadczonymi użytkownikami infrastruktury, wspólna
refleksja nad relacją między humanistyką cyfrową a rozwojem
technologii przetwarzania języka;
*
omówienie zasobów i narzędzi CLARIN: podczas szeregu prezentacji
postaramy się przybliżyć Państwu najważniejsze zasoby, narzędzia i
aplikacje dostępne za pośrednictwem CLARIN-PL oraz CLARIN ERIC;
*
czas na indywidualne konsultacje z pracownikami CLARIN oraz
doświadczonymi użytkownikami;
*
możliwość utworzenie sesji pod kątem potrzeb i marzeń badawczych
grup użytkowników.
Warsztaty (a także wszelkie usługi świadczone przez Centrum Technologii
Językowych CLARIN-PL) są bezpłatne (sponsoruje MNiSW). Obowiązuje
rejestracja przez FORMULARZ
<https://forms.gle/NtgbKWfRh8q8RuJt6>(https://forms.gle/NtgbKWfRh8q8RuJt6)
. W przypadku dużej liczby chętnych organizatorzy zastrzegają sobie
możliwość przeprowadzenia kwalifikacji na podstawie informacji
pozyskanych przez formularz (zainteresowania badawcze, aktywność
naukowa). Informacje te posłużą również organizatorom do dostosowania
programu warsztatów do potrzeb uczestników.
W przypadku pytań i sugestii prosimy o kontakt: jan.wieczorek at pwr.edu.pl
<mailto:jan.wieczorek at pwr.edu.pl>
Zapraszamy serdecznie!
Zespół CLARIN-PL
www.clarin-pl.eu
-------------- nächster Teil --------------
Ein Dateianhang mit HTML-Daten wurde abgetrennt...
URL: <https://lserv.uni-jena.de/pipermail/slawkaus/attachments/20201023/c8dbea7f/attachment-0001.html>
Mehr Informationen über die Mailingliste SlawKaus