Streszczenia

Prof. Adam Przepiórkowski, Instytut Podstaw Informatyki PAN, Uniwersytet Warszawski
Lingwistyka formalna – po co?

Wykład poświęcony będzie formalnemu podejściu do lingwistyki, szczególnie do składni i semantyki. Przedstawione zostaną założenia takiego podejścia oraz powody, dla którego warto takie podejście stosować. Powód ważny dla lingwistów teoretycznych jest taki, że język naturalny (polski, angielski czy warlpiri) jest zbyt skomplikowany, by jego opis mógł być sformułowany w nieprecyzyjnym i wieloznacznym… języku naturalnym. Języki formalne pozwalają nie tylko na zwiększenie precyzji i jednoznaczności opisu języków naturalnych, ale także na komputerowe badanie wewnętrznej spójności i poprawności takich opisów. W tym kontekście wspomnę o pracach prowadzonych w Zespole Inżynierii Lingwistycznej IPI PAN, dotyczących formalnego opisu aspektów języka polskiego, oraz o kursach składni i semantyki formalnej oferowanych w ramach programu Kognitywistyka na UW.

 

Dr Piotr Pęzik, Uniwersytet Łódzki
Formalne, dystrybucyjne i psycholingwistyczne opisy frazeologii

Tematem wystąpienia jest szeroko rozumiana formuliczność jako podstawowy aspekty użycia języka, który nie poddaje się łatwo opisom formalnym. Omówione zostaną pokrótce wybrane kryteria formalne (semantyczne, składniowe, fonologiczne), dystrybucyjne (częstość, siła powiązania, równomierność, niezależność) i psycholingwistyczne (reprodukcja, płynność, torowanie) identyfikacji jednostek frazeologicznych. Szczególna uwaga zostanie poświęcona korpusowym metodom generowania baz kolokacji (np. Hask i Phrime) jako zasobów dokumentujących poziom reprodukcji frazeologicznej w języku, a także dystrybucyjnym miarom niekompozycyjności frazemów.

 

Dr hab. Magdalena Derwojedowa, Uniwersytet Warszawski
Mały korpus historyczny i czego możemy się z niego dowiedzieć

Przedstawię mały (jeden milion segmentów) korpus tekstów z lat 1830–1918. Jest on podzielony na pięć równolicznych podkorpusów, z których każdy liczy 200 próbek o długości ok. jednego tysiąca segmentów. Jego podstawowym zastosowaniem było dostarczenie danych do poszerzenia analizatora morfologicznego Morfeusz 2.0. Korpus został oznakowany, dzięki czemu można go przeszukiwać w wyszukiwarce korpsuowej Poliqarp. Tak niewielki zbiór tekstów, o stosunkowo dużych próbkach, nie umożliwia badań leksykalnych, ale można za jego pomocą badać na przykład zjawiska morfologiczne, ortograficzne czy składniowe – jak choćby stosowanie obocznych końcówek -im/-ym i -em/-ém przymiotników, kreskowanie é czy typy zdań podrzędnych. Przykłady takich badań będą ilustracją wystąpienia.

 

Prof. Barbara Lewandowska-Tomaszczyk, Państwowa Wyższa Szkoła Zawodowa w Koninie
Dane ilościowe jako podstawa semantycznych modeli emotywnych

Celem artykułu jest prezentacja podstaw metodologii badań nad znaczeniem pojęć wyrażających emocje i uczucia, konstruowanej na podstawie badania danych ilościowych. Przedstawione zostaną badania statystyczne kwestionariuszy GRID (Centrum Badań Afektywnych, Genewa) (Fontaine, Scherer 2013) oraz badania danych korpusowych, szczególnie analiza frazeologii i frekwencje kolokacji generowanych z korpusów brytyjskich (BNC, monitorcorpus.com), amerykańskiego (COCA) (Wilson, Lewandowska-Tomaszczyk, Nija 2013) i korpusów polskich (Narodowy Korpus Języka Polskiego, Pelcra-CLARIN, monco.frazeo.pl) (Pęzik 2014, 2015), oraz wyników zadań online polegających na sortowaniu i rankingu badanych form (Node XL), zarówno w aspekcie monolingwalnym, jak również w ujęciu kontrastywnym polsko-angielskim (Wilson, Lewandowska-Tomaszczyk 2017). Głównym założeniem pracy jest obecność znaczeń nieostrych w semantyce językowej oraz konieczność interpretacji znaczeń emotywnych w kognitywnych terminach pojęć prototypowych z jednej strony, a klasterów znaczeniowych z drugiej. Wymaga to sięgnięcia do kategorii językoznawstwa kognitywnego oraz kulturowych modeli uczuć (emocji) i zdarzeń emotywnych (Lewandowska-Tomaszczyk-Tomaszczyk, Wilson 2013, 2016). Zadaniem badawczym jest sprawdzenie, do jakiego stopnia metody ilościowe pozwalają na uściślenie wniosków wynikających z analiz jakościowych, i zbudowanie bardziej predyktywnych modeli zarówno pojedynczych emocji, jak również bardziej złożonych klasterów emotywnych (Lewandowska-Tomaszczyk 2012). Modele takie znajdują zastosowanie w robotyce (Lewandowska-Tomaszczyk, Wilson 2016, 2016a, w druku, Wilson, Lewandowska-Tomaszczyk 2017), są używane do modelowania rozpoznawania i produkowania przekazów emotywnych.

Wybrana bibliografia

  • Fontaine, JohnnyJ.R., Scherer, Klaus R. 2013: The global meaning structure of the emotion domain: Investigating the complementarity of multiple perspectives on meaning. W: Fontaine, Johnny J.R., Scherer, Klaus R., Soriano, Cristina (red.) Components of Emotional Meaning: A Sourcebook. Oxford: Oxford University Press, s. 106-125.
  • Lewandowska-Tomaszczyk, Barbara 2012: Explicit and Tacit – An Interplay of the Qualitative and Quantitative Approaches to Translation. W Quantitative Methods in Corpus-Based Translation Studies, Oakes, Michael, Ji, Meng (red.). Amsterdam: Benjamins, s. 3-33.
  • Lewandowska-Tomaszczyk, Barbara,Wilson, Paul A. 2013: English ‘Fear’ and Polish ‘Strach’ in Contrast: GRID Approach and Cognitive Corpus Linguistic Methodology. W: Fontaine, Johnny, Scherer, Klaus, Soriano, Cristina (red.) Components of Emotional Meaning: A Sourcebook, Oxford: Oxford University Press. s. 425-436.
  • Lewandowska-Tomaszczyk, Barbara, Wilson, Paul A. 2016: Compassion, empathy and sympathy expression features in affective robotics. 7th IEEE International Conference on Cognitive Infocommunications (CogInfoCom), s. 65-70 doi: 10.1109/CogInfoCom.2016.7804526.
  • Lewandowska-Tomaszczyk, Barbara, Wilson, Paul A. 2016a. Physical and Moral Disgust in Socially Believable Behaving Systems in Different Cultures’. W: A. Esposito & L. Jain (red.), Socially Believable Behaving Systems. New York: Springer, s. 105-132.
  • Lewandowska-Tomaszczyk, Barbara,Wilson, Paul A. (w druku): Compassion cluster expression features in affective robotics from a cross-cultural perspective. W: Peter Baranyi, Richard Klempous & Jan Nikodem (red.). Cognitive Infocommunications, theory and applications. Singapore: Springer, s. 202-227.
  • Pęzik, Piotr 2014. Graph-Based Analysis of Collocational Profiles. W: V. Jesenšek and P. Grzybek (red.) Phraseologie im Wörterbuch und Korpus / Phraseology in Dictionaries and Corpora, ZORA 97. Maribor, Bielsko-Biała, Budapest, Kansas, Praha: Filozofska fakuteta, s. 227-243.
  • Pęzik, Piotr 2015. Spokes – a Search and Exploration Service for Conversational Corpus Data. W: Selected Papers from CLARIN 2014. Linköping Electronic Conference Proceedings. Linköping University Electronic Press, Linköpings universitet, 99–109. http://www.ep.liu.se/ecp_article/index.en.aspx?issue=116;article=009.
  • Wilson, Paul & Barbara Lewandowska-Tomaszczyk 2012. The Nature of Emotions. W: Wilson, Paul W. Dynamicity in Emotion Concepts. [Lodz Studies in Language vol. 25]. Frankfurt am Main: Peter Lang, s. 13-36.
  • Wilson, Paul A., & Lewandowska-Tomaszczyk, Barbara 2017. Pride in British English and Polish: A cultural-linguistic perspective. W: Farzad Sharifian (red.). Advances in Cultural Linguistics. Singapore: Springer, s. 247-288.
  • Wilson, Paul A., Lewandowska-Tomaszczyk, Barbara, Nijya, Yu 2013: Happiness and contentment in English and Polish. W: Components of Emotional Meaning: A Sourcebook, Johnny Fontaine, Klaus Scherer & Cristina Soriano (red.). Oxford: Oxford University Press, s. 477-481.