Notatki do babika - PDF

Summary

These notes cover elements of general linguistics, theory of JIW, and basic JIW types. They define language as a system of signs, distinguishing between natural and conventional signs. The document explores the nature of language and the roles of different branches of linguistics.

Full Transcript

23.10.2024 29.01.2024 —> egzamin Wkład w dziedzinę bibliologii Prof Tadeusz Ścibor. Prof. Migoń Prof Sosińska- Karata (kody semantyczne) Prof Pindlowa Ranganathan Jadwiga Sadowska Jad...

23.10.2024 29.01.2024 —> egzamin Wkład w dziedzinę bibliologii Prof Tadeusz Ścibor. Prof. Migoń Prof Sosińska- Karata (kody semantyczne) Prof Pindlowa Ranganathan Jadwiga Sadowska Jadwiga Woźniak-Kasperek 1. Elementy językoznawstwa ogólnego 2. Teoria jiw 3. Podstawowe typy jiw ad 1. Język jest to system znaków - Ferdinand de Saussure - nie żyje, Swiss linguist Znak to pewna treść wyrażana w jakiejś formie Podział znaków - Znaki naturalne (związane z przyrodą pogodą etc) — symptomy — obrazy - Znaki konwencjonalne (wymyślone przez ludzi) Znaki tworzą system ! Cechy znaków: - Arbitralność - Semantyczność 23.10.2024 1 - Dwustopniowość struktury - cegiełki - budulec struktur bardziej skomplikowanych - Autonomiczność - każdy znak rozwija się według własnych reguł - Kreacyjność - możemy za pomocą języka wymyślać różne rzeczy Definicja języka naturalnego: Język to system przekazywanych kulturowo sygnałów konwencjonalnych (umowny) służących do porozumiewania się w obrębie danej społeczności. Jest to kod dwuklasowy i semantyczny, cechujący się autonomicznością i kreacyjnością 1. Semiotyka Semiotyka jako nauka bada dowolne systemy znaków, ich cechy wspólne (kod telegraficzny, sygnalizacja flagowa, znaki drogowe, dystynkcje wojskowe, języki gestów itd.). 2. Semantyka Współcześnie semantyka traktowana jest jako dyscyplina naukowa zajmująca się znaczeniem, tj. problemem przyporządkowywania znaków językowych szeroko rozumianym obiektom pozajęzykowym. 3. Pragmatyka Pragmatyka (językowa) to gałąź semiotyki, która opisuje relacje między nadawcą i odbiorcą tekstu a systemem znakowym. Semiotyka z kolei jest nauką o znakach, faktycznie o systemach znaków, czyli o systemach semiotycznych (takim pierwotnym systemem znaków jest np. język naturalny). 4. Gramatyka Reguły warunkujące użycie języka 5. Semiologia dział logiki badający systemy znaków, dzielący się na syntaktykę, semantykę i pragmatykę. 6. Językoznawstwo Językoznawstwo jest nauką o języku, o jego naturze i funkcjach, o jego 23.10.2024 2 strukturze wewnętrznej i prawidłowościach rozwoju. 7. Działy językoznawstwa: Fonetyka - badanie dźwięków mowy Fonologia - badanie systemu dźwięków w języku Morfologia - badanie struktury wyrazów Składnia - badanie struktury zdań Semantyka - badanie znaczeń Pragmatyka - badanie użycia języka w kontekście Leksykologia - badanie słownictwa Etymologia - badanie pochodzenia wyrazów 8. Definicje języka Język jest najbardziej złożonym i najszerzej stosowanym zorganizowanym systemem znaków, służącym do porozumiewania się w obrębie danej grupy ludzi (społeczności posługującej się określonym językiem). 9. Kod Powiązane ze sobą i uporządkowane znaki tworzą system, tj. kod [kod, z łac, codex, caudex księga; wykaz” — system znaków odczytywanych wg ustalonego kluczaj. 10. Szyfr W językoznawstwie, szyfr to specyficzny rodzaj kodu, w którym informacja jest celowo ukryta lub zamaskowana. Jest to system przekształcania wiadomości w formę niezrozumiałą dla osób nieposiadających klucza deszyfrującego. W kontekście lingwistycznym, szyfry są często badane jako przykłady sztucznych systemów komunikacji, które mogą dostarczyć wglądu w strukturę i funkcjonowanie języków naturalnych. 11. Funkcje języka Funkcja komunikacyjna (porozumiewawcza) Funkcja ekspresywna (wyrażanie emocji) 23.10.2024 3 Funkcja impresywna (wpływanie na odbiorcę) Funkcja poznawcza (reprezentacja rzeczywistości) Funkcja fatyczna (nawiązywanie i podtrzymywanie kontaktu) Funkcja metajęzykowa (mówienie o samym języku) Funkcja poetycka (estetyczna) 1. Relacje w języku Relacje funkcjonalne: Metajęzyk Metainformacja Relacje strukturalne: System leksykalny System słownikowy Relacje semantyczne: Denotacja Konotacja Polisemia Synonimia Homonimia Antonimia 2. Funkcje języka naturalnego Funkcje języka naturalnego to: Funkcja komunikacyjna (porozumiewawcza) Funkcja ekspresywna (wyrażanie emocji) Funkcja impresywna (wpływanie na odbiorcę) Funkcja poznawcza (reprezentacja rzeczywistości) 23.10.2024 4 Funkcja fatyczna (nawiązywanie i podtrzymywanie kontaktu) Funkcja metajęzykowa (mówienie o samym języku) Funkcja poetycka (estetyczna) 3. Znak Znak jest zasadą języka. 4. Podziały znaków podział znaków ze względu na uczestniczące w ich odbiorze zmysły na znaki wzrokowe (flagi, znaki drogowe, nuty, alfabet Morse'a), słuchowe (hejnał, hymn państwowy, sygnały różnych rozgłośni telewizyjnych i radiowych), węchowe (zapach metanu jako znak ostrzegawczy dla górników, różnego rodzaju zapachy), dotykowe (uścisk. dłoni, poklepanie po plecach, pocałunek, alfabet Braille'a) i smakowe (smaki potraw, win). 5. Cechy znaków językowych: Arbitralność - umowność związku między formą a treścią znaku Konwencjonalność - ustalone w danej społeczności znaczenie znaku Systemowość - funkcjonowanie w ramach szerszego systemu znaków Dwuklasowość - możliwość tworzenia złożonych struktur z prostszych elementów Produktywność - zdolność do tworzenia nowych znaków i znaczeń Semantyczność - posiadanie określonego znaczenia 6. Funkcje znaków/systemów znakowych poznawcza (aka opisowa, symboliczna) estetyczna (aka poetycka) ekspresywna impresywna (aka sugestywna) fatyczna 23.10.2024 5 metajęzykowa performatywna 7. Znaczenie w języku Znaczenie dosłowne to własność elementów języka. Dosłowne znaczenie pewnego ciągu słów jest wyznaczone przez jego własności gramatyczne i znaczenie, które konwencjonalnie przypisujemy poszczególnym słowom. 8. Treść i zakres nazwy wszystkie cechy charakterystyczne dla danej nazwy, na które składają się cechy konstytutywne oraz konsekutywne. Konstytutywne odróżniają nazwę od innych nazw, natomiast konsekutywne to cechy uzupełniające. Dają one dodatkową charakterystykę danej nazwy. 9. Plan treści Plan treści to koncepcja w językoznawstwie odnosząca się do znaczeniowej lub pojęciowej strony języka, w przeciwieństwie do planu wyrażania, który dotyczy formy językowej. Jest to abstrakcyjny poziom języka, na którym organizowane są idee i znaczenia przed ich wyrażeniem w konkretnej formie językowej. 10. Plan wyrażania Plan wyrażania to aspekt języka odnoszący się do jego formy i struktury, czyli sposobu, w jaki myśli i znaczenia są wyrażane poprzez dźwięki, słowa i konstrukcje gramatyczne. Jest to przeciwieństwo planu treści, który dotyczy znaczeniowej strony języka. 11. Pole semantyczne zazwyczaj uporządkowany wewnętrznie pod względem paradygmatycznym i syntagmatycznym zbiór wyrazów powiązanych piży. należnością do wspólnej kategorii znaczeniowej 1. Denotacja denotacja — zakres nazwy, czyli zbiór wszystkich jej desygnatów, tj. 23.10.2024 6 przedmiotów, do których ta nazwa się odnosi] 2. Konotacja Konotacja to dodatkowe, pozadosłowne znaczenie lub skojarzenia przypisywane słowu lub wyrażeniu, które wykraczają poza jego podstawową definicję. Obejmuje emocjonalne, kulturowe lub kontekstowe aspekty znaczenia, które mogą się różnić w zależności od odbiorcy lub sytuacji. 3. Polisemia Wieloznaczność (polisemia) polega na tym, że dany leksem ma kilka (co najmniej dwa — wtedy mówi się o „dwuznaczności” jako szczególnym przypadku polisemii) dających się wyodrębnić znaczeń (zakresów znaczeniowych), które — łącznie -- dają się podporządkować określonemu pojęciu nadrzędnemu. 4. Synonimia synonimia (równoznaczność i bliskoznaczność wyrazów, np. synonimami są dla siebie wyrazy przykry i nieprzyjemny czy samochód i auto), 5. Homonimia homtonimia (zbieżność formy dwóch różnych wyrazów -- homonimami są np. wyrazy rola *ziemia” i rola teatralna lub filmowa”) 6. Antonimia autonimia (przeciwieństwo znaczeniowe — antonimami względem siebie są wyrazy dzień i noc czy wysoki i niski) 7. Język sztuczny język skonstruowany przez ludzi w cełu stworzenia systemu, który by nie miał wad języka naturalnego i mógł służyć wszystkim narodom jako narzędzie swobodnego porozumiewania się. 8. Język formalny język formalny, log. zbiór formatorów (słownik) oraz wyprowadzone z niego za pomocą reguł kwalifikacji i konstrukcji zbiory wyrażeń nazwowych i zdaniowych (każdy z tych zbiorów musi być zbiorem obliczalnym). 9. System leksykalny 23.10.2024 7 podsystem leksykalny, tj. słownik, jako uporządkowany przez kulturę społeczną zbiór wyrazów i podsystem gramatyczny, tj. gramatykę, jako zbiór reguł tworzenia jednostek większych: form wyrazowych z mor. femów i wypowiedzeń (zdań) z form wyrazowych. 10. System słownikowy System słownikowy każdego rozwiniętego języka zawiera bowiem podsystemy obejmujące poszczegółne stylistyczne warstwy leksyki. Istotne jest przede wszystkim rozróżnienie słownictwa rodzimego i synchronicznie obcego. 11. Metajęzyk (metajęzyk to język, który służy do mówienia o samym języku). 12. Metainformacja Metainformacja to informacja o informacji, czyli dane opisujące inne dane lub zasoby informacyjne. Jest to pojęcie z zakresu nauki o informacji, które odnosi się do struktury, kontekstu lub cech informacji, ułatwiając jej zarządzanie, wyszukiwanie i interpretację. Nie ma jednej ogólnie przyjętej akceptowalnej definicji znaki.pdf 23.10.2024 8 23.10.2024 9 30.10.2024 Teoria języków informacyjno-wyszukiwawczych Definicja strukturalna i funkcjonalna języków informacyjno-wyszukiwawczych (DO EGZAMINU) (grupa języków słów kluczowych) miejsce języka w systemie informacyjno-wyszukiwawczym SIW = BD + UI +JIW + ZOI + Uż (PIĘĆ ELEMENTÓW DO EGZAMINU) system informacyjno-wyszukiwawczy = baza danych + interfejs użytkownika + język informacyjno -wyszukiwawczy + zasady opisu informacji/obiektów + użytkownik Funkcje języka naturalnego Studentka przyjechała samochodem i spotkała studenta przechodzącego przez pasy i go przejechała, wyrok w sądzie (2 lata więzienia) WYROK W JĘZYKU NATURALNYM - jaka to funkcja języka?? Funkcja performatywna (inaczej sprawcza) języka naturalnego polega na tym, że wypowiedź nie tylko opisuje rzeczywistość, ale także ją tworzy lub zmienia. W tym przypadku, wyrok sądowy wypowiedziany w języku naturalnym ma moc prawną i skutkuje realnymi konsekwencjami (2 lata więzienia) Funkcje podstawowe języka informacyjno- wyszukiwawczego - opisowa = funkcja metainformacyjna - impresywna = funkcja wyszukiwawcza wystarczy żeby język pełnił tylko jedną z tych funkcji !!! funkcje wtórne języka: - funkcja organizująca - funkcja opisu zbiorów dokumentów 30.10.2024 1 JIW jako system semiotyczny ile znaków ma alfabet polski? (DO EGZAMINU) 32 LITERY Elementy i poziomy JIW EZG - elementarne znaki graficzne (symbole) (dwupoziomowy) Morfemy - części zdań do których coś dodawano EJL - Elementarne jednostki leksykalne ZDANIE TEKSTY MONOGRAFIA/Czasopismo znaki i systemy znaków wielopoziomowa struktura języka (dwuklasowego) Funkcje wtórne JIW funkcja organizująca (porządkująca) - zapewniająca strukturalizację zbioru informacyjnego ułatwiającą selekcję określonych opisów dokumentów 30.10.2024 2 funkcje opisu zbiorów dokumentów (informacji) i/lub wyznaczania zakresów pól sematycznych JIW (realizowana przez podgrupę JIW takich jak klasyfikacje szczytowe (tematologiczne) i nadrzędne języki deskryptorowe operujące makrotezaurusami 30.10.2024 3 6.11.2024 Podstawowe typy EJL Podział ze względu na formę wyrażeniową: słownictwo naturalne słownictwo paranaturalne (quasinaturalne) - derywowane ze słownictwa języka naturalnego; najczęściej przyjmuje postać prostych lub rozwiniętych fraz norminalnych; np. naturalne nazwy klasy ANATOMIA, PTAKI, SILNIKI SPALINOWE słownictwo sztuczne - kody sztuczne; najczęściej przyjmuje postać numerycznych, alfabetycznych lub alfanumerycznych symboli pojęć (klas) elementarnych wyodrębnionych w polu sematycznym JIW, np symboleklasyfikacyjne klas głównych i pomocniczych 611, 598.2, 621.43 Podział ze względu na funkcję semantyczną w opisie dokumentów: słownictwo podstawowe - zbiór podstawowych jednostek leksykalnych przeznaczonych do wyrażania podstawowych elementów treści dokumentu, najczęściej przedmiotu głównego, drugorzędnego lub pobocznego np. symbole główne UKD słownictwo pomocnicze - zbiór pomocniczych jednostek leksykalnych przeznaczonych do wyrażania drugorzędnych charakterystyk dokumentu, np. aspektu, lokalizacji czaso-przestrzennej, formy dokumentu, relacji zachodzących między wyrażeniami reprezentującymi podstawowe elementy treści, np. symbole podziałów wspólnych i analitycznych UKD, znaki łączące Podział ze względu na funkcję syntaktyczną w zdaniu JIW: słownictwo autosynktaktyczne - zbiór autosyntaktycznych jednostek leksykalnych, czyli EJL samodzielnych składniowo i wyszukiwawczo, np symbole główne UKD słownictwi synsyntaktyczne - zbiór synsyntaktycznych jednostek leksykalnych czyli EJL niesamodzielnych składniowo i wyszukiwawczo, np. symbole poddziałów analitycznych UKD 6.11.2024 1 Typy słowników JIW wg zasad wyznaczania zbioru poprawnie zbudowanych EJL: słownik dodatni- wykaz EJL, za pomocą których buduje się zdania JIW o słownictwie kontrolowanym; w językach klasyfikacyjnych przyjmuje postać tablic klasyfikacyjnych słownik ujemny - wykaz wyrażeń, których nie wolno stosować do tworzenia zdań JIW; wykorzystany w językach o paranaturalnym słownictwie niekontrolowanym (tzn. języku swobodnych słów kluczowych) słownik zadany instrukcją - zbiór reguł wyznaczających podzbiór wyrażeń języka naturalnego, które wolno stosować jako EJL JIW o niekontrolowanym słownictwie paranaturalnym wg zasad prezentacji przekładu z języka naturalnego na JIW: słownik explicite - jednoznacznie wskazujący przyporządkowanie EJL określonym wyrażeniom naturalnym stanowiącym nazwy elementów treści lub cech formalnych dokumentów; wg niektórych teoretyków JIW klasę tę reprezentują wyłącznie tezaurusy (słowniki języków deskryptorowych) słownik implicite - wymagające od użytkownika samodzielnego ustalenia związku między wyrażeniami naturalnymi opisującymi im wyrażeniami JIW; do klasy tej zalicza się większość słowników JIW o słownictwie kontrolowanym, w tym tablice klasyfikacyjne. wg zasad porządkowania wykazu EJL: słownik uporządkowany formalnie - najczęściej alfabetyczne wyrazy EJL języków o słownictwie paranaturalnym, np. słowniki temetów i określników; część alfabetyczno-hierarchiczna tezaurusów słownik uporządkowany semantycznie - wykaz EJL w układzie systematycznym, odwzorującym pewną klasyfikację; tablice klasyfikacyjne, część systematyczna tezaurusów; słownik uporządkowany losowo - wykaz słów kluczowych użytych w indeksowaniu ; stosowany wyłącznie wtedy, gdy możliwe jest automatyczne 6.11.2024 2 przeszukiwanie jego zawartości 6.11.2024 3 13.11.2024 Systemy semantyczne i relacyjne jiw Egzamin - pierwszy dzień sesji 29.01.2025 - 10:00 -12:00 sala 0.313. pisemnie termin poprawkowy 25.02.2024 - ustnie 11:00-12:00 3.228 Następne zajęcia w środę 04.12 - przez najbliższe 2 tygodnie nie ma zajęć Informacja naukowa roz 10 Żmigrocki System leksykalny - jest to struktura językowa zbudowana z wykładników językowych znaczeń (wyrazów/leksemów), które można wyrazić za pomocą systemów znaczeń jakimi ten język dysponuje //nie można napisać za ich pomocą wiersza etc. System słownikowy - jest to struktura językowa zbudowana ze znajdujących się w słowniku wykładników językowych znaczeń jakich można wyrazić w danym języku // tylko te wyrazy które są w słowniku Systemy semantyczne (pola semantyczne) - jest to to struktura językowa zbudowana ze znaczeń jakie można wyrazić w danym języku za pomocą środków (relacji) którymi dany język dysponuje System notacyjny to baza notacyjna (alfabet) + reguły notacyjne Baza notacyjna - zbiór elementarnych znaków graficznych (EZG), za pomocą których tworzone są wyrażenia JIW. Reguły notacyjne - zasady łączenia EZG w ciągi (rzadziej - układy jukstapozycyjne) stanowiące elementarne jednostki leksykalne JIW. Elementarnymi znakami graficznymi JIW mogą być: litery pewnego języka etnicznego cyfry arabskie znaki notacji matematycznej, logicznej, znaki interpunkcyjne, etc., 13.11.2024 1 znaki semigraficzne EZG (elementarne znaki graficzne) powinny być: łatwe w zapisie dostępne na standardowej klawiaturze wyposażenie w określoną wartość porządkową Podstawowe rodzaje systemów notacyjnych Podział wg typu alfabetu (1) notacja jednorodna notacja mieszana Podział wg typu alfabetu (2) notacja alfabetyczna notacja numeryczna notacja specjalna Podział wg cech strukturalnych notacja liniowa (porządkowa) notacja strukturalna notacja hierarchiczna (np. dziesiętna, setna, ósemkowa, etc.) notacja składnikowa (komponentalna) notacja retroaktywna notacja znaków skróconych Podział wg cech mnemotechnicznych notacja mnemoniczna notacja niemnemotechniczna 13.11.2024 2 Elementarna jednostka leksykalna (EJL) to wyraz (wyrażenie proste ) JIW, czyli poza morfemem najmniejsza jednostka JIW pełniąca funkcję semantyczną Zbiór EJL stanowi słownictwo JIW Rodzaje EJL i słownictwa JIW wyróżnia się ze względu na ich cechy: wyrażeniowe, czyli formę zapisu semantyczne, czyli znaczenie - funkcję znaczeniową w opisie dokumentów syntaktyczne, czyli funkcję pełnioną w zdaniu JIW Organizacja systemu leksykalnego JIW Pole semantyczne JIW - suma znaczenia wszystkich wyrażeń JIW; zbiór wchodzących we wzajemne relacje pojęć, które można wyrazić w danych JIW Struktura pola semantycznego JIW wyznaczona jest przez trzy elementy: sieć paradygmatyczna relacji semantycznych kategoryzację semantyczną EJL podział dyscyplinarny EJL Gramatyka JIW - zespół zasad łączenia ze sobą EJL w strukturze zdania JIW i wyrażania zachodzących między nimi relacji syntagmatycznych. Relacja syntagmatyczna - relacja między wyrażeniami prostymi w strukturze wyrażenia złożonego; w JIW wyróżnia się: syntagmatyczne relacje współwystępowania (kookurencji), odpowiadające znaczeniem spójnikowi “i” syntagmatyczne relacje zależności semantycznej specyfikowanej lub niespecyfikowanej odpowiadające znaczeniem takim spójnikom jak “a”, “wobec”, etc. Wyróżnia się cztery ogólne typy gramatyki JIW: gramatykę zerową gramatykę pozycyjną 13.11.2024 3 gramatykę niepozycyjną gramatykę częściowo pozycyjną Organizacja systemu leksykalnego JIW kategoryzacja semantyczna - podział słownictwa na kategorie semantyczne kategoria semantyczna - klasa wyrażeń o pewnej wspólnej cesze semantycznej, np: nazwy osób nazwy przedmiotów nazwy procesów nazwy własności nazwy miejsca nazwy form wydawniczych dokumentów Uniwersalny schemat kategorii CRG Przedmioty: przedmioty fizyczne przedmioty chemiczne przedmioty heterogeniczne nieożywione Artefakty przedmioty biologiczne człowiek mentefakty Atrybuty terminy relacyjne i pozycjonalne własności działania Organizacja systemu leksykalnego JIW 13.11.2024 4 Podział dyscyplinarny - podział pola semantycznego JIW na obszary odpowiadające dyscyplinom nauki lub działom działalności praktycznej, do których kwalifikowane są pojęcia reprezentowane przez EJL Dyscyplina naukowa – wyodrębniony obszar badań naukowych o specyficznym przedmiocie formalnym, metodach badawczych, celach, oraz zakresie badawczym; nauki grupowane według kryteriów tematycznych lub metodologicznych. Obszar działalności praktycznej – wyodrębniony organizacyjnie obszar działań praktycznych, np. przemysł i jego branże, rzemiosło, transport, opieka zdrowotna, szpitalnictwo, edukacja czy rolnictwo 13.11.2024 5 04.12.2024 Systemy gramatyczne języków informatyczno wyszukiwawczych Błąd gramatyczny - błąd ten dotyczy niepoprawnej odmiany wyrazów (rzeczowników, czasowników) Relacje paradygmatyczne = relacje słownikowe Specyfikowane - wyraźnie zaznaczone Typy gramatyk JIW Gramatyka zerowa - jedyną regułą gramatyczną jest reguła o niedołączaniu, tj reguła tworzenia zdań jednowyrazowych. Każda EJL stanowi samodzielną charakterystykę dokumentu lub instrukcję wyszukiwawczą; nie dopuszcza się możliwości łączenia EJL w wyrażenia bardziej złożone; brak wykładników relacji syntagmatycznych. W formie czystej stosowana jest tylko w klasycznych wyliczających klasyfikacjach bibliotecznych, np. w Klasyfikacji Międzynarodowej Ridera. Gramatyka pozycyjna - reguły jednoznacznie określające szyk EJL w strukturze zdania. Pozycja EJL w zdaniu jest wykładnikiem jej relacji syntagmatycznych wobec pozostałych EJL współwystępujących z nią w tym zdaniu, zmiana szyku może prowadzić do zmiany znaczenia zdania Stosowane są dwie odmiany tej gramatyki: gramatyka pozycyjna ze stałą długością zdania (tzn. indeksowanie ankietowe, rastrowe lub fasetowe w językach deskryptorowych i klasyfikacjach fasetowych; gramatyka pozycyjna ze zmienną długością zdania (np. struktura hasła przedmiotowego rozwiniętego lub symbolu rozwiniętego UKD) 04.12.2024 1 Gramatyka niepozycyjna - dopuszcza dowolny szyk EJL w zdaniu JIW. Jedyną regułą gramatyczną jest reguła dołączania (konkatenacji); jedyną relacją syntagmatyczną jest relacja kookurencji, czyli współwystępowania EJL w zdaniu w dowolnej kolejności. Interpretacja znaczeniowa każdej EJL jest niezależna od kontekstu. Każda EJL jest samodzielnym kluczem wyszukiwawczym. Klasycznym przykładem gramatyki niepozycyjnej jest gramatyka stosowana najczęściej w językach deskryptorowych i językach słów kluczowych, określana jako indeksowanie współrzędne (koordynacyjne). Gramatyka częściowo-pozycyjna - gramatyka wyznaczająca stały szyk EJL w strukturze fraz typu ”samodzielna EJ: - niesamodzielna EJ” i swobodny szyk fraz typu ”samodzielna EJL - samodzielna EJL” Ten typ gramatyki cechuje UKD: 821.161.1-1 Poezja rosyjska ale nie: -1 821.161.1 364.4:551.24 Pomoc społeczna w czasie trzęsienia ziemi lub 551.24:364.4 Pomoc społeczna w czasie trzęsienia ziemi W UKD wykładnikami relacji syntagmatycznych są zarówno wyspecjalizowane wyrażenia (wskaźniki kategorii podziałów, relatory), jak i pozycja w zdaniu (porządek, poziomy symboli rozwiniętych); kolejność symboli głównych w symbolu złożonym z dwukropkiem pojedynczym jest jednak swobodna, a jej inwersja nie prowadzi do zmiany znaczenia całego symbolu złożonego. Bez względu na rodzaj gramatyki występujący w danym języku informacyjnym reguły gramatyki najczęściej odpowiadają na kilka pytań np: jaka jest najmniejsza i największa liczba elementarnych jednostek leksykalnych tworzących zdanie jakie elementarne jednostki leksykalne mogą samodzielnie tworzyć zdanie, a jakie są w zdaniu niesamodzielnymi jednostkami 04.12.2024 2 czy są jakieś elementarne jednostki leksykalne, które muszą zawsze występować w zdaniu i które mogą się powtarzać czy istnieje jakiś określony porządek w układzie jednostek elementarnych w zdaniu czy istnieją jakieś zasady korelacji pomiędzy elementarnymi jednostkami leksykalnymi występującymi w zdaniu 04.12.2024 3 11.12.2024 Indeksowanie statystyczne SYSTEMY PRAGMATYCZNE JIW Pragmatyka - jest jednym z bardzo rozwijanych elementów językoznawstwa - jest to dziedzina teorii JIW, która zajmuje się problemami posługiwania się danym językiem (indeksowanie/opisywanie, wyszukiwanie informacji po dokonaniu opisu w systemie) Indeksowanie to proces opisu, opracowywania charakterystyki - proces ten różnie jest nazywany w zależności od języka tematowanie, klasyfikowanie, indeksowanie (3 nazwy tego samego) Indeksowanie jest procesem intelektualnym (indeksowanie ręczne) Indeksowanie swobodne (określanie jakichś cech przedmiotu) Indeksowanie normatywne (opisywanie za pomocą słów znajdujących się w słowniku)/indeksowanie słownikowe Indeksowanie współrzędne Metody statystyczne i syntaktyczne 2 tryby indeksowania: Uogólniające (polega na tym że w opisie czegoś używamy wyrazów ogólnych xdd) Wyszególniające (używamy wyrażeń bardzo szczegółowych) Są stosowane w różnych sytuacjach Indeksowanie ma parametry (szerokość, szczegółowość/głębokość) nie zawsze w tym samym języku się indeksuje i wyszukuje Systemy pragmatyczny pozwalają określać wielkość informacji na dany temat w dokumencie/opisie a także jej wielkość i wagę dzięki czemu możemy mówić o współczynnikach wagowych Informacji jak używać jiw można szukać w instrukcjach, poradnikach, monografiach (książkach), artykuł, tablice, wstępach, podręczniki, uwagi 11.12.2024 1 Katalog to jest system a język jest jego elementem Nie ma żadnej książki poświęconej pragmatyce JIW Wśród metod lingwistycznych wyróżniamy metody syntaktyczne, bazujące na strukturze zdań - w tych metodach wykorzystuje się teorię jeżyków formalnych, zwłaszcza zbiór znaczników frazowych Noama Chomsky’ego. Podstawą metod statystycznych jest tzw metoda teoria wartości informacyjnej słowa/wyrazu Została ona opracowana przez H.P Luhn’a Wartość informacyjna słowa jest funkcją jego wartości - badacze stwierdzili że jeśli jakiś wyraz się powtarza to jest istotny Krzywa Gausa opisuje gęstość prawdopodobieństwa zdarzeń Indeksowanie statystyczne Metody wykorzystujące statystyczne właściwości wyrazów lub wyrażeń występujących w tekście dokumentu w aspekcie danego dokumentu lub całego dokumentu Indeksowanie probabilistyczne Metody wykorzystujące rachunek prawdopodobieństwa w celu określenia prawdopodobieństwa wyszukania dokumentu relewantnego oraz wykorzystujące rozkłady częstości terminów w celu określenia tego prawdopodobieństwa. Indeksowanie lingwistyczne Metody wykorzystujące automatyczną analizę językową w celu wyróżnienia w tekście dokumentu wyrażeń informacyjnie ważnych, znaczących dla jego treści. 11.12.2024 2 08.01.2024 Podstawowe rodzaje JIW typologie JIW - do egzaminu Cztery uogólnione typy (modele (JIW) - zwyczajowa klasyfikacja JIW 1. Języki klasyfikacyjne (klasyfikacje biblioteczno-bibliograficzne) - klasyfikacje wyliczające - klasyfikacje fasetowe 2. Języki haseł przedmiotowych 3. Języki słów kluczowych 4. Języki deskryptorowe 5. Inne (niestandardowe) JIW np kody semantyczne, języki syntagmatyczne JIW są wśród nas ale trzeba je rozpoznać SCHEMAT OPISU JIW (ważne przy omówieniu jakiegoś języka na egzaminie) 1. Nazwa/y typy (ewentualnie podtypów)z 2. Charakter słownictwa (notacja) 3. Nazwy słownika 4. Nazwa/y jednostek (e)leksykalnych 5. Odwzorowywane typy relacji słownikowych 6. Typ/y stosowanej gramatyki 7. Zastosowania JIW 8. Historia/geneza 9. Zaplecze metodologiczno-normalizacyjne Książka informacja naukowa rozdział 10 - materiał do egzaminu 08.01.2024 1 15.01.2025 gruba czarna książka Sosińska ogólny schemat jiw do egzaminu najstarszy z typów jiw to klasyfikacje - istniały od starożytności CZTERY UOGÓLNIONE TYPY (MODELE) JIW 1. języki klasyfikacyjne (klasyfikacje biblioteczno-bibliograficzne) klasyfikacje wyliczające klasyfikacje fasetowe 2. języki haseł przedmiotowych 3. języki słów kluczowych 4. języki deskryptorowe 5. inne (niestandardowe JIW, np. kody semantyczne, języki syntagmatyczne JHP (język haseł przedmiotowych) - ogólne cechy typologiczne Słownictwo: tematy (ewentualne z dopowiedzeniami) i określniki wyrażane za pomocą notacji paranaturalnej (PSYCHOLOGIA EKSPERYMENTALNA; RZYM) kontrolowane podzielone na dwie podstawowe kategorie syntaktyczne (różniące się własnościami składniowymi): tematy samodzielne składniowo i określniki niesamodzielne składniowo Słownik: słownik tematów i określników, słownik haseł przedmiotowych, KHW (kartoteka haseł wzorcowych) słownik przekładowy 15.01.2025 1 uporządkowany alfabetycznie i zawierający odsyłacze kierujące od wyrażeń nie stosowanych w indeksowaniu do odpowiednich tematów lub określników oraz od poszczególnych tematów lub określników związanych z nimi relacjami semantycznymi (hierarchicznymi lub kojarzeniowymi zwykle składający się z odrębnych wyrazów tematów i określników stosowanych przy poszczególnych kategoriach tematów Gramatyka: reguły budowy haseł przedmiotowych (zdań i tekstów) gramatyka pozycyjna, wyznaczająca szyk elementów hasła przedmiotowego podstawowy schemat hasła przedmiotowego: TEMAT, dopowiedzenia - określnik schematy indywidualne określają kolejność poszczególnych kategorii określników w hasłach Języki słów kluczowych - ogólne cechy typologiczne Słownictwo: słowa (frazy) kluczowe wyrażane za pomocą notacji paranaturalnej (PTAKI, PTAKI HIBERNACYJNE) na ogół niekontrolowane; dopuszcza się synonimię leksykalną wszystkie słowa kluczowe mają identyczną charakterystykę składniową: są samodzielne składniowo i wyszukiwawczo stosowane bywa sztuczne słownictwo pomocnicze (wskaźniki roli, wskaźniki więzi, wagi i rangi, relatory) Słowniki dodatni: wykaz (słownik) słów kluczowych uporządkowany alfabetycznie spis słów kluczowych używanych w indeksowaniu i wyszukiwaniu dokumentów niekiedy uwzględnia wyrażenia od których odsyła do słów kluczowych ujemny: stop lista uporządkowany (zwykle alfabetycznie) wykaz wyrażeń, których nie wolno stosować w indeksowaniu i wyszukiwaniu dokumentów (np. przyimki, spójniki, 15.01.2025 2 zaimki, etc.) instrukcyjny: charakterystyka formalna wyrażeń języka naturalnego, które można stosować jako słowa kluczowe w indeksowaniu i wyszukiwaniu dokumentów Gramatyka: indeksowanie współrzędne; w przypadku stosowania słownictwa pomocniczego - gramatyka częściowo pozycyjna Języki deskryptorowe - ogólne cechy typologiczne Słownictwo: deskryptory oraz ewentualnie identyfikatory, modyfikatory, wskaźniki roli, wskaźniki więzi, wagi, relatory wyrażane za pomocą notacji paranaturalnej (WYSZUKIWANIE INFORMACJI, SYSTEMY ONLINE) poza podstawową kategorią samodzielnych składniowo deskryptorów mogą być wyposażone w paranaturalne słownictwo pomocnicze w postaci modyfikatorów i identyfikatorów oraz sztuczne słownictwo pomocnicze (wskaźniki roli, wskaźniki więzi, wagi i rangi, relatory) Słownik: tezaurus Słownik przekładowy uporządkowany alfabetycznie i semantycznie (prezentacja przekładowej relacji odpowiedzialności wyszukiwawczej między deskryptorem i askryptorem (U, Nu), oraz relacji hierarchicznej (SD, WD) i kojarzeniowej (KD) między deskryptorami) Gramatyka indeksowanie współrzędne; w przypadku stosowania słownictwa pomocniczego - gramatyka częściowo pozycyjna 15.01.2025 3 22.01.2025 Języki klasyfikacyjne - ogólne cechy typologiczne Słownictwo: symbole klasyfikacyjne najczęściej wyrażane za pomocą notacji sztucznej (AK001, 123.12) kontrolowane może być podzielone na dwie lub więcej kategorii syntaktycznych (różniących się własnościami składniowymi): symbole główne i symbole pomocnicze Słownik: tablice klasyfikacyjne słownik przekładowy uporządkowany semantycznie, na podstawie relacji hierarchicznych; wyposażony w sieć odsyłaczy do symboli o znaczeniu pokrewnym niekiedy składający się z odrębnych wykazów symboli głównych (tablice główne) i symboli pomocniczych (tablice pomocnicze) z reguły wyposażony w indeks alfabetyczny odpowiedników słownych symboli klasyfikacyjnych Gramatyka: reguły budowy symboli klasyfikacyjnych pojęć, tematów i dokumentów (EJL, zdań i tekstów) gramatyka zerowa w klasyfikacjach niesyntetycznych gramatyka pozycyjna lub częściowo pozycyjna w klasyfikacjach syntetycznych KODY SEMANTYCZNE (WRU-ASM, RX-kodów) Słownictwo: mnożniki semantyczne, prymitywy semantyczne, semy najczęściej wyrażane za pomocą notacji sztucznej (MUSR, MACH, R117) elementarne jednostki leksykalne kodów semantycznych reprezentują tzw. proste pojęcia, wchodzące w skład pojęć złożonych wyrażanych przez wyrażenia złożone semantycznie, np. terminy naukowe; pojęcia proste 22.01.2025 1 ustalane są metodą analizy kontrastywnej znaczenia wyrażeń semantycznie złożonych: termometr [urządzenie]x[pomiar]x[temperatura] ———— = ——————————————— barometr [urządzenie]x[pomiar]x[ciśnienie] zwykle podzielone na dwie lub więcej kategorii semantycznych: wyrażenia reprezentujące pojęcia proste i wyrażenia reprezentujące relacje semantyczne i sytuacyjne Słownik: specjalistyczny wykaz mnożników semantycznych, prymitywów słownik przekładowy uporządkowany semantycznie wyposażony w indeks odpowiedników słownych wyrażeń prostych i złożonych kodu semantycznego Gramatyka: złożona składnia fraz, zdań i tekstów najczęściej gramatyka pozycyjna JĘZYKI SYNTAGMATYCZNE - ogólne cechy typologiczne Słownictwo: deskryptory (lub słowa kluczowe) i relatory deskryptory wyrażane za pomocą notacji paranaturalnej; relatory -za pomocą notacji sztucznej Słownik: tezaurus (lub wykaz słów kluczowych) oraz wykaz relatorów Gramatyka: rozbudowana gramatyka częściowo pozycyjna Jedynym językiem syntagmatycznym szerzej znanym jest SYNTOL (SYNTagmatic Organization Language) opracowany w latach 1960-1962 na potrzeby systemu EURATOM; stanowił on rodzaj języka deskryptorowego ze znacznie rozbudowaną gramatyką, opartą na systemie relatorów wskazujących powiązania zachodzące między deskryptorami w charakterystykach dokumentów lub w instrukcjach wyszukiwawczych. 22.01.2025 2 22.01.2025 3 ściąga od babika 1. Systemy klasyfikacji Języki informacyjne (JI) to grupujące jednostki leksykalne system klas, które są zwykle uporządkowane hierarchicznie. Słownictwo systemów klasyfikacji składa się najczęściej ze sztucznych jednostek leksykalnych /symboli. 1.1. Klasyfikacje monohierarchiczne Systemy klasyfikacji, których wszystkie klasy są ujęte w jeden schemat hierarchiczny i wywodzą się od jednej klasy, obejmującej cały zakres danej klasyfikacji. W typowych klasyfikacjach monohierarchicznych wszystkie jednostki leksykalne (symbole) są wyliczone jawnie (w "gotowej” formie) w tablicach klasyfikacji, stanowiących słownik języka informacyjnego typu klasyfikacyjnego. Typowe klasyfikacje monohierarchiczne są stosowane obecnie bardzo rzadko. O wiele częściej występują klasyfikacje monohierarchiczne z bardziej lub mniej wyodrębnionymi poddziałami pomocniczymi/wspólnymi analitycznymi, itp. Przykładami takich klasyfikacji są UKD i PKT. 1.2. Klasyfikacje fasetowe /polihierarchiczne/ Systemy klasyfikacji, których klasy są uporządkowane na podstawie wspólnych charakterystyk wg kategorii i faset lub tylko wg faset (faseta- grupa klasy odpowiadających jakiejś wspólnej charakterystyce, oznaczających np. rodzaj materiału, rodzaj czynności itp. fasety mogą być grupowane w kategorie). Przy klasyfikowaniu dokumentów wg klasyfikacji fasetowej w większości wypadków są używane złożone jednostki leksykalne (symbole złożone, tworzone przez syntezę zestawienie) elementarnych jednostek leksykalnych, zaczerpniętych z poszczególnych faset. 2. Języki haseł przedmiotowych JI o słownictwie quasi-naturalnym (mającym postać wyrażeń języka naturalnego i gramatyce pozycyjnej tj. o ustalonym szyku elementarnych jednostek leksykalnych zdaniu języka informacyjnego). Słownikiem języka haseł przedmiotowych jest wykaz alfabetycznie uporządkowanych tematów tj. jednostek samodzielnych, które mogą tworzyć jednoelementarne zdania języka haseł przedmiotowych, (nazywane właśnie hasłami przedmiotowymi) i ściąga od babika 1 określników (tj. niesamodzielnych jednostek leksykalnych które mogą tworzyć hasła przedmiotowe tylko w połączeniu z tematami). 3. Języki słów kluczowych JI o słownictwie quasi-naturalnym i gramatyce niepozycyjnej (dowolny szyk elementarnych jednostek leksykalnych w zdaniu języka informacyjnego), równoznacznej w zasadzie z indeksowaniem współrzędnym, polegającym na charakteryzowaniu złożonej treści dokumentu przez koordynację współrzędnych, niezależnych, dających się swobodnie zestawiać elementarnych jednostek leksykalnych. Słownikiem Języka słów kluczowych jest uporządkowany alfabetycznie wykaz słów kluczowych, wybranych z tekstów dokumentów; wykaz słów kluczowych nigdy nie jest zamknięty i w zasadzie nie są w nim wyrażane relacje pomiędzy słowami kluczowymi, które są elementarnymi jednostkami leksykalnymi języka słów kluczowych. 4. Języki deskryptorowe JI o słownictwie przeważnie quasi-naturalnym i gramatyce przeważnie niepozycyjnej, równoznacznej w zasadzie z indeksowaniem współrzędnym. Słownikiem języka deskryptorowego jest tezaurus, tj. normatywny, zamknięty w danym momencie wykaz deskryptorów (elementarnych jednostek leksykalnych językı deskryptorowego, używanych do indeksowania dokumentów oraz askryptórów wyrażeń nie używanych do indeksowania, będących przeważnie synonimami wyrażeń języka naturalnego, równokształtnych z deskryptorami, tj. mających tę samą postać co deskryptory). W tezaurusie za pomocą specjalnych wskaźników relacji wyrażane są relacje pomiędzy deskryptorami i odpowiadającymi im askryptorami, a także najczęściej relacje hierarchiczne 1 kojarzeniowe pomiędzy poszczególnymi deskryptorami. Tezaurus obok części alfabetyczno-hierarchicznej a stanowiącej uporządkowany alfabetycznie wykaz deskryptorów i askryptorów wraz z przyporządkowanymi im wskaźnikami relacji zawiera przeważnie także część systematyczną, będącą zasadzie schematem klasyfikacji. 5. Kody semantyczne Całkowicie sformalizowane JI, których słownik składa się ze stosunkowo nielicznych kodów symboli literowych i/lub cyfrowych, używanych w celu oznaczenia pojęć ogólnych i form gramatycznych. ściąga od babika 2

Use Quizgecko on...
Browser
Browser