You are on page 1of 12

Ekstrakcja konstrukcji wielowyrazowych na

podstawie regu gramatycznych

Autor: in. ukasz Olender


Promotor: dr in. Krzysztof Simiski
Plan prezentacji
1. Wstp
Analiza tematu
Cel

2. Analiza dziedziny
Wybr jzyka
Problematyka ekstrakcji konstrukcji wielowyrazowych
Gramatyki

3. Model konstrukcji wielowyrazowych

4. Badania
Metodyka
Wyniki

5. Wnioski
Wstp analiza tematu
Konstrukcja wielowyrazowa

flaki z olejem

czarny ko

San Francisco

break the ice

Reguy gramatyczne
Wstp cel pracy
Zbadanie skutecznoci ekstrakcji konstrukcji wielowyrazowych przy
wykorzystaniu analizy gramatycznej

Stworzenie mechanizmu wykrywajcego idiomy w angielskich


tekstach

Kontynuacja pracy inynierskiej, implementacja najbardziej podanej


funkcji
Analiza dziedziny
Wybr jzyka

Problematyka ekstrakcji konstrukcji wielowyrazowych

Lets go to golf club.


He was the best Chicago Bull.
Make sure he gets best defense possible.
I want to make him sure about it.
We have to make doubly sure that no one is left out.

It makes a practical sense, sure.


That makes it a sure bet.
Analiza dziedziny
Gramatyki

Analiza frazowa Analiza zalenociowa


Analiza dziedziny
Gramatyki Link grammar
Model konstrukcji wielowyrazowych
Sekwencje wyrazw

Szukane powizania

Powizania wykluczajce

Zrnicowanie na
podstawie dopuszczenia
pustych pocze.
Badania metodyka
Porwnanie skutecznoci modelu z modelem stworzonym przy
wykorzystaniu wyrae reguowych:

30 idiomw syntaktycznie elastycznych, dla kadego z nich 50+ zda z


korpusu jzykowego COCA
Miara czuoci, miara swoistoci, warto predykcyjna dodatnia,
warto predykcyjna ujemna
Wasny wspczynnik dokadnoci: O = 0,7 + 0,3
Badania wyniki
Model RegExp Model LG Model LG_NULL

Miara czuoci 92,00% 57,67% 86,67%

Miara swoistoci 85,88% 96,30% 93,19%

Warto predykcyjna 86,24% 95,34% 93,68%


dodatnia

Warto predykcyjna 87,01% 56,67% 83,98%


ujemna

Wasna funkcja 90,16% 69,24% 88,62%


oceniajca O
Wnioski
Dla postawionego celu, model oparty o wyraenia reguowe okaza si
by minimalnie lepszy

Bardziej skomplikowane konteksty wystpie szukanych konstrukcji


wielowyrazowych wystpuj rzadko

Analiza gramatyczna moe nie dziaa prawidowo dla zda


niepoprawnych gramatycznie
Dzikuj za uwag.

Bibliografia:
Wykresy, slajd 6: Daniel D. Sleator and Davy Temperley. Parsing English with a Link Grammar, 1991.
Wykres analizy skadniowej, slajd 5: Domena Publiczna