September the 1rst 2009 EVALITA 2009 PARSING TASK - ANNOTATION SAMPLES A. Samples for Dependency Parsing (main task) _________________________________________________ A.1. Sentence CODICECIVILE-108 in TUT native format, as in the Evalita development set: ************** FRASE CODICECIVILE-108 ************** 1 La (IL ART DEF F SING) [11;VERB-SUBJ] 2 mancata (MANCATO ADJ QUALIF F SING) [3;ADJC+QUALIF-RMOD] 3 definizione (DEFINIZIONE NOUN COMMON F SING DEFINIRE TRANS) [1;DET+DEF-ARG] 4 della (DI PREP MONO) [3;NOUN-OBJ] 4.1 della (IL ART DEF F SING) [4;PREP-ARG] 5 estensione (ESTENSIONE NOUN COMMON F SING) [4.1;DET+DEF-ARG] 6 della (DI PREP MONO) [5;PREP-RMOD-PROPERTYOWNER] 6.1 della (IL ART DEF F SING) [6;PREP-ARG] 7 minima (MINIMO ADJ QUALIF F SING SUPERL) [8;ADJC+QUALIF-RMOD] 8 unità (UNITÀ NOUN COMMON F ALLVAL) [6.1;DET+DEF-ARG] 9 colturale (COLTURALE ADJ QUALIF ALLVAL SING) [8;ADJC+QUALIF-RMOD] 10 ha (AVERE VERB AUX IND PRES TRANS 3 SING) [11;AUX+TENSE] 11 reso (RENDERE VERB MAIN PARTICIPLE PAST TRANS SING M) [0;TOP-VERB] 12 quest' (QUESTO ADJ DEMONS M SING) [11;VERB-OBJ] 13 articolo (ARTICOLO NOUN COMMON M SING) [12;DET+DEF-ARG] 14 ( (#\( PUNCT) [11;OPEN+PARENTHETICAL] 15 come (COME PREP POLI COMPAR) [11;PREP-RMOD-COMPARATIVE] 16 gli (IL ART DEF M PL) [15;PREP-ARG] 17 altri (ALTRO PRON INDEF M PL LSUBJ+LOBJ+OBL) [16;DET+DEF-ARG] 18 ) (#\) PUNCT) [11;CLOSE+PARENTHETICAL] 19 del (DEL_TUTTO ADV MANNER LOCUTION) [21;ADVB-RMOD] 20 tutto (DEL_TUTTO ADV MANNER LOCUTION) [19;CONTIN+LOCUT] 21 disapplicato (DISAPPLICATO ADJ QUALIF M SING) [11;VERB-PREDCOMPL+OBJ] 22 . (#\. PUNCT) [11;END] A.2. Sentence CODICECIVILE-108 in TUT native format WITHOUT SYNTACTIC ANNOTATION, as in the Evalita TEST SET: ************** FRASE CODICECIVILE-108 ************** 1 La (IL ART DEF F SING) 2 mancata (MANCATO ADJ QUALIF F SING) 3 definizione (DEFINIZIONE NOUN COMMON F SING DEFINIRE TRANS) 4 della (DI PREP MONO) 4.1 della (IL ART DEF F SING) 5 estensione (ESTENSIONE NOUN COMMON F SING) 6 della (DI PREP MONO) 6.1 della (IL ART DEF F SING) 7 minima (MINIMO ADJ QUALIF F SING SUPERL) 8 unità (UNITÀ NOUN COMMON F ALLVAL) 9 colturale (COLTURALE ADJ QUALIF ALLVAL SING) 10 ha (AVERE VERB AUX IND PRES TRANS 3 SING) 11 reso (RENDERE VERB MAIN PARTICIPLE PAST TRANS SING M) 12 quest' (QUESTO ADJ DEMONS M SING) 13 articolo (ARTICOLO NOUN COMMON M SING) 14 ( (#\( PUNCT) 15 come (COME PREP POLI COMPAR) 16 gli (IL ART DEF M PL) 17 altri (ALTRO PRON INDEF M PL LSUBJ+LOBJ+OBL) 18 ) (#\) PUNCT) 19 del (DEL_TUTTO ADV MANNER LOCUTION) 20 tutto (DEL_TUTTO ADV MANNER LOCUTION) 21 disapplicato (DISAPPLICATO ADJ QUALIF M SING) 22 . (#\. PUNCT) A.3. Sentence CODICECIVILE-108 in CoNLL format, as in the Evalita development set: 1 La IL ART ART DEF|F|SING 13 SUBJ _ _ 2 mancata MANCATO ADJ ADJ QUALIF|F|SING 3 RMOD _ _ 3 definizione DEFINIZIONE NOUN NOUN COMMON|F|SING|DEFINIRE|TRANS 1 ARG _ _ 4 della DI PREP PREP MONO 3 OBJ _ _ 5 della IL ART ART DEF|F|SING 4 ARG _ _ 6 estensione ESTENSIONE NOUN NOUN COMMON|F|SING 5 ARG _ _ 7 della DI PREP PREP MONO 6 RMOD _ _ 8 della IL ART ART DEF|F|SING 7 ARG _ _ 9 minima MINIMO ADJ ADJ QUALIF|F|SING|SUPERL 10 RMOD _ _ 10 unità UNITÀ NOUN NOUN COMMON|F|ALLVAL 8 ARG _ _ 11 colturale COLTURALE ADJ ADJ QUALIF|ALLVAL|SING 10 RMOD _ _ 12 ha AVERE VERB VERB AUX|IND|PRES|TRANS|3|SING 13 AUX+TENSE _ _ 13 reso RENDERE VERB VERB MAIN|PARTICIPLE|PAST|TRANS|SING|M 0 TOP _ _ 14 quest' QUESTO ADJ ADJ DEMONS|M|SING 13 OBJ _ _ 15 articolo ARTICOLO NOUN NOUN COMMON|M|SING 14 ARG _ _ 16 ( #\( PUNCT PUNCT _ 13 OPEN+PARENTHETICAL _ _ 17 come COME PREP PREP POLI|COMPAR 13 RMOD _ _ 18 gli IL ART ART DEF|M|PL 17 ARG _ _ 19 altri ALTRO PRON PRON INDEF|M|PL|LSUBJ+LOBJ+OBL 18 ARG _ _ 20 ) #\) PUNCT PUNCT _ 13 CLOSE+PARENTHETICAL _ _ 21 del DEL@TUTTO ADV ADV MANNER|LOCUTION 23 RMOD _ _ 22 tutto DEL@TUTTO ADV ADV MANNER|LOCUTION 21 CONTIN+LOCUT _ _ 23 disapplicato DISAPPLICATO ADJ ADJ QUALIF|M|SING 13 PREDCOMPL+OBJ _ _ 24 . #\. PUNCT PUNCT _ 13 END _ _ A.3. Sentence CODICECIVILE-108 in CoNLL format WITHOUT SYNTACTIC ANNOTATION, as in the Evalita TEST SET: 1 La IL ART ART DEF|F|SING _ _ _ _ 2 mancata MANCATO ADJ ADJ QUALIF|F|SING _ _ _ _ 3 definizione DEFINIZIONE NOUN NOUN COMMON|F|SING|DEFINIRE|TRANS _ _ _ _ 4 della DI PREP PREP MONO _ _ _ _ 5 della IL ART ART DEF|F|SING _ _ _ _ 6 estensione ESTENSIONE NOUN NOUN COMMON|F|SING _ _ _ _ 7 della DI PREP PREP MONO _ _ _ _ 8 della IL ART ART DEF|F|SING _ _ _ _ 9 minima MINIMO ADJ ADJ QUALIF|F|SING|SUPERL _ _ _ _ 10 unità UNITÀ NOUN NOUN COMMON|F|ALLVAL _ _ _ _ 11 colturale COLTURALE ADJ ADJ QUALIF|ALLVAL|SING _ _ _ _ 12 ha AVERE VERB VERB AUX|IND|PRES|TRANS|3|SING _ _ _ _ 13 reso RENDERE VERB VERB MAIN|PARTICIPLE|PAST|TRANS|SING|M _ _ _ _ 14 quest' QUESTO ADJ ADJ DEMONS|M|SING _ _ _ _ 15 articolo ARTICOLO NOUN NOUN COMMON|M|SING _ _ _ _ 16 ( #\( PUNCT PUNCT _ _ _ _ _ 17 come COME PREP PREP POLI|COMPAR _ _ _ _ 18 gli IL ART ART DEF|M|PL _ _ _ _ 19 altri ALTRO PRON PRON INDEF|M|PL|LSUBJ+LOBJ+OBL _ _ _ _ 20 ) #\) PUNCT PUNCT _ _ _ _ _ 21 del DEL@TUTTO ADV ADV MANNER|LOCUTION _ _ _ _ 22 tutto DEL@TUTTO ADV ADV MANNER|LOCUTION _ _ _ _ 23 disapplicato DISAPPLICATO ADJ ADJ QUALIF|M|SING _ _ _ _ 24 . #\. PUNCT PUNCT _ _ _ _ _ B. Samples for Constituency Parsing _________________________________________________ B.1. Sentence CODICECIVILE-108 in TUT-PENN format, as in the Evalita development set: ************** FRASE CODICECIVILE-108 ************** ( (S (NP-SBJ (NP (ART~DE La) (ADJ~QU mancata) (NOU~CS definizione)) (PP (PREP della) (NP (NP (ART~DE della) (NOU~CS estensione)) (PP (PREP della) (NP (ART~DE della) (ADJ~QU minima) (NOU~CA unità) (ADJ~QU colturale)))))) (VP (VAU~RE ha) (VP (VMA~PA reso) (NP (ADJ~DE quest') (NOU~CS articolo)) (PRN (-LRB- -LRB-) (PP (PREP come) (NP (ART~DE gli) (PRO~ID altri))) (-RRB- -RRB-)) (ADJP-PRD (ADVB DEL_TUTTO) (ADJ~QU disapplicato)))) (. .)) ) B.2. Sentence CODICECIVILE-108 in TUT-PENN format WITHOUT SYNTACTIC ANNOTATION, as in the Evalita TEST SET: ************** FRASE CODICECIVILE-108 ************** 1 La (ART~DE) 2 mancata (ADJ~QU) 3 definizione (NOU~CS) 4 della (PREP) 5 della (ART~DE) 6 estensione (NOU~CS) 7 della (PREP) 8 della (ART~DE) 9 minima (ADJ~QU) 10 unità (NOU~CA) 11 colturale (ADJ~QU) 12 ha (VAU~RE) 13 reso (VMA~PA) 14 quest' (ADJ~DE) 15 articolo (NOU~CS) 16 ( (PUNCT) 17 come (PREP) 18 gli (ART~DE) 19 altri (PRO~ID) 20 ) (PUNCT) 21 DEL_TUTTO (ADVB) 22 disapplicato (ADJ~QU) 23 . (PUNCT) Observe in particular line 21 that shows a multi-word case ('del tutto'). According to the TUT-PENN format, all the words of a multi-word are presented on a single line (i.e. 'del' and 'tutto' occur on the same line), separated by underscores and associated to a single PoS tag (i.e. ADVB). The lemmatized form of the words in uppercase characters is presented for multi-words, rather than, as usual for the other words, the word form.