2024-03-29T07:03:21Zhttp://oai-repositori.upf.edu/oai/requestoai:repositori.upf.edu:10230/12962009-03-05T03:24:43Zcom_10230_14com_10230_3col_10230_26oai:repositori.upf.edu:10230/12972009-03-05T03:24:43Zcom_10230_14com_10230_3col_10230_26oai:repositori.upf.edu:10230/13002009-03-05T03:24:43Zcom_10230_14com_10230_3col_10230_26oai:repositori.upf.edu:10230/12932019-02-01T11:53:47Zcom_10230_14com_10230_3col_10230_26
Repositori digital de la UPF
author
Morel Santasusagna, Jordi
author
Torner Castells, Sergi
author
Vivaldi, J. (Jorge), 1952-
author
Cabré, M. Teresa (Maria Teresa), 1947-
author
Yzaguirre, Lluís de
2012-07-11T02:19:30Z
2012-07-11T02:19:30Z
1998
http://hdl.handle.net/10230/1293
El projecte central que es duu a terme a l'Institut Universitari de Lingüística Aplicada (IULA) de la Universitat Pompeu Fabra és el corpus de Llenguatges especialitzats. En el marc d'aquest projecte —que implica cinc dominis d'especialitat (dret, economia, informàtica, medi ambient i medicina) i cinc llengües (català, castellà, francès, anglès i alemany)— s'han desenvolupat dos etiquetaris per a la llengua catalana i castellana. Amb el desenvolupament d'aquests etiquetaris es pretén facilitar l'etapa del processament lingüístic del corpus. En aquest paper es discuteixen, d'una banda, alguns aspectes teòrics relatius a la construcció d'etiquetaris i, de l'altra, es presenten els dos etiquetaris que s'han elaborat a l'IULA.
cat
El Corpus de l'IULA: etiquetaris
info:eu-repo/semantics/workingPaper
URL
http://repositori.upf.edu/bitstream/10230/1293/1/98inf018.pdf
File
MD5
483a57edcaa0cb110d609ccd58688ee7
472460
application/pdf
98inf018.pdf
URL
http://repositori.upf.edu/bitstream/10230/1293/2/98inf018.pdf.txt
File
MD5
ea6193568b9c0a18e252cf523e6493b3
132891
text/plain
98inf018.pdf.txt
oai:repositori.upf.edu:10230/12942018-01-24T08:26:18Zcom_10230_14com_10230_3col_10230_26
Repositori digital de la UPF
author
Freixa, Judit
author
Solé, Elisabet
author
Cabré, M. Teresa (Maria Teresa), 1947-
author
Universitat Pompeu Fabra. Observatori de Neologia
2012-07-11T02:19:30Z
2012-07-11T02:19:30Z
1998
http://hdl.handle.net/10230/1294
Descripció dels neologismes de l'Observatori de Neologia documentats a la premsa en català (Avui, Punt Diari, El Temps) de l'any 1995, a partir del recurs de creació que els ha generat: processos formals (derivació, composició, sintagmació, conversió sintàctica, truncació, etc.), processos semàntics i manlleus.
cat
Descripció quantitativa dels neologismes documentats durant l'any 1995 a la premsa en català
info:eu-repo/semantics/workingPaper
URL
http://repositori.upf.edu/bitstream/10230/1294/1/98inf023.pdf
File
MD5
10d0e9315dfa3c90e1817f8b93aa52ac
247011
application/pdf
98inf023.pdf
URL
http://repositori.upf.edu/bitstream/10230/1294/2/98inf023.pdf.txt
File
MD5
fe1f3b501a3b474808537556c4c7450d
69631
text/plain
98inf023.pdf.txt
oai:repositori.upf.edu:10230/12952018-01-24T08:26:29Zcom_10230_14com_10230_3col_10230_26
Repositori digital de la UPF
author
Feliu, Judit
author
Vivaldi, J. (Jorge), 1952-
author
Cabré, M. Teresa (Maria Teresa), 1947-
2012-07-11T02:19:31Z
2012-07-11T02:19:31Z
2002
http://hdl.handle.net/10230/1295
En aquest paper, analitzem les principals ontologies amb la finalitat de dibuixar un panorama general d'una de les eines més utilitzades en l'estructuració del coneixement. En primer lloc, presentem una àmplia descripció de les cinc ontologies més difoses entre la comunitat científica dedicada a la gestió de la informació. Seguidament, repassem breument algunes de les eines de gestió que s'utilitzen per crear i actualitzar ontologies. I, finalment, presentem algunes conclusions en relació a la selecció d'una ontologia i d'un sistema de gestió per a la seva utilització en el marc dels projectes vigents del grup IULATERM.
eng
Ontologies: a review
info:eu-repo/semantics/workingPaper
URL
http://repositori.upf.edu/bitstream/10230/1295/1/02inf034.pdf
File
MD5
b759997b6273be28432069c4182ea7c8
669487
application/pdf
02inf034.pdf
URL
http://repositori.upf.edu/bitstream/10230/1295/2/02inf034.pdf.txt
File
MD5
e2744dc693090887ab0e2861e9d79a91
121383
text/plain
02inf034.pdf.txt
oai:repositori.upf.edu:10230/45122018-01-24T08:26:24Zcom_10230_14com_10230_3col_10230_26
Repositori digital de la UPF
author
Turell, M. Teresa (Maria Teresa), 1949-2013
author
Forcadell, Montserrat
2012-07-11T02:19:31Z
2012-07-11T02:19:31Z
1997
http://hdl.handle.net/10230/4512
L'objectiu d'aquest informe és presentar l'aplicació d'una sèrie de propostes sobre transcripció, etiquetatge i codificació a dos corpus: el corpus bilingüe LC (La Canonja (Català-Espanyol)) i el corpus trilingüe CSCD (Code-switching as Communicative Design (Català-Espanyol-Anglès)). Aquestes propostes, que constitueixen l'aportació de l'equip IULA-LIPPS (Language Interaction in Plurilingual and Plurilectal Speakers) al manual de codificació del sistema LIDES (Language Interaction Database Exchange System), adoptat pel grup europeu LIPPS, poden ser útils per transcriure, etiquetar i codificar dades provinents de llengües tipològicament properes i distants.
eng
Transcription, tagging and coding of bilingual corpora via LIDES
info:eu-repo/semantics/workingPaper
URL
http://repositori.upf.edu/bitstream/10230/4512/1/97inf021.pdf
File
MD5
5cbf22847fc78dfc1ea4ffa843e3c18b
130621
application/pdf
97inf021.pdf
URL
http://repositori.upf.edu/bitstream/10230/4512/2/97inf021.pdf.txt
File
MD5
cef6e3afbfb198c77634c7be8461ade9
49251
text/plain
97inf021.pdf.txt
oai:repositori.upf.edu:10230/45132020-11-12T11:06:16Zcom_10230_14com_10230_3col_10230_26
Repositori digital de la UPF
author
Estopà, Rosa
author
Cabré, M. Teresa (Maria Teresa), 1947-
author
Vivaldi, J. (Jorge), 1952-
2012-07-11T02:19:31Z
2012-07-11T02:19:31Z
1998
http://hdl.handle.net/10230/4513
Des de l'aparició de TERMINO l'any 1990 fins avui dia s'han portat a terme una sèrie de projectes per dissenyar diferents tipus d'extractors automàtics de terminologia, però malgrat la gran quantitat d'estudis que s'estan realitzant en aquesta línia, els resultats no són del tot satisfactoris. Aquest article presenta una anàlisi dels principals sistemes d'extracció automàtica de terminologia amb la finalitat de dibuixar un panorama general de l'estat de la qüestió. L'estudi comença amb la descripció de diversos sistemes d'extracció de terminologia; en el segon apartat, es comparen els diferents sistemes. L'informe finalitza amb unes conclusions sobre els sistemes analitzats i sobre els criteris que podrien guiar una proposta d'un sistema integrador d'extracció de terminologia.
cat
Sistemes d'extracció automàtica de (candidats a) termes: estat de la qüestió
info:eu-repo/semantics/workingPaper
URL
http://repositori.upf.edu/bitstream/10230/4513/1/98inf022.pdf
File
MD5
06c0b53473392113477ec85d27ef87f6
501751
application/pdf
98inf022.pdf
URL
http://repositori.upf.edu/bitstream/10230/4513/2/98inf022.pdf.txt
File
MD5
177b5a81e2fe58dcc0274ad187dec582
161352
text/plain
98inf022.pdf.txt
oai:repositori.upf.edu:10230/12982018-01-24T08:26:17Zcom_10230_14com_10230_3col_10230_26
Repositori digital de la UPF
author
Cabré, M. Teresa (Maria Teresa), 1947-
author
Bach, Carme, 1971-
author
Vivaldi, J. (Jorge), 1952-
other
Universitat Pompeu Fabra. Institut Universitari de Lingüística Aplicada (IULA)
2012-07-11T02:19:31Z
2012-07-11T02:19:31Z
2006-12-19T15:33:35Z
http://hdl.handle.net/10230/1298
En aquest paper, es presenten els criteris de treball que s'han seguit durant els 10 anys en què s'ha anat constituint el corpus de l'IULA. S'exposa l'estat de les dades del corpus, els recursos lèxics utilitzats per al tractament de les dades (diccionaris i etiquetaris) i les eines constituïdes o adaptades. Es dedica especial atenció a la documentació de la cadena de treball de processament del corpus, des de l'adquisició dels textos en format electrònic fins a la seva incorporació definitiva al corpus.
cat
10 anys del Corpus de l'IULA
info:eu-repo/semantics/workingPaper
URL
http://repositori.upf.edu/bitstream/10230/1298/1/06inf044.pdf
File
MD5
00cefc6db5449adce173835f9835ba15
977329
application/pdf
06inf044.pdf
URL
http://repositori.upf.edu/bitstream/10230/1298/2/06inf044.pdf.txt
File
MD5
a3f146fdbceccf7973bf12350c0fd1b5
229317
text/plain
06inf044.pdf.txt
oai:repositori.upf.edu:10230/12992018-01-24T08:33:56Zcom_10230_14com_10230_3col_10230_26
Repositori digital de la UPF
author
Bach, Carme, 1971-
author
Saurí Colomer, Roser
author
Vivaldi, J. (Jorge), 1952-
author
Cabré, M. Teresa (Maria Teresa), 1947-
2012-07-11T02:19:31Z
2012-07-11T02:19:31Z
1997
http://hdl.handle.net/10230/1299
El principal projecte de recerca desenvolupat a l'Institut Universitari de Lingüística Aplicada (IULA) de la Universitat Pompeu Fabra és el projecte de Llenguatges especialitzats, sota el qual s'aglutina la totalitat dels investigadors pertanyents a aquest centre. És en aquest marc de recerca on es duu a terme la constitució d'un corpus plurilingüe (català, castellà, francès, anglès i alemany), especialitzat en les àrees del dret, l'economia, la informàtica, el medi ambient i la medicina. En aquest article es descriuen els criteris que s'han tingut en compte per al disseny d'aquest recurs lingüístic i cada una de les fases de desenvolupament que s'han seguit. El resultat de diferents estadis en el procés d'elaboració del corpus es mostra en un conjunt d'annexos al final de l'article, on s'incorpora, a més, una síntesi de l'estat actual del projecte, periòdicament actualitzada.
cat
El Corpus de l'IULA: descripció
info:eu-repo/semantics/workingPaper
URL
http://repositori.upf.edu/bitstream/10230/1299/1/97inf017.pdf
File
MD5
d33eda430aba8797c2cefda0291dfe51
944360
application/pdf
97inf017.pdf
URL
http://repositori.upf.edu/bitstream/10230/1299/2/97inf017.pdf.txt
File
MD5
e9527692bc05f42594e857f6601f2099
84252
text/plain
97inf017.pdf.txt
oai:repositori.upf.edu:10230/45142019-01-29T12:08:35Zcom_10230_14com_10230_3col_10230_26
Repositori digital de la UPF
author
Vivaldi, J. (Jorge), 1952-
author
DeYzaguirre, Ll.
author
Solé, Xavier
author
Cabré, M. Teresa (Maria Teresa), 1947-
2012-07-11T02:19:31Z
2012-07-11T02:19:31Z
1996
http://hdl.handle.net/10230/4514
L'edició de textos fent ús de mitjans informàtics ha comportat avantatges i inconvenients. Mentre que ha fet molt accessible l'edició acurada de textos també ha provocat tot un seguit de problemes, un del quals és la dificultat de compartir recursos.Per altra banda, la lingüística necessita emprar corpus voluminosos per conèixer amb més precisió i fonament el comportament real del llenguatge. És evident que l'obtenció i consegüent preparació d'un corpus per a la seva explotació esdevé un procés costós en temps i recursos, motiu pel qual és força atractiu i gairebé necessari compartir aquest material de recerca amb altres organitzacions. En aquest treball s'examinen les diferents propostes d'aplicació de l'estàndard SGML (Standard Generalized Markup Language) en la constitució de corpus textuals per a la recerca lingüística, amb èmfasi especial en les solucions proposades a l'Institut Universitari de Lingüística Aplicada de la Universitat Pompeu Fabra.
cat
Marcatge estructural i morfosintàctic del Corpus Tècnic amb l'estàndard SGML
info:eu-repo/semantics/workingPaper
URL
http://repositori.upf.edu/bitstream/10230/4514/1/IULAInformes1.pdf
File
MD5
d61d3ba61e92b74029df51259cd90a91
560602
application/pdf
IULAInformes1.pdf
URL
http://repositori.upf.edu/bitstream/10230/4514/2/IULAInformes1.pdf.txt
File
MD5
0bb4698f3b915e754fa4c0b7eb0c6840
117693
text/plain
IULAInformes1.pdf.txt
oai:repositori.upf.edu:10230/13012018-01-24T08:26:14Zcom_10230_14com_10230_3col_10230_26
Repositori digital de la UPF
author
Tuells, Antoni
author
Badia i Cardús, Antoni
2012-07-11T02:19:31Z
2012-07-11T02:19:31Z
1997
http://hdl.handle.net/10230/1301
Aquest treball és una revisió d'alguns sistemes de Traducció Automàtica que segueixen l'estratègia de Transfer i fan servir estructures de trets com a eina de representació. El treball s'integra dins el projecte MLAP-9315, projecte que investiga la reutilització de les especificacions lingüístiques del projecte EUROTRA per estàndards industrials.
eng
A survey on transfer-based approaches to MT using feature structures
info:eu-repo/semantics/workingPaper
URL
http://repositori.upf.edu/bitstream/10230/1301/1/97inf016.pdf
File
MD5
fa0c90d7cf710f28471ef5db24894aad
431144
application/pdf
97inf016.pdf
URL
http://repositori.upf.edu/bitstream/10230/1301/2/97inf016.pdf.txt
File
MD5
33d2b0c7d0a700bbd41648d56d751d66
60141
text/plain
97inf016.pdf.txt