2024-03-29T06:59:58Zhttp://oai-repositori.upf.edu/oai/requestoai:repositori.upf.edu:10230/12962009-03-05T03:24:43Zcom_10230_14com_10230_3col_10230_26oai:repositori.upf.edu:10230/12972009-03-05T03:24:43Zcom_10230_14com_10230_3col_10230_26oai:repositori.upf.edu:10230/13002009-03-05T03:24:43Zcom_10230_14com_10230_3col_10230_26oai:repositori.upf.edu:10230/12932019-02-01T11:53:47Zcom_10230_14com_10230_3col_10230_26
El Corpus de l'IULA: etiquetaris
Morel Santasusagna, Jordi
Torner Castells, Sergi
Vivaldi, J. (Jorge), 1952-
Cabré, M. Teresa (Maria Teresa), 1947-
Yzaguirre, Lluís de
El projecte central que es duu a terme a l'Institut Universitari de Lingüística Aplicada (IULA) de la Universitat Pompeu Fabra és el corpus de Llenguatges especialitzats. En el marc d'aquest projecte —que implica cinc dominis d'especialitat (dret, economia, informàtica, medi ambient i medicina) i cinc llengües (català, castellà, francès, anglès i alemany)— s'han desenvolupat dos etiquetaris per a la llengua catalana i castellana. Amb el desenvolupament d'aquests etiquetaris es pretén facilitar l'etapa del processament lingüístic del corpus. En aquest paper es discuteixen, d'una banda, alguns aspectes teòrics relatius a la construcció d'etiquetaris i, de l'altra, es presenten els dos etiquetaris que s'han elaborat a l'IULA.
2012-07-11
2012-07-11
1998
2012-07-10
info:eu-repo/semantics/workingPaper
http://hdl.handle.net/10230/1293
cat
Aquest document està subjecte a una llicència d'ús de Creative Commons, amb la qual es permet copiar, distribuir i comunicar públicament l'obra sempre que se'n citin l’autor original, la universitat i el departament i no se’n faci cap ús comercial ni obra derivada, tal com queda estipulat en la llicència d'ús (http://creativecommons.org/licenses/by-nc-nd/2.1/es/)
Universitat Pompeu Fabra. Institut Universitari de Lingüística Aplicada
oai:repositori.upf.edu:10230/12942018-01-24T08:26:18Zcom_10230_14com_10230_3col_10230_26
Descripció quantitativa dels neologismes documentats durant l'any 1995 a la premsa en català
Freixa, Judit
Solé, Elisabet
Cabré, M. Teresa (Maria Teresa), 1947-
Universitat Pompeu Fabra. Observatori de Neologia
Descripció dels neologismes de l'Observatori de Neologia documentats a la premsa en català (Avui, Punt Diari, El Temps) de l'any 1995, a partir del recurs de creació que els ha generat: processos formals (derivació, composició, sintagmació, conversió sintàctica, truncació, etc.), processos semàntics i manlleus.
2012-07-11
2012-07-11
1998
2012-07-10
info:eu-repo/semantics/workingPaper
http://hdl.handle.net/10230/1294
cat
Aquest document està subjecte a una llicència d'ús de Creative Commons, amb la qual es permet copiar, distribuir i comunicar públicament l'obra sempre que se'n citin l’autor original, la universitat i el departament i no se’n faci cap ús comercial ni obra derivada, tal com queda estipulat en la llicència d'ús (http://creativecommons.org/licenses/by-nc-nd/2.1/es/)
Universitat Pompeu Fabra. Institut Universitari de Lingüística Aplicada
oai:repositori.upf.edu:10230/12952018-01-24T08:26:29Zcom_10230_14com_10230_3col_10230_26
Ontologies: a review
Feliu, Judit
Vivaldi, J. (Jorge), 1952-
Cabré, M. Teresa (Maria Teresa), 1947-
En aquest paper, analitzem les principals ontologies amb la finalitat de dibuixar un panorama general d'una de les eines més utilitzades en l'estructuració del coneixement. En primer lloc, presentem una àmplia descripció de les cinc ontologies més difoses entre la comunitat científica dedicada a la gestió de la informació. Seguidament, repassem breument algunes de les eines de gestió que s'utilitzen per crear i actualitzar ontologies. I, finalment, presentem algunes conclusions en relació a la selecció d'una ontologia i d'un sistema de gestió per a la seva utilització en el marc dels projectes vigents del grup IULATERM.
2012-07-11
2012-07-11
2002
2012-07-10
info:eu-repo/semantics/workingPaper
http://hdl.handle.net/10230/1295
eng
Aquest document està subjecte a una llicència d'ús de Creative Commons, amb la qual es permet copiar, distribuir i comunicar públicament l'obra sempre que se'n citin l’autor original, la universitat i el departament i no se’n faci cap ús comercial ni obra derivada, tal com queda estipulat en la llicència d'ús (http://creativecommons.org/licenses/by-nc-nd/2.1/es/)
Universitat Pompeu Fabra. Institut Universitari de Lingüística Aplicada
oai:repositori.upf.edu:10230/45122018-01-24T08:26:24Zcom_10230_14com_10230_3col_10230_26
Transcription, tagging and coding of bilingual corpora via LIDES
Turell, M. Teresa (Maria Teresa), 1949-2013
Forcadell, Montserrat
L'objectiu d'aquest informe és presentar l'aplicació d'una sèrie de propostes sobre transcripció, etiquetatge i codificació a dos corpus: el corpus bilingüe LC (La Canonja (Català-Espanyol)) i el corpus trilingüe CSCD (Code-switching as Communicative Design (Català-Espanyol-Anglès)). Aquestes propostes, que constitueixen l'aportació de l'equip IULA-LIPPS (Language Interaction in Plurilingual and Plurilectal Speakers) al manual de codificació del sistema LIDES (Language Interaction Database Exchange System), adoptat pel grup europeu LIPPS, poden ser útils per transcriure, etiquetar i codificar dades provinents de llengües tipològicament properes i distants.
2012-07-11
2012-07-11
1997
2012-07-10
info:eu-repo/semantics/workingPaper
http://hdl.handle.net/10230/4512
eng
Aquest document està subjecte a una llicència d'ús de Creative Commons, amb la qual es permet copiar, distribuir i comunicar públicament l'obra sempre que se'n citin l’autor original, la universitat i el departament i no se’n faci cap ús comercial ni obra derivada, tal com queda estipulat en la llicència d'ús (http://creativecommons.org/licenses/by-nc-nd/2.1/es/)
Universitat Pompeu Fabra. Institut Universitari de Lingüística Aplicada
oai:repositori.upf.edu:10230/45132020-11-12T11:06:16Zcom_10230_14com_10230_3col_10230_26
Sistemes d'extracció automàtica de (candidats a) termes: estat de la qüestió
Estopà, Rosa
Cabré, M. Teresa (Maria Teresa), 1947-
Vivaldi, J. (Jorge), 1952-
Des de l'aparició de TERMINO l'any 1990 fins avui dia s'han portat a terme una sèrie de projectes per dissenyar diferents tipus d'extractors automàtics de terminologia, però malgrat la gran quantitat d'estudis que s'estan realitzant en aquesta línia, els resultats no són del tot satisfactoris. Aquest article presenta una anàlisi dels principals sistemes d'extracció automàtica de terminologia amb la finalitat de dibuixar un panorama general de l'estat de la qüestió. L'estudi comença amb la descripció de diversos sistemes d'extracció de terminologia; en el segon apartat, es comparen els diferents sistemes. L'informe finalitza amb unes conclusions sobre els sistemes analitzats i sobre els criteris que podrien guiar una proposta d'un sistema integrador d'extracció de terminologia.
2012-07-11
2012-07-11
1998
2012-07-10
info:eu-repo/semantics/workingPaper
http://hdl.handle.net/10230/4513
cat
Aquest document està subjecte a una llicència d'ús de Creative Commons, amb la qual es permet copiar, distribuir i comunicar públicament l'obra sempre que se'n citin l’autor original, la universitat i el departament i no se’n faci cap ús comercial ni obra derivada, tal com queda estipulat en la llicència d'ús (http://creativecommons.org/licenses/by-nc-nd/2.1/es/)
Universitat Pompeu Fabra. Institut Universitari de Lingüística Aplicada
oai:repositori.upf.edu:10230/12982018-01-24T08:26:17Zcom_10230_14com_10230_3col_10230_26
10 anys del Corpus de l'IULA
Cabré, M. Teresa (Maria Teresa), 1947-
Bach, Carme, 1971-
Vivaldi, J. (Jorge), 1952-
Universitat Pompeu Fabra. Institut Universitari de Lingüística Aplicada (IULA)
En aquest paper, es presenten els criteris de treball que s'han seguit durant els 10 anys en què s'ha anat constituint el corpus de l'IULA. S'exposa l'estat de les dades del corpus, els recursos lèxics utilitzats per al tractament de les dades (diccionaris i etiquetaris) i les eines constituïdes o adaptades. Es dedica especial atenció a la documentació de la cadena de treball de processament del corpus, des de l'adquisició dels textos en format electrònic fins a la seva incorporació definitiva al corpus.
2012-07-11
2012-07-11
2006-12-19
2012-07-10
info:eu-repo/semantics/workingPaper
http://hdl.handle.net/10230/1298
cat
Aquest document està subjecte a una llicència d'ús de Creative Commons, amb la qual es permet copiar, distribuir i comunicar públicament l'obra sempre que se'n citin l'autor original, la universitat i l'institut i no se'n faci cap ús comercial ni obra derivada, tal com queda estipulat en la llicència d'ús (http://creativecommons.org/licenses/by-nc-nd/2.5/es/)
oai:repositori.upf.edu:10230/12992018-01-24T08:33:56Zcom_10230_14com_10230_3col_10230_26
El Corpus de l'IULA: descripció
Bach, Carme, 1971-
Saurí Colomer, Roser
Vivaldi, J. (Jorge), 1952-
Cabré, M. Teresa (Maria Teresa), 1947-
El principal projecte de recerca desenvolupat a l'Institut Universitari de Lingüística Aplicada (IULA) de la Universitat Pompeu Fabra és el projecte de Llenguatges especialitzats, sota el qual s'aglutina la totalitat dels investigadors pertanyents a aquest centre. És en aquest marc de recerca on es duu a terme la constitució d'un corpus plurilingüe (català, castellà, francès, anglès i alemany), especialitzat en les àrees del dret, l'economia, la informàtica, el medi ambient i la medicina. En aquest article es descriuen els criteris que s'han tingut en compte per al disseny d'aquest recurs lingüístic i cada una de les fases de desenvolupament que s'han seguit. El resultat de diferents estadis en el procés d'elaboració del corpus es mostra en un conjunt d'annexos al final de l'article, on s'incorpora, a més, una síntesi de l'estat actual del projecte, periòdicament actualitzada.
2012-07-11
2012-07-11
1997
2012-07-10
info:eu-repo/semantics/workingPaper
http://hdl.handle.net/10230/1299
cat
Aquest document està subjecte a una llicència d'ús de Creative Commons, amb la qual es permet copiar, distribuir i comunicar públicament l'obra sempre que se'n citin l’autor original, la universitat i el departament i no se’n faci cap ús comercial ni obra derivada, tal com queda estipulat en la llicència d'ús (http://creativecommons.org/licenses/by-nc-nd/2.1/es/)
Universitat Pompeu Fabra. Institut Universitari de Lingüística Aplicada
oai:repositori.upf.edu:10230/45142019-01-29T12:08:35Zcom_10230_14com_10230_3col_10230_26
Marcatge estructural i morfosintàctic del Corpus Tècnic amb l'estàndard SGML
Vivaldi, J. (Jorge), 1952-
DeYzaguirre, Ll.
Solé, Xavier
Cabré, M. Teresa (Maria Teresa), 1947-
L'edició de textos fent ús de mitjans informàtics ha comportat avantatges i inconvenients. Mentre que ha fet molt accessible l'edició acurada de textos també ha provocat tot un seguit de problemes, un del quals és la dificultat de compartir recursos.Per altra banda, la lingüística necessita emprar corpus voluminosos per conèixer amb més precisió i fonament el comportament real del llenguatge. És evident que l'obtenció i consegüent preparació d'un corpus per a la seva explotació esdevé un procés costós en temps i recursos, motiu pel qual és força atractiu i gairebé necessari compartir aquest material de recerca amb altres organitzacions. En aquest treball s'examinen les diferents propostes d'aplicació de l'estàndard SGML (Standard Generalized Markup Language) en la constitució de corpus textuals per a la recerca lingüística, amb èmfasi especial en les solucions proposades a l'Institut Universitari de Lingüística Aplicada de la Universitat Pompeu Fabra.
2012-07-11
2012-07-11
1996
2012-07-10
info:eu-repo/semantics/workingPaper
http://hdl.handle.net/10230/4514
cat
Aquest document està subjecte a una llicència d'ús de Creative Commons, amb la qual es permet copiar, distribuir i comunicar públicament l'obra sempre que se'n citin l’autor original, la universitat i el departament i no se’n faci cap ús comercial ni obra derivada, tal com queda estipulat en la llicència d'ús (http://creativecommons.org/licenses/by-nc-nd/2.1/es/)
Universitat Pompeu Fabra. Institut Universitari de Lingüística Aplicada
oai:repositori.upf.edu:10230/13012018-01-24T08:26:14Zcom_10230_14com_10230_3col_10230_26
A survey on transfer-based approaches to MT using feature structures
Tuells, Antoni
Badia i Cardús, Antoni
Aquest treball és una revisió d'alguns sistemes de Traducció Automàtica que segueixen l'estratègia de Transfer i fan servir estructures de trets com a eina de representació. El treball s'integra dins el projecte MLAP-9315, projecte que investiga la reutilització de les especificacions lingüístiques del projecte EUROTRA per estàndards industrials.
2012-07-11
2012-07-11
1997
2012-07-10
info:eu-repo/semantics/workingPaper
http://hdl.handle.net/10230/1301
eng
Aquest document està subjecte a una llicència d'ús de Creative Commons, amb la qual es permet copiar, distribuir i comunicar públicament l'obra sempre que se'n citin l’autor original, la universitat i el departament i no se’n faci cap ús comercial ni obra derivada, tal com queda estipulat en la llicència d'ús (http://creativecommons.org/licenses/by-nc-nd/2.1/es/)
Universitat Pompeu Fabra. Institut Universitari de Lingüística Aplicada