2024-03-29T10:10:32Zhttp://oai-repositori.upf.edu/oai/requestoai:repositori.upf.edu:10230/246672017-05-08T13:58:49Zcom_10230_5963col_10230_24666
Unidades de conocimiento especializado para la traducción jurídica: identificación y propuesta de representación de la equivalencia del derecho de extranjería en un diccionario bilingüe español-rumano [datos de investigación]
Cornea, Ioana
Los anexos se componen de 6 ficheros a saber: encuesta, corpus, textos normativos, vaciado UCE, árbol de campo y tabla comparativa. El primer fichero titulado Encuesta contiene las encuestas realizadas a los traductores rumanos. El segundo, Corpus, comprende el corpus en español y rumano y los datos obtenidos con las aplicaciones Extracted Keywords y Compare Corpora de la herramienta Sketch Engine. El tercer archivo, Textos normativos abarcan los textos normativos que regulan el derecho de extranjería en España y Rumanía y el mapping de las palabras clave. El cuarto fichero, Vaciado UCE engloba el vaciado completo de las UCE extraídas, mientras que el quinto anexo, comprende las UCE representadas en dos árboles de campo. Por último, el sexto anexo contiene la tabla comparativa con toda la información conceptual que se extrajo de los textos normativos para analizar contrastivamente una muestra de unidades de conocimiento especializado.
2015
info:eu-repo/semantics/other
Dataset
http://hdl.handle.net/10230/24667
spa
http://hdl.handle.net/10803/295967
CC0 1.0 Universal
http://creativecommons.org/publicdomain/zero/1.0/
info:eu-repo/semantics/openAccess
oai:repositori.upf.edu:10230/259392018-01-24T08:12:42Zcom_10230_5963col_10230_24666
Anàlisi crítica de llibres de text de català per a no catalanoparlants adults en temps de neoliberalisme [dades de recerca]
Bori, Pau
Inclou: Annex 1 - Enquestes sobre l’ús de materials didàctics: S’hi presenten dues enquestes a professorat de català per a no catalanoparlants adults realitzades durant l’elaboració de la tesi. La primera (de maig de 2011) va ser enviada al professorat de la xarxa d’estudis catalans a l’exterior de l’Institut Ramon Llull. La segona (de febrer de 2014) va ser enviada a centres del Consorci per la Normalització Lingüística de Catalunya i a serveis lingüístics d’universitats catalanes. Les respostes del professorat van servir per confirmar l’interès pel tema de la recerca, com també per recollir informació sobre els llocs on s’empren (o on s’han emprat) els materials del corpus d’estudi. A partir d’aquesta darrera informació, a l’apartat 12 de l’annex II resumim en quins contextos educatius s’utilitzen els diferents ítems del corpus. Annex II - Descripció del corpus d’estudi: S’hi recullen les graelles elaborades per fer una descripció detallada de cadascun dels ítems del corpus d’estudi. Cada graella recull informació rellevant per a la descripció formal dels materials didàctics objecte d’anàlisi: informació bibliogràfica, destinataris, nivell d’aprenentatge, descripció física, estructura, informació sobre el material auditiu, el disseny i les imatges, el seu ús. A més, cada graella compta amb un apartat on fem una descripció d’un extracte del material. L’organització d’aquestes graelles és una adaptació de les graelles que va emprar Littlejohn (1992) per als llibres de text del corpus de la seva tesi doctoral, com s’exposa en l’apartat de Metodologia. Annex 3 - Descripció del contingut i categories superiors dels textos extensos/nEn aquest darrer annex, recollim totes les graelles creades a partir de cadascuna de les 7 col•leccions del corpus que ens han servit per generar els resultats de l’anàlisi quantitativa. Cada graella conté una breu descripció de cadascun dels textos extensos comptabilitzats, com també la classificació de cada text en les categories superiors de contingut que hem elaborat per a l’anàlisi quantitativa d’aquesta tesi.
Dades de recerca de la tesi "Anàlisi crítica de llibres de text de català per a no catalanoparlants adults en temps de neoliberalisme"
2015
info:eu-repo/semantics/other
Dataset
http://hdl.handle.net/10230/25939
cat
http://hdl.handle.net/10803/350798
CC0 1.0 Universal
http://creativecommons.org/publicdomain/zero/1.0/
info:eu-repo/semantics/openAccess
application/pdf
oai:repositori.upf.edu:10230/337462018-02-19T10:58:52Zcom_10230_5963col_10230_24666
Estudi lexicomètric del vocabulari del procés d'aprovació de l'Estatut d'Autonomia de Catalunya (2006) [dades de recerca]
Morales Moreno, Albert
Lexicometria
Corpus d'anàlisi utilitzat en l'estudi lexicomètric de la tesi doctoral "Morales A. Estudi lexicomètric del vocabulari del procés d'aprovació de l'Estatut d'autonomia de Catalunya (2006) [tesi]. Barcelona: Universitat Pompeu Fabra; 2015. 600 p.".
2015
info:eu-repo/semantics/other
Dataset
http://hdl.handle.net/10230/33746
cat
Publicació relacionada: Morales Moreno, Albert. Estudi lexicomètric del vocabulari del procés d'aprovació de l'Estatut d'autonomia de Catalunya (2006). 2015. http://hdl.handle.net/10803/350795
http://hdl.handle.net/10803/350795
CC0 1.0 Universal (CC0 1.0) . Public Domain Dedication
http://creativecommons.org/publicdomain/zero/1.0/
info:eu-repo/semantics/openAccess
Universitat Pompeu Fabra
oai:repositori.upf.edu:10230/339282018-02-19T10:10:02Zcom_10230_5963col_10230_24666
MultiBooked_Corpora [research data]
Barnes, Jeremy
Cross-lingual sentiment analysis
Sentiment analysis
Under-resourced languages
Catalan
Basque
Análisis de sentimiento
Catalán
Euskera
Análisi de sentiment
Català
Iritzien
Analisia
Euskara
The corpora are compiled from hotel reviews taken mainly from booking.com. The corpora are in Kaf/Naf format [https://github.com/opener-project/kaf/wiki/KAF-structure-overview] [https://github.com/newsreader/NAF], which is an xml-style stand-off format that allows for multiple layers of annotation. Each review was sentence- and word-tokenized and lemmatized using Freeling [http://nlp.lsi.upc.edu/freeling/node/1] for Catalan and ixa-pipes [http://ixa2.si.ehu.es/ixa-pipes/] for Basque. Finally, for each language two annotators annotated opinion holders, opinion targets, and opinion expressions for each review, following the guidelines set out in the OpeNER project [http://www.opener-project.eu/]. Details can be found in the paper.
This package includes the two corpora, as well as providing scripts to obtain corpus statistics (corpus_stats.py), reproduce the benchmarks reported in the paper (crf.py), extract only the opinionated units from the text (extract_opinions.py), or map the aspect-level annotations to sentence- or document-level annotated corpora (extract_sentences.py).
Requirements for stats and extraction: Python 3, NumPy
We release two corpora of hotel reviews annotated for aspect-level sentiment analysis in Catalan and Basque. We also include scripts which allow the conversion to sentence-level annotations and provide benchmarks for opinion holder, target, and expression extraction based on conditional random fields.
2015-01
info:eu-repo/semantics/other
Dataset
Barnes J. MultiBooked_Corpora [research data]. Repositori Digital de la UPF: Barcelona; 2015. Disponible a: http://hdl.handle.net/10230/33928
http://hdl.handle.net/10230/33928
cat
eus
Publicació relacionada: Barnes J, Lambert P, Badia T. Multibooked: a corpus of Basque and Catalan hotel reviews annotated for aspect-level sentiment classification. Paper persented at: Language Resources and Evaluation Conference (LREC); 2018 May 7-12; Miyazaki, Japan.
Licensed under the terms of the Creative Commons CC-BY public license.
http://creativecommons.org/licenses/by/3.0/es/
info:eu-repo/semantics/openAccess
oai:repositori.upf.edu:10230/358422019-09-03T11:42:59Zcom_10230_5963col_10230_24666
Nonatomic distributivity experiment 2017
Wohlmuth, Kata
Linguistics
Semantics
Plurality
Distributivity
Nonatomic distributivity
Experiment
User guide in TXT, experiment materials and results in CSV:
- exp1materials.csv: materials used in Experiment 1. Items coded with "c" are the critical items. Items coded with "f" are the fillers. "ff": false fillers, "ft" true fillers.
- exp1results.csv: the results of Experiment 1.
- exp2materials.csv: materials used in Experiment 2. For coding see the description of exp1_materials.csv.
- exp2results.csv: the results of Experiment 2.
FFI2016-76045-P (AEI/MINEICO/FEDER, UE) ; BES-2014-069070; the ICREA Foundation; AGAUR grant 2014SGR698.
2017
info:eu-repo/semantics/other
Dataset
Wohlmuth K. Nonatomic distributivity experiment 2017. Repositori Digital de la UPF: Barcelona; 2018. Available from: http://hdl.handle.net/10230/35842
http://hdl.handle.net/10230/35842
eng
Publicació relacionada: Wohlmuth, Kata. Automicity and distributive reference. 2019
http://hdl.handle.net/10803/667116
http://hdl.handle.net/10803/667116
info:eu-repo/grantAgreement/ES/1PE/FFI2016-76045-P
This dataset is licensed under a Creative Commons licence
http://creativecommons.org/licenses/by/3.0/es/
info:eu-repo/semantics/openAccess
oai:repositori.upf.edu:10230/422112020-03-03T08:32:29Zcom_10230_5963col_10230_24666
Catàleg de recursos de llenguatge jurídic català 2000-2018
Arnall Duch, Anna
Consulta el recurs a: http://parles.upf.edu/llocs/adljc
El Catàleg de recursos de LJC 2000-2018 recull fins a 232 recursos
del llenguatge jurídic català publicats en el període 2000-2018 i ofereix
opcions de cerca dels recursos segons tretze paràmetres diferents (títol,
autor, any de publicació, editor, el sector i la zona geogràfica en què
s’ha publicat, el tipus de mitjà, el tipus de font d’informació, el tipus
de recurs i paraula clau; i en el cas de les fonts terminològiques, segons
si tenen definicions, exemples i un nombre d’entrades superior o inferior a
6.000 termes). Així mateix, proporciona accés directe als recursos en línia
i també conté catorze gràfics que projecten informació d'una forma ben
visible i fàcil d'interpretar sobre el panorama actual de recursos del LJC.
El Catàleg constitueix un dels resultats de la tesi doctoral "Llenguatge
jurídic català: estat de la qüestió i propostes de futur", d'Anna Arnall.
El Catàleg és una eina amb aplicacions al camp de la recerca, la
planificació o normalització lingüístiques, la docència, la traducció
jurídica i al camp professional del dret, i per tant, és útil a
l’investigador que vulgui fer recerca, per exemple, en LJC o lexicografia,
ja que permet segmentar de forma automàtica el panorama documental dels
recursos del LJC; és interessant per a les institucions amb funcions de
planificació o normalització lingüístiques per prendre consciència dels
problemes que hi ha en el panorama documental 2000-2018; també fa servei a
l’àmbit de la docència, especialment, la docència en jurilingüística, però
també en dret, ja que permet treballar competències relacionades amb la
cerca documental i la consulta d’informació lingüística; i finalment, també
és una eina de profit per al traductor o el jurista, o qualsevol persona
interessada en el LJC, perquè els permet trobar els recursos que necessiten
per satisfer les seves necessitats lingüístiques.
http://parles.upf.edu/llocs/adljc
2019-10-29
info:eu-repo/semantics/other
http://hdl.handle.net/10230/42211
cat
http://hdl.handle.net/10230/42419
© L'autor
info:eu-repo/semantics/openAccess
Universitat Pompeu Fabra
oai:repositori.upf.edu:10230/453252020-09-22T14:27:07Zcom_10230_5963col_10230_24666
Corpus de catecismos, 1809-1939
Mellado Blanes, Ester
Brumme, Jenny
Género textual
Catecismo
Catecismos políticos
Catecismos religiosos
Catecismos patrióticos
Se añade una hoja con los datos bibliográficos.
El corpus reúne siete catecismos históricos en formato .txt, así como los ficheros .xls del análisis efectuado con la aplicación ContaWords. Se añada una hoja indicando las fuentes bibliográficas y los cambios que se han efectuado sobre los textos. El fichero contiene los siguientes catecismos: Catecismo patriótico (1809), Catecismo y esposición breve de la doctrina cristiana (1843) de Gerónimo de Ripalda, Catecismo de la Doctrina Cristiana (1849) de Gaspar Astete, Catecismo patriótico republicano (1888) de Meliton Muñoz y Epelde, Catecismo de la Doctrina Socialista (¿1906?) de Felipe Carretero, Catecismo de los comunistas (1913) de Federico Engels, así como el Catecismo patriótico español (1939), de Menéndez Reigada. Todos los textos se han adaptado a la ortografía actual.
2020-07-20
info:eu-repo/semantics/other
Mellado Blanes E, Brumme J. Corpus de catecismos, 1809-1939. Repositori Digital de a UPF: Barcelona, 2020. Disponible a: http://hdl.handle.net/10230/45325
http://hdl.handle.net/10230/45325
spa
Esta obra está bajo una licencia Creative Commons CC-BY 4.0
https://creativecommons.org/licenses/by/4.0/
info:eu-repo/semantics/openAccess
Espanya
1809-1939
Universitat Pompeu Fabra