Infraestrutura Comum para os Recursos e Tecnologia da Linguagem

Cofinanciado por:
Acrónimo | CLARIN
Designação do projeto | Infraestrutura Comum para os Recursos e Tecnologia da Linguagem
Código do projecto | ALT20-03-0145-FEDER-022117
Objetivo principal |

Região de intervenção |

Entidade beneficiária |
  • Universidade de Lisboa - Faculdade de Ciências(líder)
  • Universidade de Évora(parceiro)
  • Universidade de Lisboa - Faculdade de Letras(parceiro)

Data de aprovação | 17-03-2017
Data de inicio | 01-04-2017
Data de conclusão | 19-06-2020
Data de prorrogação | 19-06-2021

Custo total elegível | 1885797.92 €
Apoio financeiro da União Europeia | FEDER - 970364.17 €
Apoio financeiro público nacional/regional | República Portuguesa - 915433.75 €
Apoio financeiro atribuído à Universidade de Évora | 480100 €

Resumo

A CLARIN LP é o nó nacional da infraestrutura de investigação europeia denominada Infraestrutura de Recursos
Linguísticos Comuns (CLARIN - Common Language Resources Infrastructure).
O Consórcio Europeu de Infraestrutura de Investigação do CLARIN (CLARIN ERIC) é uma infraestrutura de
investigação transnacional e distribuída cuja construção teve início em março de 2012 e que atualmente tem 17
Estados como membros, incluindo Portugal, cuja adesão teve lugar em 2014.
A atual fase de construção foi precedida por uma fase de preparação, de três anos e meio, financiada por um projeto
FP7 (2008-2011). Este projeto preparatório, por sua vez, foi precedido de uma proposta inicial, de 2006, submetida a
um concurso do Fórum Estratégico Europeu para as Infraestruturas de Investigação (ESFRI), a qual foi positivamente
avaliada, tendo a CLARIN sido uma das 34 infraestruturas de investigação da primeira versão do Roteiro ESFRI.
A CLARIN disponibiliza recursos e tecnologias úteis para académicos e peritos de várias áreas científicas cujos
tópicos de investigação, desenvolvimento ou inovação dizem respeito ou estão relacionados com a linguagem
humana, com particular relevância para as humanidades e as ciências sociais, assim como para a ciência cognitiva
e as ciências da computação.
Esses recursos científicos estarão ao serviço dos investigadores sempre que for preciso utilizar uma ferramenta de
processamento (p. ex., um extrator de terminologia; um concordanciador; etc), de reunir dados de um determinado
tipo (p. ex., enunciados de língua gestual produzidos por crianças surdas em gravações de vídeo; palavras
relacionadas com a subontologia das Organizações; etc), ou de usar uma bancada virtual amplamente equipada (p.
ex., para apoiar o trabalho de campo sobre uma língua ameaçada; para fazer investigação em tradução automática
estatística; etc).
A infraestrutura garante assim o acesso a materiais e apoios cruciais para a investigação, tanto passivos como
ativos. Estes incluem bases de dados (p. ex., corpora anotados; registos EEG em experiências neurolinguísticas;
etc), aplicações específicas para a investigação (p. ex., extratores de frequências de lemas; anotadores sintáticos;
etc), ou ferramentas de processamento da linguagem (p. ex., classificadores morfo-sintáticos; gramáticas para o
processamento linguístico profundo; etc). Estes recursos podem-se combinar, fundir ou interligar, no que faz da
infraestrutura muito mais do que um mero repositório de dados.
O nó nacional assegura o acesso à CLARIN ERIC. É necessário para garantir o acesso dos investigadores de equipas
de língua portuguesa aos recursos de investigação globais da infraestrutura. Concomitantemente, e crucialmente,
garantirá o acesso a bases de dados, ferramentas de processamento e serviços específicos para a língua portuguesa.
Este nó é uma condição sine qua non para que investigação de ponta de nível mundial envolvendo a língua
portuguesa seja apoiada pela infraestrutura.


Objetivos, atividades e resultados esperados/atingidos

> Objectives
CLARIN serves all experts whose topics of research, development or innovation concern or are related to language
and to the handling of language data:
- in all kinds of modalities: spoken, written, multimodal, etc.
- in all kinds of representations: audio, text, video, neuro-activity records, etc.
- and in all kinds of roles: symbolic object, instrument of communication, reflex of mental activity, cognitive skill to be
enhanced in education, skill to be trained in second language acquisition, carrier of content and knowledge, element
of cultural identity, natural way of interaction with appliances and artificial agents, etc.
The ultimate scientific aim of CLARIN is thus to foster a major leap forward in terms of cutting edge research that leads
to ground breaking results in the scientific study of human language and in the technological progress and economic
development driven by it.

> Infrastructural services
To pursue its mission and accomplish its goals, CLARIN is designed to ensure services and resources to the research,
educational and industry sectors that cannot be made available or be accessed by individual interested parties in
isolation. They are:
- language processing services, which include: online services to be used by humans; applications specifically tailored
to support research tasks; and webservices to support machine-machine interaction; etc.
- distribution, sharing and reutilization of resources, which include: the repository and distribution of data collections,
processing tools and applications; their inventory and documentation; the achieving and digital preservation of
scientific and language heritage; etc.
- technical helpdesk, which include: technical support for academic users; advice on licensing of resources; advancedtraining; etc.

- consulting for non academic entities.
Given its volume, diversity, interoperability and innovative character, these services not only are NOT redundant with
concomitant activities, organizations, centers, units, departments or teams as they represent a key asset to assist
them, to be explored by them and to leverage the quality and the volume of their performance.

By its unique multi-disciplinary strength, CLARIN grants access to language-related materials and computational
processing tools that, given their previous level of fragmentation, lack of interoperability, or even its sheer volume,
would otherwise not be widely available to be used in research and to support innovation and education ? and actually
run the risk of being lost due to a lack of sustainable curation.
It will grant access also to research services and specialized aids that will support researchers in designing and coping
with instrumental tasks for which specific technical skills are needed and would otherwise not be available.

 

Attribute Type Value
id integer 3979