Conteúdos

 

Ferramentas open source de gestão de dados científicos

Plataforma Vantagens chave
CKAN – É open-source e tem uma vasta comunidade de apoio;

– Inclui documentação abrangente;

– Permite a personalização total das suas características;

– Pode ser institucionalmente controlado;

– Suporta metadados sem restrições;

– Regista mudanças de conjuntos de dados e versões de informação.

Dspace – Permite esquemas de metadados ao nível do domínio;

– É open-source e tem uma vasta comunidade de apoio;

– Inclui documentação abrangente;

– Pode ser institucionalmente controlado;

– Representação estruturada de metadados;

– Compatível com OAI-PMH.

Documento orientador para uma política de gestão de dados científicos

Este documento pretende resumir o plano traçado e a metodologia para a elaboração das políticas de gestão de dados científicos do ISCAP, identificado as áreas de intervenção. Os investigadores e centros de investigação com a ajuda destas políticas, obtêm um melhor conhecimento sobre o tipo de dados produzidos e as práticas de gestão.

A produção de dados científicos é uma das características essenciais da ciência moderna. Com a evolução da investigação científica, a forma e o volume dos dados científicos aumentaram significativamente. De igual modo, surgiram alterações nas formas de armazenar, preservar, aceder e partilhar os dados produzidos no âmbito da actividade científica.

Os dados científicos são dados usados como fonte primária na investigação científica para validar os resultados de investigação.

As organizações de ensino superior têm de reconhecer a importância de criar estratégias de actuação institucional que maximizem o valor dos dados gerados nas actividades de investigação que realizam.

No plano das políticas de Gestão de Dados Científicos, consideramos que são essenciais 15 critérios:

  1. Assistência aos investigadores na gestão de dados;
  2. Análise da gestão de dados científicos (Planeamento e armazenamento de dados);
  3. Criação de uma base de dados de acesso aberto;
  4. Garantia da privacidade e segurança dos dados científicos;
  5. Criação de mecanismos de backups;
  6. Salvaguardar os dados e maximizar a sua utilidade;
  7. Organização de colecções de dados;
  8. Suporte à migração de dados;
  9. Garantia de interoperabilidade entre sistemas de gestão de dados;
  10. Verificação e eliminação de dados duplicados;
  11. Elaboração de normas a serem usadas para formatos e conteúdo de dados e metadados;
  12. Criar e rever orientações para a gestão de dados;
  13. Dar formação aos investigadores;
  14. Assegurar a preservação dos dados científicos;
  15. Garantir a promoção da referenciação e citação dos dados científicos.

 

Pode concluir-se que o ISCAP necessita de implementar e disponibilizar serviços e ferramentas associadas a gestão de dados científicos, em particular:

  • Serviços de armazenamento e backups de dados;
  • Serviços de apoio e consultadoria aos investigadores;
  • Utilizar adequadamente as ferramentas de suporte ao desenvolvimento de planos de gestão de dados;
  • Serviços de repositório de dados científicos, possibilitando o armazenamento, referenciação, acesso e reutilização de dados a longo prazo.

Estas políticas contribuem para a valorização da investigação e do conhecimento produzido pelo ISCAP. Além disso, significam o reconhecimento da importância de desenvolver serviços que suportem a acção dos investigadores na Gestão de Dados Científicos.


Implementação da Política de Gestão de Dados de Pesquisa: University of Edinburgh Roadmap

Planeamento da gestão de dados

A Universidade de Edinburgh procura implementar politicas de gestão de dados científicos, para ajudar os pesquisadores:

1- Assistência adaptada ao planeamento da gestão de dados aos principais investigadores que apresentam propostas de investigação;

2- Personalizar o planeamento da gestão de dados online para o melhor uso dos utilizadores;

Infra-estruturas de dados ativos

3- Fornecer uma loja de arquivos “crossplataform” ou multiplataforma acessíveis a todos e com a capacidade de satisfazer a maioria dos casos de uso dos pesquisadores.

4- Fornecer mecanismos adicionais de acesso aos dados para suportar melhor dispositivos móveis e colaboração externa;

5- Fornecer mecanismos para colocar “backups” e sincronizar dispositivos móveis;

6- Fornecer um serviço que garante a integridade e retenção da copia dos dados de pesquisa a longo prazo;

Administração de dados                                

7- Desenvolver um repositório de dados para melhorar o deposito e a descoberta de colecções de dados gerado por pesquisadores;

8- Fornecer registos de dados de pesquisa em apoio as universidades na gestão de dados de pesquisa;

9- Garantir a interoperabilidade eficiente entre todos os sistemas de gestão de dados de pesquisa;

10- Fornecer acesso para os ativos de dados com valor a longo prazo;

 

Ajuda na gestão de dados

11- Aumentar o conhecimento sobre as politicas de financiamento e planos de gestão de dados para todos os projectos de investigação.

12- Criar e rever orientações na gestão de dados nos serviços de informação;

13- Manter, desenvolver e promover módulos de treinos on-line;

14- Criar formações para grupos de investigação e profissionais;

15- Serviço de consultadoria em gestão de dados científicos.

 

University of Canterbury

A universidade opera num ambiente orientado a dados que exige que os responsáveis pela recolha, gestão e disseminação de dados, o façam de forma sistemática e planeada. Os dados gerados e mantidos pela universidade devem ser geridos correctamente para garantir o seu bom funcionamento.

Esta política descreve a estrutura de gestão de dados que abrange as funções dos responsáveis pela recolha, armazenamento, segurança, manutenção, disseminação e qualidade dos dados. A referida política não se aplica a: dados de projectos de pesquisa académica nem a actividades de ensino; e recolha de dados para utilização ad-hoc e através de uso de inquéritos.

Este documento, relativo à university of Canterbury, fornece uma estrutura abrangente de gestão de dados consistente com os seus sistemas de negócio.  Neste caso, a gestão de dados refere-se à gestão de dados institucionais, ou seja, dados que são necessários para o funcionamento da universidade.

Os responsáveis pelas operações da universidade devem manter a qualidade dos dados que resultam das operações realizadas. Isto é crucial para maximizar o valor dos investimentos feitos na recolha e manutenção de dados e para obter informação fidedigna, que será útil para o processo de tomada de decisão.

A referida universidade compromete-se a cumprir os seguintes princípios de gestão de dados:

  • a universidade possui todos os dados, ao invés de um departamento individual;
  • cada fonte de dados deve ter um responsável atribuído, que tem responsabilidade geral pela eficácia, integridade e segurança desses dados;
  • os dados devem ser: simples de inserir, ser claramente definidos, e documentar com precisão o respectivo assunto;
  • os dados só devem ser recolhidos para uma finalidade específica e documentada;
  • os dados devem estar prontamente disponíveis para todos os indivíduos com uma necessidade comercial legítima;
  • a captura, validação e processamento de dados devem ser automatizados sempre que possível;
  • os dados só devem ser introduzidos uma vez;
  • processos que actualizam um determinado elemento de dados devem ser normalizados em todo o sistema de informação;
  • os dados devem ser registados rapidamente e da forma mais completa possível, pela fonte mais informada, o mais próximo possível do seu ponto de criação, e em formato digital;
  • os dados devem ser registados e geridos ao longo do tempo de forma auditável e rastreável;
  • o custo de recolha de dados deve ser minimizado;
  • os dados devem ser protegidos de acesso e modificação não autorizados;
  • os dados não devem ser duplicados, a não ser que a duplicação seja necessária e aprovada pelo comissário de dados. Nesses casos, uma fonte deve ser claramente identificada como a principal; deve haver um processo robusto para manter as cópias na etapa e e as cópias não devem ser modificadas;
  • os dados devem ser definidos de forma consistente em toda a universidade;
  • os utilizadores devem apresentar eficazmente os dados, qualquer que seja o seu uso;
  • os esquemas que representam os dados devem ser desenvolvidos e mantidos enquanto as descrições desses dados estiverem em uso.

 

Fisheries and Oceans Canada

O Fisheries and Oceans Canadá (DFO) adquiriu, e continua a adquirir, um grande volume de dados científicos e informações através dos seus próprios programas e de intercâmbios com organizações nacionais e internacionais. Neste contexto, a política de dados científicos é necessária para preservar, melhorar e facilitar o uso dos recursos de dados científicos do DFO.

Esta política apoia a missão departamental e os resultados estratégicos, nas seguintes áreas: setores marítimos e pescas economicamente prósperos; ecossistemas aquáticos sustentáveis; e águas seguras. Esta política está em conformidade com a política de governo do Canadá sobre gestão da informação, permitindo flexibilidade para acomodar os acordos e obrigações de partilha de dados científicos que o DFO tem com agências nacionais e internacionais. O objectivo desta política é garantir a salvaguarda dos dados científicos e maximizar a utilidade dos dados através da interconectividade, acessibilidade e adesão às normas.

Os resultados esperados desta política são: dados seguros permanentemente; dados interconectados e interoperáveis; dados úteis detectáveis e acessíveis através de meios normalizados; e custo-benefício de gestão de dados.

Os conjuntos de dados científicos são valiosos recursos nacionais que foram adquiridos ao longo de décadas de investimento, permitindo que o DFO mantenha a liderança mundial em ciências aquáticas. Esses dados são insubstituíveis e devem ser protegidos e geridos para garantir a sua disponibilidade a longo prazo.

Para serem considerados úteis, os dados científicos devem ser acessíveis, utilizáveis e de qualidade reconhecida. Devido à natureza complexa dos dados científicos, e ao facto de os cientistas serem os maiores utilizadores de dados, é essencial que a ciência no DFO seja responsável pela gestão da qualidade, fluxo, organização e disseminação dos dados para garantir a sua pertinência e utilidade.

Os dados recolhidos pelo DFO devem estar integrados num repositório de gestão de dados.

Para a tomada de decisão, os dados mais recentes são tipicamente os mais críticos. Para obter o máximo benefício para o DFO e para a comunidade de utilizadores em geral, os dados científicos devem ser disponibilizados o mais rapidamente possível.

A política de dados abertos do governo do Canadá, bem como a filosofia do DFO, promovem o acesso total e aberto a dados sempre que possível e estão sujeitos a obrigações particulares departamentais, nacionais e internacionais em matéria de sensibilidade e confidencialidade.

O ambiente aquático do Canadá é influenciado por um sistema de água acoplado e atmosférico, que se estende globalmente e não pode ser efectivamente monitorizado por um único país. Os dados científicos relativos ao ambiente aquático são por conseguinte, mais úteis quando reunidos e partilhados com a comunidade internacional. Os dados derivados não estão necessariamente sujeitos a todas as salvaguardas justificadas para dados de observação pois podem, em princípio, ser reproduzidas. Em certos casos, no entanto, a preservação a longo prazo pode ainda ser necessária por razões legais ou para documentar decisões e políticas.

Todos os dados científicos do DFO devem ser geridos como parte de um sistema integrado acessível através de ligações entre dados regionais e nacionais. As ligações entre dados terão a responsabilidade de: responder a solicitações internas e externas; manter inventários e documentação para todas as explorações de dados para as quais tenham designado responsabilidade, incluindo meta-dados e links para onde os dados são armazenados; fornecer recuperação, integração e resumo de dados básicos para satisfazer necessidades comuns dos programas do DFO e em conformidade com as políticas governamentais e departamentais; coordenar acordos de partilha com outras organizações; realizar, em conjunto com os fornecedores de dados, controlo de qualidade de dados, verificação e remoção de dados duplicados e outros processamentos; assegurar, através de parcerias com organizações de serviços relevantes que os dados e meta-dados sejam protegidos contra perdas, permaneçam acessíveis a longo prazo e sobrevivam em caso de mudanças organizacionais, mudanças de responsabilidade, reforma de funcionários, etc…

É responsabilidade dos gestores de programas científicos assegurar que os dados e meta-dados sejam enviados para um repositório de dados apropriado. Isto é importante para garantir que os dados sejam rapidamente migrados para um ambiente onde o risco de perda seja minimizado e onde os meta-dados de suporte estejam integrados com os dados para assegurar que a informação contextual seja preservada a longo prazo para uma interpretação e utilização de dados apropriados.

É comum que o DFO participe em programas de cooperação científica com outros parceiros e que esses programas criem os seus próprios sistemas de armazenamento e gestão de dados. Nesses casos, os dados devem ser enviados para um repositório de ligação de dados, a fim de assegurar que ele possa ser inventariado como um conjunto de dados do DFO. O repositório de ligação de dados enviará dados ao programa e, se apropriado, utilizará o recurso do programa como um repositório de dados geridos, evitando assim a duplicação. Qualquer partilha e função de gestão de dados deve ser aprovada pelo director geral da ciência.

Entenda-se que o uso crescente de sistemas de dados em tempo real permite a submissão, validação, controlo de qualidade e carregamento em repositórios de dados geridos para acesso quase imediato.

Os dados abrangidos por esta política incluem todos os dados científicos que podem ser recolhidos, derivados ou adquiridos de outra forma pelo DFO.

Os dados científicos do DFO são um recurso público e estão sujeitos a acesso total dois anos após serem adquiridos ou gerados. Nos casos em que, na opinião do Director Regional da Ciência, exista o perigo de uma interpretação incorrecta dos dados, devem ser tomadas medidas para garantir que os potenciais utilizadores sejam informados desta possibilidade, e será identificado um contacto para dar assistência na interpretação e utilização adequados dos dados.

Todas as propostas e planos de projectos científicos devem demonstrar a existência de um plano de gestão de dados abrangente para abordar a gestão de dados científicos recolhidos ou gerados durante a existência do projecto.

O DFO com seus parceiros tornará os dados e meta-dados da ciência acessíveis e interoperáveis com outros sistemas governamentais, como o portal de dados abertos do governo do Canadá.

Os dados científicos que tenham aspectos legais a limitar a sua distribuição, quer sejam recolhidos pelo DFO, quer sejam submetidos por terceiros, serão mantidos na sua forma original e devidamente protegidos. Se dados confidenciais forem enviados por terceiros, será obtida uma carta de acordo da sua parte, indicando que os dados são fornecidos a título confidencial.

A gestão de dados é uma responsabilidade partilhada entre a organizações de ciência e TI, como os Serviços de Gestão & Tecnologia da Informação (IM & TS) do DFO e os Serviços partilhados do Canadá (SSC) do governo.

A ciência relaciona-se principalmente com o conhecimento, ou seja, com o conteúdo dos dados. Os gestores de dados representam o interesse dos produtores de dados e dos consumidores e são responsáveis pelos conjuntos de dados, a sua qualidade e o seu uso. Para cumprir estes papéis e responsabilidades a ciência depende da infra-estrutura e dos serviços de tecnologia.

As organizações de TI dizem respeito à representação de dados em contextos digitais. As TI garantem o depósito  dos dados, que organizam, preservam, protegem e aos quais permitem o  acesso.

Do ponto de vista da ciência, relativamente aos dados, sobressaem as seguintes responsabilidades no domínio da ciência: recolha e geração de dados; envio de dados; distribuição  e partilha de dados da comunidade científica; manipulação de conteúdo, a nível da validação e controlo de qualidade dos conteúdos; e a especificação da infra-estrutura e do serviço de TI necessários para a gestão de dados científicos.

Algumas das responsabilidades específicas das organizações ao nível das TI em relação aos dados científicos incluem: o fornecimento de armazenamento organização e acessibilidade dos dados, e a garantia de que o conteúdo dos dados é preservado e inalterado através de migrações.

 

Política sobre a Disponibilização de Dados e outros Resultados de Projetos de I&D Financiados pela FCT

A disponibilização aberta dos resultados da investigação realizada com financiamento público tem significativos benefícios sociais e económicos. A FCT – Fundação para a Ciência e Tecnologia, IP – adopta a presente política sobre a disponibilização de resultados de Investigação e Desenvolvimento (I&D) que financia.

A FCT encoraja os investigadores a disponibilizarem os dados resultantes dos projetos de I&D que financia em bases de dados de Acesso Aberto apropriadas sempre que possível. Em alternativa, os investigadores podem disponibilizar os dados noutras formas de acesso, ficando estas ao critério dos investigadores.

A disponibilização dos resultados não pode incluir informação que comprometa a privacidade ou a segurança de indivíduos ou entidades envolvidos na investigação, sujeitando-se aos condicionalismos legais vigentes.

Nas candidaturas a financiamento apresentadas à FCT, sugere-se que os candidatos incluam um plano de gestão de dados e outros resultados da investigação, contendo informação específica sobre o modo como promoverão a ampla disseminação e partilha dos resultados de I&D, incluindo: descrições de tipos de dados, amostras, coleções, software, modelos, materiais curriculares e outros materiais que se prevê que venham a ser produzidos no âmbito das actividades financiadas; normas a serem usadas para formatos e conteúdo de dados e meta-dados; políticas de acesso e partilha incluindo disposições de protecção apropriada de privacidade, confidencialidade, segurança, propriedade intelectual e outros direitos ou requisitos; políticas e disposições para reutilização, redistribuição e produção de subprodutos; planos para arquivo de dados, amostras, software, modelos e outros materiais produzidos.

No caso de não serem necessários planos detalhados deste tipo no projecto proposto, pode apresentar-se uma justificação para esse facto.

Os beneficiários de financiamento são encorajados a disponibilizar os dados recolhidos ou produzidos no âmbito de projectos de I&D de acordo com esta política tão cedo quanto possível.

A FCT assegurará a evolução futura desta política, tentando convergir com as melhores práticas internacionais.

 

Serviços para suporte à gestão de dados científicos na UMinho

Os Serviços de Documentação da Universidade do Minho (SDUM) estabeleceram um plano de intervenção para os serviços de suporte à Gestão dos Dados Científicos na UMinho, que visa contribuir para valorizar a investigação e o conhecimento produzidos na UM e demonstrar a importância do desenvolvimento de serviços que suportem a acção dos investigadores na gestão de dados científicos.

Os eixos de intervenção na gestão de dados científicos estabelecidos no plano para actuação dos SDUM estão divididos em 4 áreas: diagnóstico e política, serviços de suporte & informação, infraestrutura & normalização e, por fim, competências e recursos humanos.

O diagnóstico e política divide-se em duas etapas: análise da realidade da gestão de dados científicos produzidos na UMinho, que inclui a observação de produção, planeamento e armazenamento de dados científicos; e desenvolvimento da política institucional para a gestão de dados científicos, que incentiva a adopção de políticas de dados abertos no ciclo de vida dos dados de investigação.

Os serviços de suporte & informação envolvem: serviços de apoio e consultoria na gestão de dados científicos, que por sua vez, incluem planos de gestão de dados para projetos financiados e desenvolvimento de materiais informativos e guias formativos; serviços de curadoria para o ciclo de vida dos dados científicos, com vista a apoiar os investigadores e grupos de investigação no ciclo de vida dos dados científicos (recolha, análise, armazenamento e publicação) providenciando serviços de armazenamento, pesquisa e acesso; e promoção da referenciação e citação dos dados científicos, com a finalidade de promover a correcta citação dos dados.

A infraestrutura & normalização engloba: um serviço de repositório de dados científicos; promoção da interoperabilidade de infraestruturas de dados científicos, para permitir o acesso, utilização e partilha de dados, através do estabelecimento de parcerias com investigadores, repositórios, arquivos e bases de dados; e serviços de meta-dados para dados de investigação, que inclui o reconhecimento e identificação de normas e esquemas de meta- dados e eventual envolvimento no desenvolvimento de serviços de meta-dados para dados científicos.

A área das competências e recursos humanos destina-se a: especificar um serviço interno dedicado para dados científicos e desenvolvimento de competências dos colaboradores SDUM, ou seja, foca-se essencialmente na formação interna da equipa dos SDUM; melhorar a prática da gestão dos dados científicos e a disponibilização de dados abertos, e inclui o estabelecimento de metodologias internas para o planeamento da gestão de dados científicos e para a disponibilização de dados em acesso aberto devidamente documentados.

 

Governação de dados, literacia de dados e a qualidade da gestão dos dados

Serviços de dados de pesquisa e os paradigmas de gestão de bibliotecas académicas

Actualmente, as bibliotecas académicas operam num ambiente intensivo em dados. Para entender o papel das bibliotecas na gestão de dados científicos, pode-se falar em paradigmas de desenvolvimento.

O primeiro paradigma é o paradigma de propriedade ou  colecções, que surgiu após a Segunda Guerra Mundial e atingiu o seu auge na década de 60. É construído no pressuposto que os sistemas das bibliotecas académicas poderiam recolher todos os originais que satisfazem as instituições universitárias e as suas necessidades de ensino e investigação.

Posteriormente, na década de 70, surgiu o paradigma de acesso, direccionado para a partilha de recursos.

Devido aos documentos electrónicos serem cada vez mais utilizados, surgiu depois o paradigma iAccess, focado no acesso generalizado aos materiais digitais principalmente nos textos completos electrónicos.

Ao juntar a dimensão social, criou-se o paradigma sAccess, devido ao crescimento das redes sociais, em que as bibliotecas académicas foram influenciadas pela grande quantidade de dados produzidos que podem ser analisados, publicados e reutilizados por pesquisadores das ciências sociais, mudando também as formas como as pesquisas são feitas.

 

Alguns detalhes sobre a governança de dados

A gestão de dados no sector empresarial é particularmente importante, estando muito dependente das tecnologias de informação para localizar e organizar os melhores dados disponíveis.

A expressão “Governança de dados” refere-se a:

  • Instituições;
  • Regras;
  • Políticas;
  • Padrões;
  • Direitos de decisão e
  • Protecção das necessidades dos interessados.

Gerir dados ajuda a construir processos padronizados e repetitivos, dirigidos pelos princípios de integridade, transparência e auditoria.

Os gestores de dados preocupam-se com os dados, procurando que respeitem as políticas e práticas determinadas pela empresa. Mas para isso é preciso haver uma definição clara dos seus objectivos, processos e métricas, sendo necessário criar os seus próprios processos e padrões.

No sentido de gerir, monitorizar e medir diferentes aspectos de uma organização, a governaça de dados pode ser usada para gerir as tecnologias de informação, pessoas e outros recursos tangíveis.

 

Gerir dados e gerir dados de qualidade

A governança de dados garante que os dados podem ser confiáveis porque existe um responsável que determina os padrões de qualidade.

As bibliotecas académicas podem desempenhar um papel crítico ao fornecer serviços de auditoria e verificação de qualidade de dados para as comunidades de pesquisa.

A governança de dados bem-sucedida depende da definição de responsabilidades sobre padrões de dados apropriados e ambientes de metadados, aspectos essenciais para a qualidade dos dados.

 

Gerir dados, dados de qualidade e literacia de dados

A literacia de dados é uma competência dos profissionais de informação envolvidos no apoio à investigação. Mas ainda não está bem estabelecida.

A literacia de dados é a capacidade de entender, usar e gerir dados, o que permite aos utilizadores aceder, interpretar e avaliar os dados.

Um profissional tem de conseguir ler gráficos e tabelas, tirar conclusões corretas dos dados e reconhecer quando os dados são enganosos ou inadequados.

A literacia da informação consiste em reconhecer a informação precisa, identificar, localizar, avaliar e usar informação para resolver problemas específicos.

Competências de literacia da informação relacionadas com a gestão de dados:

  • Determinar quando os dados são necessários;
  • Aceder fontes de dados adequadas às informações necessárias;
  • Reconhecimento do valor, tipos e formatos dos dados de origem;
  • Avaliação crítica dos dados e suas fontes;
  • Saber seleccionar e sintetizar dados e combiná-los com outras fontes de informação e com conhecimento prévio;
  • Utilização ética dos dados;
  • Aplicar os resultados à aprendizagem, à tomada de decisão ou à resolução de problemas.

 

As competências necessárias às pessoas que trabalham com a literacia de dados envolvem saber seleccionar e sintetizar dados e combiná-los com outras fontes de informação e com conhecimento prévio. Devem saber identificar, recolher, organizar, analisar, resumir e ordenar os dados. Outras competências necessárias são desenvolver hipóteses, identificar problemas, interpretar os dados e determinar, planear e implementar dados.

A avaliação só aparece quando se fizer a pesquisa e interpretar os dados.

A literacia de dados tem dois objectivos:

  • Aumentar a consciencialização sobre a literacia de dados entre professores, alunos e gestores, enviando mensagens claras sobre as necessidades dos nossos stakeholders.
  • Educar os profissionais de informação.

 

Making the case for research data management

Neste post, deixamos informações complementares que encontramos no documento “Making the case for research data management”.

Os gestores de investigação precisam de coordenar uma gama cada vez mais ampla de pesquisas e de resultados de investigação. As instituições devem assumir a liderança no estabelecimento de políticas de dados de pesquisa, bem como nos serviços que irão apoiá-los. Estas políticas irão possibilitar melhorias nas instituições, relativamente às suas capacidades de investigação. As instituições necessitam de estruturas coerentes para estabelecer a organização, os recursos e a tecnologia capazes de gerar esses benefícios.

As perspectivas de partilha de recursos para aumentar a eficiência na colaboração, vão além das áreas estabelecidas, como serviços de TI, bibliotecas e suporte de pesquisa. Assim como os académicos estão a produzir activos de pesquisa digital em maior volume e variedade, os serviços de gestão de dados estão a juntar-se à computação como recursos que podem ser agrupados de forma mais eficaz.

As necessidades dos pesquisadores abrangem a gestão de dados e a sua preservação. A gestão de dados de pesquisa diz respeito à sua organização desde o momento que integram o ciclo de pesquisa, até à disseminação e arquivo de resultados. A gestão de dados de pesquisa visa assegurar uma verificação fiável dos resultados e permite novas pesquisas baseadas na informação existente. A preservação consiste em assegurar as condições de utilização a longo prazo dos documentos entregues a um repositório ou editor.

Actualmente, o processo de pesquisa é motivado pelo princípio de que a informação é um bem público. Assim, é necessário assegurar uma boa gestão deste bem, atenuando todos os riscos para a reputação institucional. Estes riscos podem surgir de uma má articulação entre os requisitos de divulgação e confidencialidade. Portanto, os pesquisadores devem respeitar a legislação relativa à protecção de dados, equilibrando-a com a liberdade de informação.

Para promover boas práticas relativamente à política de dados, os Conselhos de Investigação do Reino Unido coordenaram uma declaração de Princípios Comuns, onde defendem que disponibilizar dados de investigação aos utilizadores é uma parte essencial do mandato dos Conselhos de Investigação.