Categoria: Dados de pesquisa

FAIRsFAIR: um mês de seu lançamento

Este projeto, encabeçado pela Data Archiving and Networked Services (DANS), pretende promover práticas de dados com o princípio FAIR na Europa. O FAIRsFAIR (Fostering Fair Data Pratices in Europe) tem como missão ajudar os órgãos de governança da European Open Science Cloud (EOSC) a fornecer regras de participação alinhadas com a FAIR na EOSC. Essas regras serão projetadas para estabelecer a conformidade dos componentes e práticas do FAIR. Além disso, o FAIRsFAIR propõe abrir e compartilhar todo o conhecimento, experiência, diretrizes, implementações, novas trajetórias, cursos e educação necessários para transformar o princípio FAIR em realidade, visando contribuir para uma mudança de cultura necessária para alcançar uma ampla adoção de práticas justas dentro do EOSC e além.

Pois bem, o projeto completa um mês de existência, e tudo indica que prosperará pelos próximos três anos, quando tem a previsão de encerramento. Foram nos dias 14 e 15 de março que, em Amsterdã, o FAIRsFAIR teve início com uma reunião com mais de 80 pesquisadores membros.

Pesquisadores ambientais, cientistas da área de saúde e alimentos, físicos e cientistas sociais compartilham pelo menos dois aspectos: todos eles conduzem e executam pesquisas e, ao fazê-lo, criam dados. A questão é, como eles podem se certificar de que esses dados sejam Findable (Acháveis), Accessible (Acessíveis), Interoperable (Interoperáveis) and Reusable (Reutilizáveis)? FAIRsFAIR abordará esta questão juntamente com perguntas sobre o FAIRness no nível de software e repositórios, entre outros.

No primeiro dia da reunião inicial, vários parceiros nos projetos relacionados ao FAIRsFAIR delinearam as semelhanças no contexto do EOSC. Representantes de projetos relacionados dentro de diversos domínios científicos e infra-estruturas de pesquisa falaram sobre até que ponto eles estão relacionados ao FAIRsFAIR e como as partes podem unir forças em todos os níveis.

O segundo dia foi sobre discussões aprofundadas: os participantes discutiram o conteúdo de seus pacotes de trabalho uns com os outros. As sobreposições entre os pacotes de trabalho exigem que os parceiros deliberem sua abordagem para implementar os princípios do FAIR. Durante as sessões de discussão, foram feitos planos concretos para o trabalho inicial a ser realizado.

Depois de dois dias intensos com discussões substanciais, tempo para se conhecerem e fazer contatos, ficou claro que o projeto FAIRsFAIR passará por uma jornada de aventura, porém, tudo indica que será uma ferramenta relevante no fomento de novas práticas que valorizem os dados de pesquisa num contexto de Ciência Aberta.

Notícias sobre o projeto podem ser acompanhadas neste link.

Participe do Webinar LIBER: Encontrando e Reutilizando Dados de Pesquisa


Compartilhar dados de pesquisa é uma prática cada vez mais incentivada por instituições e comunidades de pesquisa. Nesse viés, no dia 11 de Abril de 2019, ocorrerá o Webinar LIBER, no horário das 10h (de Brasília). Esta webconferência contará com a participação de Kathleen Gregory (DANS), que apresentará uma visão geral de pesquisas recentes que investigam como pesquisadores e bibliotecários se engajam em práticas para encontrar, entender e reutilizar dados de pesquisa.

A LIBER é a Ligue des Bibliothèques Européennes de Recherche (Associação das Bibliotecas Europeias de Pesquisa, em tradução livre), que objetiva ser a voz da comunidade de bibliotecas de pesquisa da Europa. Sua missão é capacitar pesquisas de classe mundial, representando os interesses das suas instituições, suas universidades e seus pesquisadores em várias áreas-chave. Cerca de 450 bibliotecas fazem parte da LIBER.

Neste Webinar, Kathleen Gregory fornecerá dicas para encontrar dados de pesquisa, sendo esta uma oportunidade para os participantes considerarem o que esta pesquisa significa para o desenvolvimento de serviços em suas próprias organizações.

Políticas, ferramentas e programas de treinamento estão sendo desenvolvidos para auxiliar pesquisadores e provedores de dados a disponibilizar dados de maneira a otimizar a localização, acessibilidade, interoperabilidade e reusabilidade dos dados (ou seja, de acordo com os princípios do FAIR). Uma das promessas que impulsionam tanto o compartilhamento de dados quanto o desenvolvimento de políticas é que os dados compartilhados podem e serão descobertos e reutilizados; mas os usuários (pesquisadores, bibliotecários, estudantes) estão descobrindo esses dados? E se eles estão encontrando, (como) eles estão reutilizando-os?

Este webinar é  organizado pelo Grupo de Trabalho de Gerenciamento de Dados de Pesquisa da LIBER. Para mais informações, acesse a página do evento. A inscrição é possível através de um formulário de inscrição online.


Dataset Search: nova ferramenta de busca para dados científicos é lançada pela Google

Ainda em versão beta, a Google lançou recentemente uma ótima opção que objetiva facilitar o acesso da comunidade acadêmica a um conjunto de dados de pesquisa, que em geral estão espalhados em repositórios online. Dentre os repositórios que a Dataset Search tem acesso a dados completos de diversos tipos de estudos estão agências governamentais, bibliotecas digitais, sites de editoras ou páginas pessoais de cientistas.

Esse serviço vem para ampliar ainda mais os recursos da Google para a comunidade acadêmica e científica. Antes, já havia o Google Acadêmico, porém verificou-se que havia demanda para uma ferramenta que buscasse especificamente dados de pesquisa.

Segundo a pesquisadora em inteligência artificial da Google, Natasha Noy, existe um foco em dados de ciência ambiental, ciências sociais e de pesquisa governamental, porém, à medida que a Dataset Search se torne mais popular, a tendência é que a quantidade de conjuntos de dados disponível aumente.

Existe o fomento a que os fornecedores de dados utilizem o padrão aberto desenvolvido pela empresa para fazer uso do compartilhamento; é mais uma opção que auxilia o fazer científico para que as informações e dados se tornem cada vez mais acessíveis e para uma gama de pesquisadores cada vez maior.

O ciclo de vida dos dados de pesquisa

Modelo: UK Data Service

Para além do projeto para o qual determinado dado é criado, este, e qualquer dado de pesquisa, obedece a um ciclo de vida. Após o fim do financiamento das pesquisas, seus pesquisadores devem continuar trabalhando em cima dos seus dados produzidos, a fim de que eles sejam reutilizados após análises, citações e atualizações destes (por isso que os dados e as coleções de dados científicos possuem um tempo de vida maior que seus projetos de pesquisa que os criaram). É assim que existe a possibilidade de reutilização dos dados de pesquisa que vai alimentar o que se chama “ciclo de vida de um dado de pesquisa”.

Apesar de entendermos que existem vários modelos de ciclo de vida de dados de pesquisa, cada qual com seu conceito de estrutura, o intuito dessa postagem é trazermos as mais conhecidas etapas da vida de um dado de pesquisa, que você confere a seguir.

Criação dos dados: aqui, é a primeira parte, onde se tem a concepção da pesquisa e um plano de gestão de dados. A partir disso se localiza e coleta os dados de pesquisa.

Tratamento dos dados: é onde se arruma os dados para a utilização na pesquisa, tal como fazer transcrições, digitalizações ou traduções, além de descrições e oferecer um sistema de estocagem desses dados.

Análise dos dados: aqui o pesquisador fica imerso no conteúdo dos seus dados com a finalidade de interpretá-los e produzir resultados a partir deles. Os dados são preparados para serem incluídos na publicação e para serem preservados após isso.

Preservação dos dados: após a sua utilização no corpo da pesquisa, os dados devem ser migrados para um formato mais adequado, em geral open source. Também se faz um backup e armazenamento deles, além de promover uma documentação, criação de metadados e, por fim, o seu arquivamento.

Acesso aos dados: é a distribuição e compartilhamento desses dados, bem como o controle do seu acesso e seus aspectos jurídicos. Aqui vale promover esses dados de pesquisa.

Reutilização dos dados: os dados são acompanhados e reutilizados, permanecendo vivos e aptos a auxiliarem em uma nova pesquisa; também analisa-se os resultados obtidos com eles, sendo estes frutos que geram aprendizado.

Documente, descubra e interfira: conheça a DDI

Data Documentation Iniciative (Iniciativa de Documentação de Dados, em livre tradução), de sigla DDI, é um padrão internacional para descrever os dados produzidos por pesquisas e outros métodos de observação nas ciências sociais, comportamentais, econômicas e da saúde. A DDI é um padrão gratuito que pode documentar e gerenciar diferentes estágios no ciclo de vida dos dados de pesquisa, como conceituação, coleta, processamento, distribuição, descoberta e arquivamento. A documentação dos dados com o DDI facilita o entendimento, a interpretação e o uso – por pessoas, sistemas de software e redes de computadores.

A DDI Alliance é composta por membros e organizações membros associadas e é governada por um Conselho Executivo (que gerencia as operações da aliança), um Conselho Científico (que realiza pesquisas e testes) e um Comitê Técnico (cujo objetivo é modelar, processar, manter e atualizar as especificações da DDI). Além disso, existem grupos de trabalho que se concentram no desenvolvimento de áreas específicas da DDI. Clique aqui e confira o estatuto da DDI.

 

Nesta imagem, uma síntese da história da DDI

Segundo a carta da Aliança DDI (disponível clicando aqui), são estes os seus objetivos:

(a) Supervisionar o desenvolvimento contínuo de padrões DDI e produtos semânticos, incluindo revisões, correções e novos lançamentos.

(b) Promover a adoção de padrões de metadados e produtos semânticos da DDI por meio de partes interessadas, tais como produtores de dados, distribuidores de dados, bibliotecas de dados, arquivos de dados, usuários de dados, pesquisadores e desenvolvedores e fornecedores de software.

c) Apoiar o desenvolvimento de programas de treinamento que incentivem o uso desses padrões para todos os níveis de habilidade dos adotantes em potencial.

d) Garantir, na medida do possível, a compatibilidade das normas DDI com as padrões de metadados em outros campos.

(e) Equilibrar os interesses de uma comunidade diversificada de partes interessadas através de um processo que é aberto, transparente, orientado por consenso e aberto a recursos.

 

Está ocorrendo agora o I Seminário Gestão de Dados de Pesquisa Unifesp e UFABC

Hoje, até as 16h, e na próxima quarta-feira, dia 29/08/2018 (das 9h às 17h), ocorre o I Seminário Gestão de Dados de Pesquisa Unifesp e UFABC, um encontro que se propõe a debater em comunidade os novos rumos da gestão dos dados de pesquisa para se criar uma cultura institucional de curadoria dos dados de pesquisa, além de discutir o valor do dado coletado e não armazenado adequadamente e o reuso destes dados

O evento ocorre na cidade de São Paulo/SP, no Anfiteatro da Reitoria da Unifesp (Universidade Federal de São Paulo), sito à Rua Sena Madureira 1500/térreo. A organização fica por conta da Coordenadoria da Rede de Bibliotecas, da Pró-Reitoria de Pós-Graduação e Pesquisa da Universidade Federal de São Paulo (Unifesp) e do Sistema de Bibliotecas da Universidade Federal do ABC (UFABC).

Clique aqui para conferir a programação completa.

Também é possível acompanhar a transmissão online, clicando nos links de transmissão ao vivo aqui, no final da página.

Uma rede global para tornar os dados mais acessíveis: conheça o DataCite

Este site vem enfatizando constantemente a importância que os dados exercem em uma pesquisa. Ser capaz de compartilhar esses dados de forma eficaz é, portanto, extremamente importante. O DataCite é uma rede global sem fins lucrativos empenhada em apoiar a partilha de dados através da parceria entre membros e do desenvolvimento de ferramentas e serviços que aceleram o compartilhamento, utilização e reutilização de dados. Portanto, o DataCite, assim como nós, está envolto na ideia da OpenScience.

O DataCite trabalha com parcerias e está sempre em busca de novos membros com o intuito de ampliar seu leque de opções no âmbito do compartilhamento de dados abertos para pesquisa. Organizações que são membros se envolvem em uma rede de ponta de especialistas em pesquisa de dados, devendo demonstrar um nível elevado de comprometimento com dados abertos e pesquisa aberta, desempenhando um papel fundamental no avanço da missão de compartilhamento de dados do DataCite por meio do seu suporte financeiro, além de poder moldar o futuro do DataCite (e pesquisa de dados em geral) servindo no Conselho Executivo.

O DataCite oferece serviços que suportam a pesquisa avançada e a descoberta de conteúdo de pesquisa, como DataPapers (clique aqui e leia mais sobre o que é um DataPaper). Também promove a citação e defesa de dados através de construções de comunidades e materiais de comunicação e divulgação. Por fim, a importância do DataCite se dá também pela tentativa meritória de formar uma comunidade, e é por meio dela, da comunicação e defesa dos direitos, que fornece liderança e recursos para o ecossistema de comunicação acadêmica e para a comunidade de pesquisa, organizando treinamentos personalizados para os seus membros, tornando os serviços visíveis afim de aumentar o impacto do conteúdo da pesquisa na comunidade como um todo.

 

 

 

 

DataPaper: um documento designado a fornecer dados de pesquisa

Reunir informações sobre um determinado assunto, afim de facilitar a busca por dados de pesquisa específicos, abrangendo-os numa publicação para auxiliar o pesquisador. O DataPaper é, via de regra, uma publicação que apresenta, explica e disponibiliza um banco de dados, preparando, organizando e descrevendo-o. Um DataPaper é um documento de metadados pesquisável, que descreve um determinado conjunto de dados ou um grupo de conjuntos de dados, publicado na forma de um artigo, revisado por especialistas, em um periódico acadêmico. Ao contrário de um artigo de pesquisa convencional, o objetivo principal de um documento de dados é descrever os dados e as circunstâncias de sua coleta, em vez de relatar hipóteses e conclusões.

A criação de metadados claros e informativos é um passo essencial para um maior aproveitamento desses dados. É trabalhoso fazê-lo, por isso muitas vezes alguns conjuntos de dados são publicados com metadados mal documentados ou, ainda pior, sem metadados. Nesse contexto, o DataPaper ajuda a superar as barreiras à criação de metadados, fornecendo um reconhecimento claro de todos os envolvidos na coleta, gerenciamento, curadoria e publicação de dados.

Otimizar o uso dos recursos disponíveis é uma vantagem, além de proporcionar que o pesquisador possa começar seu trabalho a partir de pesquisas de outros profissionais, fazendo-se valer dos dados acumulados para iniciar do ponto em que se parou de pesquisar – o que significa economia de tempo, dinheiro e energia. Os DataPapers estão em sintonia com o movimento OpenScience, acreditando ser de imenso valor disponibilizar os dados para o público.

CEDAP/UFRGS é o oitavo repositório brasileiro no re3data.org

Recentemente, fizemos aqui no site uma postagem referente ao re3data, um catálogo internacional de repositórios de dados e a melhor fonte atualmente para achar repositórios. À época, o Brasil contava com sete repositórios cadastrados na plataforma. Agora, essa lista é engrossada pelo CEDAP/UFRGS.

O CEDAP da Universidade Federal do Rio Grande do Sul é o Centro de Documentação e Acervo Digital da Pesquisa da universidade, um órgão auxiliar da Faculdade de Biblioteconomia e Comunicação (FABICO). Suas atribuições são dar suporte às pesquisas científicas, tecnológicas, artísticas e culturais realizadas na Universidade, visando à gestão, preservação e uso científico e cultural de seus ativos digitais de pesquisa, natos ou decorrentes da digitalização – assim tendo papel importante na consolidação do uso e reuso dos dados de pesquisa.

O que são dados de pesquisa?

Fundamentais para o andamento de uma pesquisa acadêmica, os dados de pesquisa são os registros factuais usados como fonte primária para a realização desta. É imprescindível que o pesquisador os obtenha e utilize, pois são eles que dão credibilidade ao trabalho, sendo vistos como necessários para validar os resultados da pesquisa científica. Os dados de uma pesquisa são, portanto, observações documentadas e podem ser auferidos pela percepção através dos sentidos ou pela execução de um processo de medição.

São muitas as possibilidades de formatos de um dado de pesquisa, além da forma como eles podem ser obtidos. Documentos, planilhas, cadernos de laboratório, diários de campo, questionários respondidos, transcrições de entrevistas, slides, amostras, filmes, fotografias, scripts, softwares ou arquivos de log são exemplos do que podem ser os dados de pesquisa. Estes podem ser alcançados, também, a partir de algumas alternativas, tais quais a observação e a simulação, ou então através de experimentos ou ainda procedimentos computacionais.

Pode-se dizer que os dados de pesquisa são o alicerce do conhecimento científico, sem o qual a pesquisa ficaria desacreditada. Logo, são relevantes também espaços que sirvam como banco de dados de pesquisa – repositórios de dados – disponíveis, em especial, para os pesquisadores (mas também para o público em geral). Isso permite que novos avanços no conhecimento científico e tecnológico venham com mais naturalidade, visto que a descrição dos métodos utilizados nas pesquisas sempre foi um elemento crucial no processo científico.

Dado o crescente número do volume de dados de pesquisa, a sua preservação e gestão digital se faz importante e requer a consolidação de políticas globais, governamentais e institucionais que deem sustentação e estímulo a essa prática, a fim de guarnecer  garantias de acesso íntegro ao conjunto de dados que embasam as pesquisas científicas.

 

PARA SABER MAIS:

UNIVERSITY OF CAMBRIDGE. Research Data Management Guide. Disponível em: < https://www.data.cam.ac.uk/data-management-guide/organising-your-data#Naming > Em inglês; Acesso em 13 de junho de 2018.

FADESP. Plano de Gestão de Dados. Disponível em: < http://www.fapesp.br/gestaodedados >Acesso em 13 de junho de 2018.

DUDZIAK, Elisabeth. Dados de Pesquisa agora devem ser armazenados e citados.  2016. Disponível em: <http://www.sibi.usp.br/?p=6189> Acesso em: 13 de junho de 2018.