Todos que publicam dados na Web passam a ter, a partir desta terça-feira,31, um documento de referência e recomendações para esta atividade. Lançado pelo W3C (World Wide Web Consortium), o documento Boas Práticas para Dados na Web foi redigido por especialistas brasileiros do Centro de Estudos sobre Tecnologias Web (Ceweb.br) do Núcleo de Informação e Coordenação do Ponto BR (NIC.br), e da Universidade Federal de Pernambuco (UFPE).
O Grupo de Trabalho (GT) responsável pela produção do documento, o Data on the Web Best Practices do W3C, possui um número expressivo de colaboradores do Brasil – quase metade dos seus integrantes – que provêm de diferentes universidades (PUC-Rio, UFAL, UFES, UFMG e UFPE). Os editores do documento foram os brasileiros Caroline Burle e Newton Calegari, do Ceweb.br, e Bernadette Farias Lóscio, da UFPE. "Estamos muito orgulhosos com o resultado deste trabalho, com a oportunidade de compartilhar conhecimento e participar, de forma tão decisiva, da construção de um guideline que vai orientar os profissionais que publicam dados, além de fomentar a transição de documentos para uma Web baseada em dados", declara Vagner Diniz, gerente do Ceweb.br.
Newton Calegari lembra que "existem diversas maneiras de publicar dados na Web, porém até hoje não existia um padrão, um conjunto de práticas capazes de guiar e facilitar o trabalho, tanto para os publicadores, quanto para os consumidores de dados". Para Caroline Burle, esse entendimento entre os publicadores e consumidores de dados é fundamental. "Sem esse acordo, os esforços dos publicadores de dados podem ser incompatíveis com o desejo dos consumidores", destaca.
"A Web destaca-se como um meio de compartilhamento de dados, porém, nem sempre esses dados podem ser facilmente descobertos, acessados e processados. O uso das Boas Práticas para Dados na Web é fundamental para alavancar o compartilhamento de dados na Web, uma vez que garante o fácil acesso e a reutilização dos dados", completa a professora Bernadette Lóscio.
Metodologia
Até se transformar em uma recomendação do W3C, o documento passou por várias etapas, que incluíram consultas públicas e a participação da comunidade Web. Bernadette ressalta que o processo de construção das Boas Práticas envolveu a troca de informações entre diferentes atores. "O GT é um grupo multidisciplinar, formado por pessoas com experiências profissionais diversas. Tivemos conversas até mesmo para definir o que seria um 'dado publicado na Web'." O grupo de trabalho reuniu especialistas de países como Reino Unido, Estados Unidos, Itália e Holanda, e foi liderado por três especialistas em dados na Web, entre elas a brasileira, Yasodara Córdova, então atuando pelo Ceweb.br.
A metodologia também envolveu etapas diferentes. O trabalho iniciou com a coleta de casos de uso sobre publicação de dados na Web, 26 no total, de diferentes partes do mundo. "Fizemos uma análise, identificamos os principais desafios enfrentados por quem publica e consome dados e, a partir desse exercício, encontramos e detalhamos os requisitos para as boas práticas de publicação de dados na Web", explica Bernadette.
O documento Boas Práticas para Dados na Web mostra como profissionais envolvidos com a gestão da informação, desenvolvedores e demais interessados em compartilhar e reutilizar dados podem publicá-los de maneira a alcançar maiores benefícios e aproveitamento. Tópicos como metadados, acesso e qualidade dos dados, informações sobre sua proveniência, licença e uso são detalhados no documento, que está disponível na íntegra, em inglês, em: https://www.w3.org/TR/dwbp/. A tradução para português estará disponível em breve.
Dados abertos
Além da participação no GT do W3C, as atividades do Ceweb.br para promover o uso de dados na Web incluem a realização de cursos online e tool kit sobre o assunto, a publicação do livro Dados Abertos Conectados (também disponível em HTML), os Guias sobre Dados Abertos e Web Semântica do projeto SPUK, e participação no projeto OD4D Network – Open Data for Development, que tem o objetivo de consolidar uma plataforma para uso de ferramentas de Dados Conectados e Web Semântica. São materiais de referência, produzidos por especialistas no assunto, que estão disponíveis gratuitamente para todos os interessados.