O especialista em dados e autor Dan Gaylin discute o que significa democratização de dados e a importância de uma sociedade que conhece dados.
Estamos nos afogando em dados. Essa não é uma declaração projetada para dramats; Temos – ironicamente – os dados para provar isso.
De acordo com Statistaa quantidade total de dados criados, capturados, copiados e consumidos globalmente deve crescer para mais de 394 Zettabytes até 2028.
Para colocar isso em contexto, um único Zettabyte se traduz em aproximadamente 1.000 exabytes, ou 1 bilhão de terabytes, ou 1trn gigabytes.
Na história da ciência da computação, o período conhecido como a era Zettabyte começou em meados de 2010. É quando o tráfego IP global – que se refere a todos os dados digitais que passaram por uma rede IP – estima -se que atinja 1,2 Zettabytes, que foi em 2016.
Considerando quanto tempo demorou para chegar a um único zettabyte, com que rapidez chegamos a quase 150 zettabytes em 2024, e o fato de que se espera que mais do que o dobro nos próximos quatro anos, acho que se afogar em dados é uma analogia justa.
A explosão da automação e da inteligência artificial generativa (GENAI) significa que a criação de dados só seguirá de uma maneira e, embora o conhecimento seja poder, o volume de dar água nos olhos e a velocidade em que está sendo criada não se presta necessariamente a um aumento automático na alfabetização de dados.
De fato, apesar dos avanços tecnológicos, pesquisas mostram o A divisão digital global está aumentando em vez de se estreitar.
Dan Gaylin é presidente e CEO da NORC na Universidade de Chicago. Anteriormente conhecido como Centro Nacional de Pesquisa para Opinião, a NORC é uma organização de pesquisa global não partidária que usa dados e análises para estudar todos os aspectos da experiência humana.
Com 35 anos de experiência abrangendo o governo, consultoria privada e organizações de pesquisa sem fins lucrativos, Gaylin é uma autoridade reconhecida internacionalmente em questões relacionadas ao uso efetivo de dados e informações.
Ele também é o autor de FATO ADIMEque deve ser publicado em abril de 2025.
Imagem: Dan Gaylin
Em uma entrevista ao SiliconRepublic.com, Gaylin disse que o fluxo de dados não é mais linear de produtor para disseminador e consumidor, levando à democratização de dados.
“A democratização de dados compreende a proliferação de vários tipos de dados sobre praticamente qualquer assunto e o aumento da disponibilidade e acesso aos dados que o público em geral desfruta em relação a apenas algumas décadas atrás”, disse ele.
“É o resultado direto da tecnologia digital. O resultado essencial da democratização de dados é que qualquer pessoa pode agora desempenhar o papel de criador de dados, analisador, disseminador e consumidor de dados através de seu computador ou smartphone.
“Em um nível mais amplo e mais social, essa democratização de dados remodela a construção social da experiência, do conhecimento e da verdade aceita.”
Como é uma divisão digital
Enquanto a tecnologia avança em muitas partes do mundo, os países em desenvolvimento e as comunidades carentes continuam sendo deixadas para trás. Gaylin disse que isso significa que aqueles com maior acesso a esses dados – e as habilidades para usá -los e entendê -los – provavelmente serão mais bem informados do que aqueles que não o fazem.
“Estender isso a comparações de países mais ricos e mais pobres é direto. Países em desenvolvimento ou comunidades pobres têm muito a ganhar com o acesso a dados confiáveis e confiáveis. Eles podem estar ainda mais em risco de dados defeituosos ou manipulados ”, afirmou.
“Por exemplo, o acesso a informações confiáveis relacionadas à participação cívica pode ajudar a apoiar as democracias incipientes ou como o acesso a informações confiáveis em saúde pública pode ajudar a reduzir os efeitos adversos de uma emergência de saúde”.
Ele também disse que a regulamentação sobre os dados pode abordar preocupações com a privacidade, levando a uma maior confiança no ecossistema de dados mais amplo. “E esses atores governamentais e corporativos podem promover essa confiança publicando e aderindo a – sendo transparentes sobre – como eles estão usando e protegendo dados privados. Portanto, uma estrutura regulatória culturalmente apropriada faz parte de ter uma infraestrutura de dados sólida. ”
O bom, o ruim …
Houve um tempo – novamente, provavelmente no início de 2010, quando o mundo recebeu o Web 2.0 – quando o objetivo era acumular o máximo de dados possível. Quanto mais informações, melhor certo? Agora, voltando à noção de que estamos nos afogando em todos esses dados, há uma distinção entre dados bons e ruins.
Gaylin disse que bons dados são dados confiáveis, confiáveis e adequados para propósito. “Quando usamos bons dados para informar nossas decisões importantes, essas decisões têm muito mais probabilidade de produzir resultados eficazes”, disse ele.
Do outro lado da moeda, os dados ruins são o oposto disso – alguma combinação de dados não confiáveis, não confiáveis, inúteis e, às vezes, que foram propositadamente projetados para manipular ou enganar.
“Quando os tomadores de decisão são guiados por ‘dados ruins’, eles tomam decisões abaixo do ideal ou mesmo prejudiciais”, disse Gaylin. “Por exemplo, os dados que levaram à publicação de um artigo vinculando vacinas e o autismo foi uma pequena amostra e a análise foi falha. O artigo foi retirado, mas não antes de ajudar a criar uma desconfiança generalizada de vacinas. ”
Infelizmente, como vivemos em um mundo onde os dados estão por toda parte e, como Gaylin disse, não chega mais a nós de maneira linear, os usuários são forçados a se tornar muito mais experientes em dados
“Com a enorme quantidade de dados que experimentamos todos os dias, cada um de nós tem a responsabilidade de desenvolver habilidades com experiência em dados que nos permitam diferenciar dados bons e ruins, usar bons dados de maneira eficaz e evitar ser enganados ou manipulados por dados ruins”.
… e o feio
Não são apenas os ‘dados ruins’ em todos os lugares, mas as plataformas que o produzem estão se afastando das responsabilidades de moderação de conteúdo que, ao mesmo tempo, pelo menos tentaram nos proteger.
No início deste ano, a gigante da mídia social Meta anunciou que estava encerrando a verificação de fatos de terceiros em suas plataformas, optando por notas da comunidade, semelhante a X.
A mudança removerá o GuardRails fornecidos pela plataforma, permitindo que os usuários escrevam e avaliem notas da comunidade. O fundador e CEO da plataforma, Mark Zuckerberg, apontou para a eleição dos EUA como uma grande influência na decisão da empresa e criticou “governos e mídia herdada” por supostamente pressionar “para censurar cada vez mais”.
A verificação de fatos nas mídias sociais sempre foi um desafio, mesmo com moderadores, devido ao volume de conteúdo, sem mencionar que opiniões e pontos de vista estão confusos com informações factuais.
“Quando as informações são compartilhadas nas mídias sociais, as opiniões podem ser apresentadas como fatos, e os fatos ficarão confusos com opiniões. Isso cria uma situação muito assustadora e talvez simplesmente insustentável para a verificação de fatos. É inevitável que os próprios verificadores de fatos-seus possíveis preconceitos ou motivos-se tornem o assunto e possam ser rotulados como censores por usuários de mídia social. Então, não estou surpreso que a Meta se tenha encontrado neste picles ”, disse Gaylin.
“Dito isto, acho que a linguagem positiva que meta usada para apresentar a mudança é enganosa. O argumento de Meta é essencialmente que eles agora estão na multidão da verificação de fatos para o metaverso. Isso parece bom, mas tudo o que realmente significa é que a Meta está deixando as pessoas pesarem com suas opiniões sobre outros posts, que é o que eles sempre fizeram ”, disse ele.
“No final, é sempre responsabilidade do usuário revisar cuidadosamente de onde vêm os dados, quem os está analisando e apresentando conclusões e quem está compartilhando essas conclusões”.
Um mundo com conhecimento de dados
É difícil colocar a responsabilidade no usuário final. Afinal, vivemos em uma sociedade em que a criação de dados muito além do nosso controle e dos avanços tecnológicos que estão acontecendo ao nosso redor têm a capacidade de causar tanto dano quanto bom.
Fora do indivíduo, Gaylin disse que há várias etapas que a sociedade precisa tomar para se manter inteligente em relação aos dados, incluindo o aprimoramento dos padrões de formatos de dados e privacidade, desenvolvendo um sistema educacional voltado para a alfabetização de dados, fazer com que os governos produza dados públicos e expandam as áreas que ele cobre enquanto aprimora o acesso de dados e a nova mídia pode melhorar seu papel na disseminação de dados responsável.
Com tudo isso em mente, ter habilidades de alfabetização de dados permanece vital para os indivíduos, especialmente quando continuamos por uma estrada onde a realidade geralmente é mais estranha que a ficção e as notícias falsas podem parecer perturbadoramente real.
Gaylin disse que é importante que os indivíduos entendam onde encontrar, como acessar e como consumir dados, bem como a capacidade de discernir bons dados de dados ruins.
“Indivíduos com conhecimento de dados são usuários de dados responsáveis e eficazes em um mundo onde os dados agora são tecidos no tecido de nossas atividades diárias”.
Não perca o conhecimento necessário para ter sucesso. Inscreva -se para o Breve diariamenteDigest de Notícias de Sci-Tech da República de Silício.