Вы находитесь на странице: 1из 16

i i

i i

Big Data, Jornalismo Computacional e Data Journalism:


estrutura, pensamento e prtica profissional na Web de
dados
Walter Teixeira Lima Junior
Universidade Metodista de So Paulo, Brasil
E-mail: digital@walterlima.jor.br

Resumo

A atual configurao tecnolgica da In- de Jornalismo se sofistica no sentido da


ternet est sendo desenhada a partir do aproximao com outras reas do conhe-
aumento da velocidade de transmisso de cimento humano, como o campo das Ci-
dados, da interconexo entre mquinas ncias da Computao. A necessidade
computacionais com robusta capacidade do entendimento das lgicas computaci-
de processamento e armazenamento de onais possibilitam ao data journalist uti-
dados e da utilizao de linguagens de lizar novas possibilidades no tratamento
programao sofisticadas, que permitem de informaes e dados, encontrando no-
a manipulao de imensos e complexos vas abordagens para informao de rele-
bancos de dados. Nesse patamar tecno- vncia social, novos fatos e fontes de in-
lgico da rede, a atuao do profissional formao alternativa.

Palavras-chave: big data; jornalismo computacional; data journalism

Abstract

The current technological configuration fessional is sophisticated in the direction


of the Internet is being drawn from the of approximation with other areas of hu-
increase of speed of data transmission, man knowledge, as in the field of Com-
the interconnection between computatio- puter Sciences. The necessity for unders-
nal machines with robust processing ca- tanding of computational logic to enable
pacity and storage of data storage and the data journalist using new possibilities in
use of programming languages sophisti- treatment of information and data, fin-
cated, which allow the handling of im- ding out new approaches to information
mense and complex data bases. In this of social relevance, news facts and sour-
technological level of the network, the ces of alternative information.
professional practice of journalism Pro-

Estudos em Comunicao n 12, 207-222 Dezembro de 2012

i i

i i
i i

i i

208 Walter Teixeira Lima Junior

Palavras-chave: big data; computacional journalism; data journalism

N AS LTIMAS DCADAS , a sociedade contempornea absorveu as Tecno-


logias de Informao e Comunicao (TICs) em todos os seus segmen-
tos. Entre os principais motivos dessa conexo amigvel, entre pessoas no
especialistas em artefatos tecnolgicos e as tecnologias digitais, esto per-
cepo de que elas trazem conforto, vantagens competitivas e podem ser obti-
das com mais frequncia devido diminuio dos custos de obteno de tais
sistemas computacionais, alguns at se transformando em utenslios domici-
liares e vendidos em lojas de eletromsticos, como por exemplo, o Personal
Computer (PC).
Portanto, a sociedade est se apropriando das tecnologias digitais, algu-
mas at certo tempo, utilizadas somente por governos ou grande empresas
como, por exemplo, o Global Positioning System (GPS). Os resultados sociais
das apropriaes atingem todos os setores que utilizam as TICs, em expanso
vertiginosa no cotidiano do homem contemporneo. O ramo de produo de
contedo informativo de relevncia social, onde o Jornalismo se situa, tambm
est se adaptando s transformaes decorrentes dessa nova configurao.
Entretanto, a adaptao tecnolgica no parece que est sendo natural no
campo do Jornalismo, como em outros setores importantes como, por exem-
plo, na Medicina. Nessa esfera da atividade humana, o desenvolvimento, a
obteno e a utilizao de tecnologias de ponta so quase imperativos para a
manuteno de vidas e, por consequncia, da conservao do status quo da
Medicina como atividade essencial para a sociedade. Ligada Cincia umbi-
licalmente, depois que Hipcrates introduziu o pensamento cientfico na rea,
a Medicina se contraps ao obscurantismo advindo do curandeirismo e de ou-
tras prticas culturais seculares. Sob esse ponto de vista, as tecnologias so
umas das bases da evoluo das prticas da Medicina.
No campo da Comunicao Social, mas especificamente no Jornalismo,
devido abordagem deste trabalho, as TICs foram introduzidas paulatina-
mente nos grupos de mdia. O primeiro setor, a ser impactado por elas, foi o
da produo da notcia. Nos anos 80, os PCs comearam a ser introduzidos
nas redaes brasileiras. O jornal Folha de S.Paulo foi o primeiro no Brasil a
introduzir terminais de computador em suas redaes, projeto que vinha sendo
elaborado desde 1968 e foi efetivado em 1983 (Vianna, 1992). Entretanto,

i i

i i
i i

i i

Big Data, Jornalismo Computacional e Data Journalism 209

demoramos cerca de duas dcadas para inserir tais equipamentos no cotidiano


profissional do jornalista brasileiro. No final dos anos 60 e incio dos 70 do
sculo passado, o The New York Times estruturou o primeiro banco de dados,
que foi inserido nas etapas de produo da notcia. A agncia de notcias Reu-
ters, em 1968, foi pioneira a utilizar mquinas computacionais nas conexes
da sua rede interna para gerenciar a demanda de notcias recebidas.
Assim, a cultura de apropriao tecnolgica, no caso da produo do Jor-
nalismo brasileiro, possui uma histria de atraso em relao aos principais
centros. O intervalo de implementao tecnolgica, no que tange aos inves-
timentos, pelos parques brasileiros muitas vezes explicado pela diferena
entre a economia estadunidense e a brasileira nas quatro ltimas dcadas do
sculo XX. Porm, na atualidade, o fator no interfere tanto. Pois, aconteceu
o barateamento das mquinas computacionais e de outros dispositivos tecno-
lgicos (acesso Internet, displays, memria entre outros). Pode-se tambm
inserir, nesse novo momento de apropriao tecnolgica, a evoluo do de-
senvolvimento e apropriao do Software Livre (Linux), livrando as empresas
e os usurios dos custos dos softwares proprietrios (Windows, Adobe, Apple
etc).
Uma discusso importante se o atraso da apropriao tecnolgica inter-
fere no atual panorama da prtica e, at, da pesquisa em Jornalismo. Jack
Fuller (2010) afirma que o modelo de Modelo Padro de Jornalismo Tradi-
cional foi calcado em uma base tecnolgica anterior as tecnologias digitais e
conceitua:
O Modelo Padro de Jornalismo Tradicional inclui os atributos da preciso,
imparcialidade na reportagem, independncia de pessoas e organizaes
reportadas ou afetadas pela matria, um modo de apresentao algumas
vezes chamado de objetivo ou neutro e clara rotulagem do que fato e o
que opinio (Fuller, 2010).
Fuller (2010) acredita que o Modelo Padro de Jornalismo Tradicional
no considera que o fator de remodelao do ambiente da informao, no
qual a notcia uma pequena parte, tem sido produzido pela tecnologia. E,
alerta aos jornalistas que no mundo atual das tecnologias digitais conectadas
h mais do que a internet (Fuller, 2010).
A inteno do autor para alertar para a questo do uso domstico das
Tecnologias de Informao e Comunicao por jornalistas. Sejam eles vincu-
lados aos grupos de mdias tradicionais, sejam nativos do mundo digital e/ou

i i

i i
i i

i i

210 Walter Teixeira Lima Junior

free-lancers. Ou seja, h necessidade de dominar tecnologias digitais mais


profundamente, portanto, subir o patamar de apropriao proporcionado pela
Web mais amigvel (user-friendly), que foi denominada mercadologicamente
de Web 2.0 1 por Tim ORielly.
Alis, o termo Web 2.0 tem sido bastante criticado, j que a Web nasceu de
forma colaborativa nas mos de Tim Berneers-Lee e seus colaboradores. Em
entrevista 2 para IBM, disponvel em formato podcast, Berneers-Lee afirma
que ningum sabe o que esse termo significa.

Big Data, Pensamento Computacional e Jornalismo Com-


putacional
Na atual configurao tecnolgica proporcionada pela Internet, estrutu-
rada pelo intermdio do aumento de velocidade de transmisso, pela evolu-
o das mquinas computacionais com grande capacidade de processamento
e armazenamento de dados, com o desenvolvimento de linguagens de progra-
mao cada vez mais amplas e que negociam de vrias formas com robustos
bancos de dados, a atuao profissional do Jornalismo tambm deve possuir
outras configuraes.
O Jornalismo sempre manuseou informao. Neste texto, o termo infor-
mao conceituado como dado estruturado, que possui dependncia do am-
biente e tem campo semntico (Floridi, 2010). E o dado conceituado como
sendo o dado binrio, que processado e armazenado por mquinas compu-
tacionais.
O atual ambiente computacional conectado via redes telemticas faz emer-
gir novas possibilidades no tratamento de informaes e dados no campo do
Jornalismo, podendo-se reduzir, se bem utilizado, alguns dos problemas cr-
nicos na prtica do Jornalismo, como encontrar novas abordagens, fatos e
fontes.
1. OReilly, T. (2005, setembro) What Is Web 2.0: Design Patterns and Business Mo-
dels for the Next Generation of Software. OReilly Spreading the Knowledge of innovators.
Retirado de http://oreilly.com/web2/archive/what-is-web-20.html .
2. Laninghan (2006, julho). Interview with Tim Berners-Lee. Retirado de http://www.
ibm.com/developerworks/podcast/dwi/cm-int082206.txt .

i i

i i
i i

i i

Big Data, Jornalismo Computacional e Data Journalism 211

A base tecnolgica que estabelece a possibilidade de novas configuraes


para a prtica do Jornalismo a era denominada de Big Data.
"Big data" refere-se ao conjunto de dados (dataset) cujo tamanho est
alm da habilidade de ferramentas tpicas de banco de dados em capturar,
gerenciar e analisar. A definio intencionalmente subjetiva e incorpora
uma definio que se move de como um grande conjunto de dados necessita
ser para ser considerado um big data 3 .
Pode-se considerar um Big Data a Receita Federal, o Hospital das Clnicas
de So Paulo, a Companhia de Engenharia de Trfego de So Paulo (CET), o
Controle de Trfego Areo, o New York Times entre outros. No caso da Receita
Federal, por exemplo, um Big Data no disponvel, ou seja, com acesso livre
ao pblico. Mas existem repositrios abertos de dados, denominados de Open
Data, que possuem dados pblicos e podem ser manuseados por quem se
interessar. importante ressaltar que o Big Data, na sua grande maioria, um
conjunto de dados que a cada milsimo de segundo so inseridos novos.
Vrios pesquisadores estudam a quantidade de dados gerados, guardados
e consumidos no mundo. As estimativas deles variam muito, mas concordam
que o crescimento exponencial. MGI estima que empresas armazenam glo-
balmente mais do que 7 exabytes de novos dados em disk drives em 2010,
enquanto consumidores guardam mais do que 6 exabytes de novos dados em
PCs e notebooks. Um exabyte de dato equivalente a mais do que quatro
mil vezes a informao guardada na Livraria do Congresso dos EUA (235
terabytes). 4
No estudo realizado pelos Pew Research Centers Internet & American
Life Project, intitulado The Future of Big Data, afirma que por volta de
2020, o uso do Big Data melhorar o entendimento sobre ns mesmos e sobre
o mundo. O professor Jeff Jarvis, uns dos entrevistados pelos produtores do
estudo, afirma que h valor a ser encontrado nesses dados, valor em nossa
descoberta a ser colocada em pblico 5 .
3. Manyika, J., Chui, M., Brown, B., Bughin, J., Dobbs, R., oxburgh, C. & Byers A. H.
(2006, maio). Big data: The next frontier for innovation, competition, and productivity. Mc-
Kinsey Global Institute. Retirado de http://www.mckinsey.com/insights/mgi/
research/technology_and_innovation/big_data_the_next_frontier_
for_innovation.
4. Idem
5. Anderson J., Rainie, L.(2012, julho). The Future of Big Data . Pew Internet Cen-
ter. Retirado de http://pewinternet.org/Reports/2012/Future-of-Big-

i i

i i
i i

i i

212 Walter Teixeira Lima Junior

O valor que Jarvis se refere o mesmo valor encontrado por Phi-


lip Meyer, em 1967. Como consequncia da evoluo tecnolgica no campo
dos computadores (hardware) e da computao (software), o pioneiro Philip
Meyer foi o jornalista que descobriu a forma de trabalhar a informao por
intermdio de base de dados. Trabalhando para Detroit Free Press, Meyer
produziu uma matria sobre distrbios raciais em Detroit. Para isso, utilizou
computador mainframe para analisar a demografia dos negros na cidade. As-
sim, comeou a integrao de computadores e a cincia social e ele foi o
precursor na rea de Computer-Assisted Reporting (CAR) (Royal, 2010).
Apesar de possuir o mesmo valor, ou seja, produzir uma nova informa-
o a partir de dados coletados, cruzados e/ou relacionados armazenados em
base de dados digitais, as habilidades do jornalista que utiliza os conceitos e
ferramentas no CAR, como o uso de planilha de dados, trabalha de forma di-
ferente do jornalista que utiliza base de dados abertas (Open Data) na Web ou
realizando a tcnica do Scrapping, conceito que traduzido livremente para a
lngua portuguesa pode ser entendido como raspagem de dados, geralmente
feitos em documentos em formato PDF.
Para Paul Bradshaw, da Birmingham City University, trabalhar com pla-
nilha de dados, h 20 anos, era a nica forma de obter valor no cruzamento
de dados, mas ns vivemos em um mundo digital agora, uma mundo no qual
quase tudo pode ser - e quase tudo - descrito em nmeros 6 .
O mundo digital conectado que Bradshaw se refere a Web. Composta de
muitos servios, a Web tambm possui um conjunto de dados que podem ser
conectados, conceito denominado de Linked Data, que versa sobre a utiliza-
o da Web para conectar dados relacionados, que no estavam anteriormente
ligados 7 .
Para realizar uma prtica jornalstica contempornea, o profissional deve
conhecer e manipular com razovel conhecimento as terminologias e tecnolo-
gias que constituem o universo de dados digitais e as suas possveis conexes,
com o objetivo de obter valor, ou seja, contedo informativo de relevncia
Data.%20aspx?utm_source=Mailing+List&utm_campaign=6cfef277d6-
future_of_big_data_alert07_20_2012&utm_medium=email
6. The Data Journalism Handbook . European Journalism Centre. Retirado de http:
//datajournalismhandbook.org/1.0/en/introduction_0.html
7. Linked Data - Connect Distributed Data across the Web. Retirado de http://
linkeddata.org/

i i

i i
i i

i i

Big Data, Jornalismo Computacional e Data Journalism 213

social por intermdio de dados disponveis na Web. Portanto, as atuais formas


de obteno e relacionamento de dados exigem requinte tecnolgico, mais
especializado, do profissional em Jornalismo no ambiente da Web de dados.
O entendimento mais fundamentado sobre o funcionamento das Tecnolo-
gias de Comunicao e Informao, utilizadas nos processos de produo do
Jornalismo tendo como base a Web de Dados, passa por conhecer as lgicas
que as criaram, como se desenvolveram e continuam evoluindo nos seus pro-
cessos de inovao. Ou seja, o entendimento mais fundamento sobre as TCIs,
que estruturam sistemas e plataformas na rea do Jornalismo, deve ser mais
do que uma aprendizagem digital ou, ainda, de utilizao de forma domstica,
termo utilizado para designar como a maioria dos usurios que se apropria das
tecnologias oferecidas pela Web, por exemplo.
Desta maneira, o jornalista que pretende atuar na rea da Web de Dados
necessita adquirir outras habilidades, alm das fundamentais ensinadas nas
faculdades de Jornalismo e aprimoradas nas redaes. Jeannete Wing (2006)
acredita que necessrio possuir um Pensamento Computacional para extrair
o potencial possvel das tecnologias e criar novas possibilidades atravs de-
las. O cientista da computao aprende a pensar computacionalmente para
executar computacionalmente as suas modelagens (sistemas).
O pensamento computacional usar a abstrao e decomposio quando
se ataca uma grande tarefa complexa ou se desenha um grande sistema com-
plexo. a separao de preocupaes (interesses). escolher uma apropriada
representao do problema e modelar os aspectos relevantes de um problema
e faz-los tratveis. usar constantes para descrever o comportamento de um
sistema sucintamente e declarativamente (Wing, 2006).
No Jornalismo, por exemplo, a forma de pensar computacionalmente au-
xilia no entendimento de como funciona uma determinada tecnologia e quais
as possveis apropriaes profissionais poder se fazer dela. Alm disso, ajuda
na compreenso dos processos de inovao disparados a partir da sua estru-
tura. Pode ser justamente a aquisio do novo conhecimento que se estabelece
a ponte entre as funes do Jornalismo, na atual sociedade, e a capacidade de
obter informaes de relevncia social por intermdio de sistemas computaci-
onais. A computao pode promover o Jornalismo na elaborao em inova-
es na percepo de assuntos, anlise de vdeos, personalizao, agregao,
visualizao e produo de sentidos (Cohen; Hamilton & Turner, 2011).

i i

i i
i i

i i

214 Walter Teixeira Lima Junior

Fred Turner e James Hamilton (2009) afirmam que existe uma especia-
lizao jornalstica, que surge pelo cruzamento das reas do Jornalismo e da
Cincia da Computao. Essa formao utiliza a combinao de algoritmos,
dados e conhecimento das Cincias Sociais para suplementar a funo de res-
ponsabilidade do Jornalismo (Hamilton & Turner,2009). Eles a denominam
de Jornalismo Computacional. Apesar de diferente das expresses Jornalismo
Digital, Jornalismo Online, WebJornalismo e CiberJornalismo, o Jornalismo
Computacional tambm possui vnculo especfico com as prticas jornalsti-
cas em ambientes digitais conectados, mas especificamente, com tratamento
de dados em bases digitais.
Neste ambiente mais especializado, emerge um jornalista profissional com
algumas habilidades suplementares que permite entender, na sua magnitude
tecnolgica, o sistema digital conectado no qual atua.

Data journalism
A definio exata de data journalism uma construo difcil neste mo-
mento da evoluo da atividade profissional, que possui um vetor importante
de inovao: as tecnologias digitais. Juntamente com a Web, formam a base
para a prtica do data journalism, modificando a forma como a informao
captada, filtrada e publicada. Para Liliana Bounegru , do European Journa-
lism Centre, o conhecimento de dados em massa 8 . Corrobora com essa
viso o inventor do WWW, Tim Berners-Lee, ao analisar que o trabalho com
dados o futuro para os jornalistas. Para ele, os jornalistas necessitam ser
especialistas em dados 9 .
J o professor da Birmingham City University, Paul Bradshaw, acredita
que a resposta simples para o que data journalism, mas errada, poderia ser
que Jornalismo produzido com dados. Entretanto, dois termos, Jornalismo
e dados, no entender do pesquisador so problemticos.
Algumas pessoas pensam que "dado" como qualquer coleo de nmeros,
muito provavelmente obtidos em uma planilha. H 20 anos, era a nica forma
8. The Data Journalism Handbook . European Journalism Centre. Retirado de http:
//datajournalismhandbook.org/1.%200/en/introduction_4.html
9. Charles, A. (2010, novembro) Analysing data is the future for journalists, says Tim
Berners-Lee. The Guardian. Retirado de http://www.guardian.co.uk/media/
2010/nov/22/data-analysis-tim-berners-lee

i i

i i
i i

i i

Big Data, Jornalismo Computacional e Data Journalism 215

dos jornalistas trabalharem com dados. Mas ns vivemos em um mundo digi-


tal agora, num mundo no qual quase tudo pode ser - e quase tudo - descrito
em nmeros 10 .
Jonathan Gray, da Open Knowledge Foundation, acredita que a defini-
o data journalism deve ser ampla, pois um termo recente para descrever
o conjunto de prticas que usam dados para melhorar as notcias. No ar-
tigo The future of data journalism, Gray focaliza a atividade na questo das
prticas. Segundo o seu entender, a definio passa por utilizar tecnologias
digitais (banco de dados e ferramentas de anlise desses dados) para elaborar
melhores contedos jornalsticos, publicando conjunto de dados relevantes ao
lado das matrias e usar conjunto de dados para produzir visualizao de
dados interativa e aplicativas de notcias 11 .
No artigo In the age of big data, data journalism has profound impor-
tance for society, Alex Howard afirma que estamos vivendo na era da cul-
tura orientada por dados.
O jornalista especialista em dados pode usar a API do Twitter ou planilha
de dados para encontrar notcias como prontamente o profissional pode usar
o telefone para falar com uma fonte. No somente isso, ns servimos muitos
leitores que esto acostumados a lidar com dados todos os dias - contado-
res, educadores, pesquisadores e marqueteiros. Se ns quisermos capturar a
ateno deles, ns precisamos falar a linguagem dos dados com autoridade 12 .
Os profissionais da British Broadcasting Corporation (BBC), Bella Hur-
rell e Andrew Leimdorfer descrevem que o termo pode cobrir um leque de
disciplinas e usada de formas variadas nas organizaes:
Permitir que o leitor descubra a informao que seja pessoalmente rele-
vante; revelar uma histria que notvel e at ento desconhecida; ajudar
o leitor entender melhor uma questo complexa essas categorias podem se
10. The Data Journalism Handbook . European Journalism Centre. Retirado de http:
//datajournalismhandbook.org/1.0/en/introduction_0.html
11. Gray, J. (2012, junho) The future of data journalism. Data Driven Journalism.
Retirado de http://datadrivenjournalism.net/news_and_analysis/The_
future_of_data_journalism
12. Howard, A. (2012, maro) In the age of big data, data journalism has profound impor-
tance for society. Strata Making Data Work. Retirado de http://radar.oreilly.com/
2012/03/rise-of-the-data-journalists.html

i i

i i
i i

i i

216 Walter Teixeira Lima Junior

sobrepor e em um ambiente online podem frequentemente se beneficiarem


de algum tipo de visualizao 13 .
Outro grupo de mdia importante, The Guardian, estruturou o espao
virtual denominado Datablog 14 . Nele, conjuntos de dados produzidos pelo
grupo e links para Open Data so disponibilizados para qualquer usurio.
Tambm possvel acessar os produtos produzidos pelos profissionais do The
Guardian tendo dados como base, como infogrficos. Para a publicao, o
data journalism representa a convergncia de um nmero de campos do co-
nhecimento que so importantes para a construo de contedo informativo
de relevncia social, possuindo como base o conjunto de dados: a pesquisa
investigativa e estatstica para design e programao. Para Paul Bradshaw, em
artigo no Datablog 15 , a ideia de combinar essas habilidades poderosa para
contar histrias jornalsticas. Nas habilidades apontadas pelo pesquisador es-
to:
1. Encontrar dados: "Encontrar dados" pode envolver qualquer coisa desde
possuir conhecimento de especialista e contatos para ser capaz de usar
as habilidades para produzir reportagens atravs do computador ou uti-
lizar o computador para ajudar nas habilidades, para alguns, possuir
habilidades tcnicas especficas como MySQL ou Python para reunir
dados.
2. Anlise de dados: Analisar dados significa a necessidade de possuir
bom entendimento do jargo e o contexto mais amplo no qual os da-
dos esto inseridos, mais a estatstica - familiaridade com a planilha de
dados pode ajudar a poupar muito do tempo.
3. Visualizao de dados: Visualizar e converter dados tm sido histori-
camente responsabilidade de designers e programadores, mas com au-
mento do nmero de pessoas com experincia editorial tentando execu-
tar as duas tarefas, - particularmente por causa da ampliao da consci-
13. The Data Journalism Handbook . European Journalism Centre. Retirado de http:
//datajournalismhandbook.org/1.0/en/in_the_newsroom_1.html
14. Datablog: facts are sacred. The Guardian. Retirado de http://www.guardian.
co.uk/news/datablog
15. Bradshaw, P. (2010, outubro) How to be a data journalist. Strata Making Data
Work. The Guardian. Retirado de http://www.guardian.co.uk/news/datablog/
2010/oct/01/data-journalism-how-to-guide

i i

i i
i i

i i

Big Data, Jornalismo Computacional e Data Journalism 217

ncia do que possvel e particularmente pela diminuio de barreiras


na experimentao dessas atividades.
4. Converter dados: Ferramentas tais como ManyEyes para visualizao e
Yahoo! Pipes para fuso de dados tm sido teis para obter dos estudan-
tes de Jornalismo rapidamente o entendimento de suas possibilidades.
Na viso de Jonathan Stray, o data journalism obter, reportar, ser cura-
dor e publicar dados de interesse publico 16 . Ele enquadra a atividade como
sendo um dos braos do Jornalismo Computacional, pois utiliza as ferramen-
tas digitais para produzir o efeito desejado. Nesse ponto Liliana Bounegru,
reafirma a importncia do uso de tais ferramentas, pois inserem o data jour-
nalism no ecossistema de artefatos e prticas que brotam em sites de dados e
servios, pois as tecnologias digitais e a web esto fundamentalmente modi-
ficando a forma que a informao publicada 17

Novas fontes em funo da informao democrtica


Produzida mais intensamente nas ltimas dcadas do sculo XX, a con-
solidada teoria sobre o Jornalismo possui muito do seu embasamento refe-
renciado na prtica jornalstica realizada em veculos de mdia impressos e
eletrnicos. Alm dessa abordagem, considera o Jornalismo como prtica
quase exclusiva de jornalistas que trabalhavam em organizaes jornalsticas.
Vide a bibliografia, quase inexistente no Brasil, sobre prticas e produo do
Jornalismo por free-lancers. Nesse contexto, o conceito de fontes jornalsticas
foi dividido entre pessoais ou documentais. Para Gomis (1991), as fontes so
pessoas, so grupos, so instituies sociais, ou so vestgios discursos,
documentos, dados por aqueles deixados ou construdos.
Entretanto, os dados mencionados por Gomis, na atualidade, se transfor-
maram em digitais, podem ser acessados via sistema de dados abertos na Web
e atingiram um volume impossvel de mensurar, onde a dimenses so pensa-
das em terabyte ou petabyte. Agora, eles podem ser pesquisados, relacionados
16. Stray, J. (2011, abril) A computational journalism reading list. Stio de Jo-
nathan Stray. Retirado de http://jonathanstray.com/a-computational-
journalism-reading-list
17. The Data Journalism Handbook . European Journalism Centre. Retirado de http:
//datajournalismhandbook.org/1.0/en/introduction_4.html

i i

i i
i i

i i

218 Walter Teixeira Lima Junior

e produzir visualizaes por meio de tecnologias conectadas via redes telem-


ticas. Os contedos produzidos a partir do manejo com destreza das fontes,
contidas na Web de dados, adquiriram um novo patamar no processo de pro-
duo do Jornalismo.
As fontes so mais importantes para o processo de produo de notcias
que o prprio jornalista, uma vez que so elas que oferecem a matria-prima
da notcia. Alm disso, o jornalista renomado constri sua carreira em funo
da rede de relaes que mantm com suas fontes. (Lima, 2007)
A relao, entre o jornalista e as fontes, est sendo ampliada devido pro-
fuso de novas conexes entre o profissional e os conjuntos de dados digitais.
Para Mirko Lorenz, da publicao alem Deutsche Welle, as mltiplas fontes
favorecerem a filtragem de dados em redes sociais, por exemplo, trazendo
tona muitas informaes importantes que so ignoradas pelos mtodos tradi-
cionais de apurao.
Por isso, o data journalism to importante. Obtendo, filtrando e visu-
alizando o qu est acontecendo alm do que os olhos podem ver, tem um
crescimento de valor. O suco de laranja que voc consome de manh, o caf
que voc prepara - na economia global de hoje possui conexes invisveis en-
tre esses produtos, outras pessoas e voc. A linguagem dessa rede o dado:
pequenos pontos de informao que no so frequentemente relevantes sozi-
nhos, mas massivamente importantes quando vistos do angulo certo 18 .
Obter, filtrar e dispor para visualizao informaes que esto escondi-
das do pblico, mas muitas das vezes em poder de um pequeno grupo de
pessoas, que trabalham em empresas privadas, governos, instituies etc. Por-
tanto, o data journalism importante para a sociedade, pois na velocidade que
grande quantidade das informaes so transmitidas na atualidade, a funo
do data journalism tambm combater a assimetria da informao, ou seja,
que a informao estruturada seja transmitida para um nmero cada vez maior
de pessoas.
No contexto do Big Data, o movimento denominado Open Data traba-
lha para que governos e instituies estatais disponibilizem os seus dados de
forma aberta e de fcil acesso na Web, para que possam ser trabalhados pelos
18. The Data Journalism Handbook . European Journalism Centre. http://
datajournalismhandbook.org/1.0/en/introduction_1.html

i i

i i
i i

i i

Big Data, Jornalismo Computacional e Data Journalism 219

cidados, assim ajudando a fiscalizao das aes dos governos, principal-


mente no que tange aos gastos pblicos.
A fim de manter o governo responsvel por suas aes, cidados devem
conhecer sobre essas aes. Para isso acontecer, eles devem insistir que o
governo atue de forma aberta e transparente possvel. No sculo XXI, isso
colocar os dados disponveis de forma online e com fcil acesso. Se o dado do
governo colocado disponvel em formatos teis e flexveis, cidados podem
ser capazes de utilizar modernas ferramentas em software livre para lanar luz
sobre as atividades do governo. Tais ferramentas inclui mashups, que realam
conexes escondidas entre diferentes conjuntos de dados e o crowdsoursing,
que faz o leve trabalho de peneiras atravs de montanhas de dados por inter-
mdio de milhares de olhos sobre um conjunto particular de dados. (Brito,
2008)
O data journalist atua nessa rea produzindo informaes estruturadas a
partir do cruzamento de dados atravs de bases de dados online fornecidas por
governos, como data.gov 19 , dos EUA.
Para Vivek Kundra, ex-chefe do Governo Eletrnico estadunidense, Open
Data uma valorosa contribuio de aplicao no campo da democracia, pois
ajuda a combater a corrupo governamental, melhorar a responsabilidade e
melhorar os servios do governo; mudar para um governo aberto, transparente
e participativo. Nesse ambiente pode se criar novos modelos de Jornalismo
fornecendo informao de relevncia social atravs de conjuntos de dados
abertos.
Ao permitir que qualquer pessoa se aprofunde em fontes de dados e en-
contre informao que relevante para ele, bem como verificar as afirmaes e
desafiar as suposies comumente recebidas. O data journalism efetivamente
representa a democratizao em massa das ferramentas, tcnicas e metodolo-
gias que eram anteriormente utilizadas por especialistas (reprteres investiga-
tivos, cientistas sociais, estatsticos, analistas e outros especialistas) 20 .
Diferente do modelo adotado tradicionalmente para o exerccio da pro-
fisso, com o ensino sendo obtido atravs de curso universitrio e a prtica
realizada nas organizaes miditicas, o data journalism se expande na Web e
pode ser apropriado por qualquer usurio que deseja aprend-lo. Pertencendo
19. DataGov. Retirado de http://www.data.gov/
20. The Data Journalism Handbook . European Journalism Centre. http://
datajournalismhandbook.org/1.0/en/introduction_4.html

i i

i i
i i

i i

220 Walter Teixeira Lima Junior

ao movimento de cultura livre (Open Source), as prticas podem ser adquiri-


das por intermdio de cursos livres online, websites especializados em ensinar
e debater tcnicas, encontros denominados de Hack Day e concursos, como
o realizado pela Mozilla 21 - Knight-Mozilla OpenNews, que possui a Knight
Foundation como parceira.
Knight-Mozilla OpenNews sobre construer um ecossistema para ajudar
o Jornalismo obter sucesso na Web aberta. sobre produzir uma nova gerao
de solues na Web que resolvam problemas reais nas notcias. sobre ajudar
comunidades de desenvolvedores e jornalistas como eles fazem, aprendem e
inventam juntos. sobre organizar bolsistas e cdigos.
O Hack Day uma atividade, geralmente, que possui a durao de 24
horas e prope aos participantes (sozinhos ou organizados em equipes) que
realizem um projeto tendo como base um desafio. Os encontros podem ser
realizados por grupos, como o Hacks/Hackers 22 ou por grupos de mdia 23 ,
que neste caso fornecem sua base de dados para o desenvolvimento de produ-
tos a partir delas. Em funo de existir encontros de hackers h muitos anos,
com pblico formado por programadores/desenvolvedores, com a possibili-
dade de produzir contedo informativo de relevncia social por intermdio de
base de dados abertas na Web emergiu o termo hacker journalist, que pode
ser considerado sinnimo de data journalist.

Consideraes finais
A atual sociedade se apropria das Tecnologias de Comunicao e Infor-
mao como nunca na sua histria. As inovaes tecnolgicas possibilitaram
o barateamento e o fcil uso de diversas plataformas digitais, muitas destas
fazendo parte do cotidiano, seja no campo pessoal ou profissional.
A expanso vertiginosa da TICs tambm atingiu o setor de produo de
contedo informativo de relevncia social. O Jornalismo est tentando se
adaptar s transformaes resultantes da configurao tecnolgica digital, que
modifica a forma que a informao obtida, filtrada e distribuda.
21. Knight-mozilla OpenNews. Retirado de http://www.mozillaopennews.org/
22. Hacks/Hackers. Retirado de http://hackshackers.com/about/
23. (December, 2011) Hack Day. New York Times. Retirado de http://www.
nytimes.com/marketing/timesopen/hackday.html

i i

i i
i i

i i

Big Data, Jornalismo Computacional e Data Journalism 221

Assim, o Jornalismo enfrenta uma crise quando confronta o Modelo Pa-


dro de Jornalismo Tradicional com atual configurao tecnolgica proporci-
onada pela Internet, que est sendo potencializada pelo aumento de veloci-
dade de transmisso de dados, pela evoluo das mquinas computacionais
(aumento de capacidade de processamento e armazenamento de dados), com
a multiplicao e consolidao de linguagens de programao cada vez mais
amplas, permitindo transacionar dados de diversas formas.
Nessa estrutura tecnolgica, que emerge o Big Data, a atuao profissi-
onal do Jornalismo tambm deve possuir outras configuraes. Ele deve ad-
quirir habilidades tcnicas/tecnolgicas que proporcionem transformar-se em
data jornalista. Entre algumas das suas especialidades esto: encontrar dados
em bancos e documentos digitais disponveis na Web; capacidade de analisar
dados atravs de softwares para tal fim e produzir visualizao de dados que
foram obtidos e relacionados.
Esse conjunto de prticas, que usam dados para melhorar as notcias, pro-
porciona a descoberta de novas fontes, fatos jornalsticos e angulaes, que
ajudam na disseminao de informaes relevncia social, fortalecendo o de-
senvolvimento de uma sociedade mais justa e igualitria, portanto, mais de-
mocrtica.

Referncias
Brito, J. (2008) Hack, mash, & peer: crowdsourcing government transparency.
The Columbia Science and Technology Law Review, IX, 119 157.
Cohen, S., Hamilton, J. T.& Turner F. (2011). Computational Journalism.
Communications of the ACM, 54(10), 66-71.
Floridi, L. (2010). Information: a very short introduction. New York: Oxford
University Press.
Fuller, J. (2011). What is happening to news: the information explosion and
the crisis in Journalism. Chicago: The University of Chicago Press.
Gomis. L. (1991).Teoria del periodismo; como se forma el presente. Barce-
lona: Paids.
Hamilton, J. T. & Turner, F. (2009). Accountability Through Algorithm: De-
veloping the Field of Computational Journalism. A report from Deve-

i i

i i
i i

i i

222 Walter Teixeira Lima Junior

loping the Field of Computational Journalism, a Center For Advanced


Study in the Behavioral Sciences Summer Workshop, July 27-31. Recu-
perado em 20 de outubro de 20112, de http://www.stanford.edu/
~fturner/Hamilton%20Turner%20Acc%20by%20Alg%20Final.pdf
Lima , W. T., Junior (2007). Bases conceituais visando a criao de UML
(Unified Modeling Language) para pesquisa e validao qualitativa de
fontes de informao jornalstica (Relatrio de Ps-doutorado), So Ber-
nardo do Campo, Programa de Ps-graduao em Comunicao Social,
Universidade Metodista de So Paulo.
Royal, C. (2010). The Journalist as Programmer: a Case Study of The New
York Times Interactive News Technology Department. Anais do Inter-
national Symposium in Online Journalism, The University of Texas at
Austin, Austin, TX, USA.
Vianna, R. P. A. (1992). Informatizao da imprensa brasileira. So Paulo:
Edies Loyola.
Wing, J. M. (2006). Computational Thinking. Communications of the ACM,
49(3), 3335.

i i

i i

Вам также может понравиться