Wikimania/2015/Relato

Relato: Vinicius Siqueira

editar

The State of Wikimedia Scholarship 2014-2015

editar

Este painel apresenta uma rápida descrição de algumas menções à Wikipédia e outros projetos na pesquisa acadêmica durante o período. Selecionei alguns dos artigos citados:

  • Wikipédia como uma fonte de dados:
  1. Ronen, S., Gonçalves, B., Hu, K. Z., Vespignani, A., Pinker, S., & Hidalgo, C. A. (2014). Links that speak: The global language network and its association with global fame. Proceedings of the National Academy of Sciences, 111(52), E5616—E5622. doi:10.1073/pnas.1410931111

Tenta encontrar uma forma de medir a influência global dos idiomas.

Os métodos tradicionais de medida se baseiam em:

  • (1) população falante e
  • (2) renda ou poder político dos falantes

O artigo apresenta um novo método baseado na medida de "co-falantes" das línguas em várias bases de dados incluindo a Wikipédia.

  • Qualidade do conteúdo:
  1. Hwang et al., Drug Safety in the Digital Age. N Engl J Med 2014; 370:2460-2462 June 26, 2014 doi:10.1056/NEJMp1401767.

O Food and Drug Administration (FDA) frequentemente publica informes de segurança sobre a prescrição de medicamentos. Quanto tempos estes informes demoram até serem refletidos na Wikipédia em inglês?

41% foram atualizados em duas semanas (58% para doenças prevalentes, mas 36% permaneceram não alterados após um ano).

  1. Kräenbring et al., Accuracy and completeness of drug information in Wikipedia: a comparison with standard textbooks of pharmacology. PLoS One 9 (9):e106930. doi:10.1371/journal.pone.0106930

Selecionou 100 artigos da Wikipédia em alemão que constam no currículo de Farmacologia e extraiu informações de dois livros-texto padrões. A acurácia dos artigos foi de 99,7% quando comparados aos dados dos livros. Resultados similares para a Wikipédia em inglês.

  • Automação na Wikipédia:
  1. Banerjee et al., Playscript Classification and Automatic Wikipedia Play Articles Generation. 2014 22nd International Conference on Pattern Recognition (ICPR). pp. 3630–3635. DOI:10.1109/ICPR.2014.624

Um bot buscou peças de teatro e documentos relacionados na web. Extraiu informações-chave deles. Análise heurística para excluir frases não-enciclopédicas, por exemplo afirmativas em primeira pessoa. 15 artigos foram submetidos nos "Artigos a serem criados". Dois foram aceitos por editores da Wikipédia. Um deles sem grandes mudanças ("Fourteen", uma peça de Alice Gerstenberg).

  • Gênero além do "Gap":
  1. Wagner, Claudia; David Garcia; Mohsen Jadidi; and Markus Strohmaier. 2015. It’s a Man’s Wikipedia? Assessing Gender Inequality in an Online Encyclopedia. Ninth International AAAI Conference on Web and Social Media (ICWSM).

Sabemos que existe o "gap gender". Necessidade de mais análises multidimensionais sobre como o gênero é representado no conteúdo de artigos na Wikipédia.

Utilizou dados de três fontes como linha de base para a comparação com seis Wikipédias. Examinou múltiplas formas de potenciais parcialidades: cobertura, estrutura, características léxicas, visibilidade.

Resultados: (1) a cobertura sobre mulheres (número de artigos, tamanho) na WP é geralmente melhor do que me outras fontes, (2) artigos sobre mulheres tendem a estar menos centralmente conectados na rede de artigos do que artigos sobre homens e (3) o conteúdo de artigos sobre mulheres utiliza palavras diferentes dos artigos sobre homens, maior incidência de linguagem relacionada a família, gênero e relacionamento. Results: The coverage

  • Adotando a Wikipédia como uma ferramenta de ensino:
  1. Barnhisel, Greg and Marcia Rapchak. 2014. Wikipedia and the Wisdom of Crowds: A Student Project. Communications in Information Literacy 8(1): 145-159. doi:10.7548/cil.v8i1.249.

Estudantes utilizam a Wikipédia de forma acrítica. Eles não entendem que a maior parte das informações pode ser de baixa qualidade ou que eles podem estar sendo manipulados. O professor (autor do artigo) acredita que a WP é cheia de informações dúbias. Pretende demonstrar isso para seus alunos.

Solicita aos alunos que editem artigos da WP (em grupo e individualmente) durante um semestre. Solicita aos estudantes que reflitam sobre a experiência e analisem prós e contras da escrita aberta e colaborativa nos seus projetos finais.

Ao contrário da expectativa do professor:

Relato de um estudante: "Both sources [crowds and experts] have different merits... My life experience since class pulls me in favor of the wisdom of the crowd. In my recent studies, I have found that I can learn much more from a group of my peers than from a single expert."
  • Meta-análise:
  1. Mesgari, Mostafa and Okoli, Chitu and Mehdi, Mohamad and Nielsen, Finn Årup and Lanamäki, Arto. 2014. The sum of all human knowledge": A systematic review of scholarly research on the content of Wikipedia. Journal of the Association for Information Science and Technology

The Effect of Blocking IP Editing: Evidence of Wikia

editar

O que acontece quando Wikis proíbem a edição por IPs?

  • Quanto dano e vandalismo deixa de acontecer?
  • Quanto conteúdo bom deixa de ser enviado?

Wikia hospeda 100.000 wikis editáveis publicamente; muitas das mairoes wikis; a maior parte sobre "fan-pop-culture".

Objeto de análise foram 136 wikis que bloquearam contribuições de não registrados (de um dia para o outro).

Método de comparação: regression discontinuity design (RDD) utilizando o cutoff de +/- 3 meses

Estimar o efeito do bloqueio sobre as médias de danos e contribuições de qualidade, independente de quem está contribuindo.

Duas medidas de dano:

  • palavras removidas: i.e. mais texto "ruim" inserido em páginas seria considerado pior
  • edições revertidas: edições que foram completamente revertidas

Após o bloqueio, houve queda de 70% nas palavras removidas e 55% nas reversões.

Duas medidas de qualidade:

  • edições mantidas (não-revertidas)
  • palavras que persistem nas revisões subsequentes – uma medida tanto de qualidade como de produtividade. i.e, palavras que são mantidas por mais tempo são melhores

Após o bloqueio, houve queda de 30% nas edições não-revertidas e de 60% nas palavras que persistiram (qualidade).

Conclusão: queda nas medidas de danos, mas também de qualidade.

editar

Um experimento que tenta propor questionamentos sobre as práticas de prestação de contas.

Global North (98% dos fundos alocados) e Global South (2%). 1/3 dos capítulos estão no Global South.

Se levado em conta o valor captado em doações no Global South, o investimento de 2% é menor do que é captado.

Receita (2013-2014): > 20.000.000 dólares

Despesas: 44% Custos operacionais / 49% Outras despesas (fundos) / 6% Eventos / 1% Desenvolvimento organizacional / <1% Taxas

Failures That Made Us Better – A brief history of the WMF as a learning organization

editar
  • User data retention: The Video Professor Incident (2008)
  • Advertising on Wikipedia: The Spanish fork (2002)
  • Employee background checks: Hiring a convicted felon (200&)
  • Global South Strategy: The Catalyst Projects (2010-2014)
O que aconteceu:

Três grandes projetos para apoiar o crescimento da Wikipédia no Gloabl South (India, Brasil, países Arábia), desenvolvidos por "locais" remunerados.

Vários problemas, incluindo a relação com comunidades voluntárias locais.

Escritórios locais não ocorreram, como planejado.

Principais lições:

(no Brasil e na Índia) Apoio e interesse ativo da comunidade é essencial para o estabelecimento de staff pago.

WMF precisa manter a confiança dessas comunidades, através de consultas à comunidade

No Global South, a maior parte dos grupos precisa e recebe bem apoio pró-ativo em estratégia e recursos não-financeiros.

Hoje:

O programa indiano sobrevive como um "grant program" (CIS), o programa do Brasil foi encerrado. Ainda há muitas atividades apoiadas no Oriente Médio.

  • Year-end fundraising: The 2003 Christmas outage
  • Introducing Agile software development principles: The Fundraising tech deathmarches

“L” For Laboratories and “M” For Microscopes: Redefining GLAM by Partnering With a Medical School

editar

Imagens da coleção do departamento de Patologia foram carregadas

Imagens não carregadas: revelavam a identidade do paciente; imagens já publicadas.

Por que imagens livres do Departamento de Patologia?

  • O modelo clássico de ensino é a descrição orientada, mas patologia é um assunto visualmente orientado
  • Coleções de imagens de boa qualidade são raras e caras
  • Faltam legendas ("anotações") apropriadas em imagens livres

Por que Med-GLAM?

  • Disponibilizar imagens livres e legendadas para o ensino de estudantes de medicina
  • Criar um repositório de imagens livres para uso por pesquisadores e livros
  • Facilitar a busca por imagens livres usando categorias, palavras-chave e etiquetas
  • Iniciar a discussão sobre cenários de casos raros

Precisamos de ajuda para:

  • Legendar as imagens
  • Categorizar as imagens
  • Criar um atlas de patologia específico para o currículo das escolas médicas do seu país
  • Traduzir as legendas
  • Linkar para o Wikidata

An Edit A Day: Collaboration with Medical Institutions

editar

NIOSH – National Institute for Occupational Safety and Health

Milhares de pesquisadores, médicos e pessoal de comunicação

Pesquisa nos arquivos sobre Saúde do Trabalhador

Interesse e contribuição de especialistas

Dados:

  • Mais de 2 milhões de visitas/mês
  • 30% de aumento no tráfego do site do NIOSH nos primeiros 4 meses
  • ~2800 edições abrangendo tópicos de Saúde do Trabalhador
  • Colaborações internacionais

Modelo de fellowship:

  • Estruturado de forma similar a fellowships acadêmicos
  • Residentes/Fellows assalariados
  • Função
    • Criação de conteúdo
    • Outreach
    • Instrução

Conflito de interesse

  • Distinguir entre a instituição e o tópico (Saúde do Trabalhador)
  • "Paid shill" or "paid researcher"?
  • Declaração ("disclosure")

Q&A WMF Board of Trustees

editar
  • Troca na presidência: Patrício (presidente) e Alice (vice-presidente)
  • Entram: James Heilman, Dariusz Jemielniak e Denny Vrandečić
  • Saem: Phoebe, María, Samuel e Bishakha (em alguns meses)
  • Perda de diversidade do Board, em 10 apenas 1 mulher. Precisamos de uma cota?
Denny: Esperar que o processo democrático produza diversidade é uma assunção incorreta.
  • Global South: Patricio: É uma prioridade da fundação, aumentar o uso e os editores no GS. A equipe de community engagement está fazendo um grande trabalho nesse sentido. Este ano nós tivemos uma das mais importantes eleições para o Board, com muitos candidatos do Global South. Essa é uma prioridade pessoal para mim. James Heilman: Importante distribuir a Wikipédia também de outras maneiras, que não dependam da internet ou wifi, como Kiwix, sim cards, que possam alcançar populações sem acesso no mundo em desenvolvimento.
  • Friendly space policy: María: Estou feliz que tenhamos esta política. Já tivemos alguns problemas com ameaças online, sobretudo sobre minorias. WMF deve ser bem proativa. Jimmy: Um dos conceitos mais antigos da Wikipedia é a civilidade e não aos ataques pessoais. O quanto levamos isso a sério tem sido flutuante. É um problema profundo e complicado. Em algum ponto, particularmente gênero, existe um problema e se queremos encorajar a diversidade, devemos levar essas ideias bastante a sério. Se a comunidade não conseguir resolver, talvez seja necessária uma participação maior da fundação e do board. É melhor que venha pela comunidade.
  • More editors from the Global South: Patrício: Muitas pessoas que contribuem do GS não falam inglês e estão completamente por fora dessas discussões. Necessitamos trazer essas pessoas e descobrir o que elas querem e precisam. Precisamos colocar isso na mesa com as pessoas que estão por fora dessa discussão. Essa é uma prioridade. GS tem seus problemas, mas têm melhorado seu acesso à internet via mobile. Denny: Um dos maiores impedimentos para não participar no movimento é que muitos editores do GS não podem efetivamente contribuir com as decisões (eleições, discussões no meta...). Tecnologia de idiomas é um exemplo que tem sido trabalhado pela fundação. Nós temos projetos como Commons e Wikidata que fornecem serviços para todas as línguas. Espero que tenhamos mais participação nas discussões e nas eleições.
  • Financial – possibilidade de reconsiderar princípios como o de non-advertising?: Jimmy: O modelo de doações funciona. Pessoalmente, se estivéssemos em apuros eu ainda assim votaria contra propagandas na Wikipedia.

Ebola Translations: How We Did It and How to Get Involved

editar

Crise na Liberia, Serra Leoa, Guiné e Nigéria. Site mais usado na Liberia, Serra Leoa e Guiné para Ebola

A Wikipedia se transformou em uma fonte confiável de informações sobre ebola na Internet – New York Times (28out2014)

As informações do CDC etc. estão em inglês. Esses países falam outras línguas (Serra Leoa: fulani, mandinka, sus, kissi...).

Ebola translations into African languages (colaboração com TWB e Rubric): tradução do artigo para 19 línguas africanas, algumas delas faladas nas áreas afetadas.

Medical Translation Project:

Passos: Melhorar o artigo (em ingês) --> Tradução --> Garantir acesso

Designing Content Translation – How to improve the translation process from a user-centered perspective

editar
  • Learning experience:
    • Informações relevantes foram captadas nas páginas da wiki e em artigos de pesquisa
    • Aprender diretamente a partir dos usuários foi fundamental
  • Testar a ferramenta: tradução do conteúdo está disponível como uma ferramenta beta na Wikipédia para todas as línguas (10k artigos criados)
  • Princípios de Design por trás da ferramenta:
  1. Liberdade de tradução: “Não pretendemos que os artigos da Wikipédia em diversas línguas sejam réplicas exatas”
    Parágrafos são adicionados um por um. Adiciona-se apenas o que você quer da primeira versão.
    A edição não deve ser inibida. O nível do parágrafo fornece flexibilidade suficiente.
  2. Fornecer informações de contexto: "Traduzir requer movimentar-se entre muitas peças de informação"
    Editar lado a lado. Manter a informação conectada conforme os usuários a traduzem.
  3. Foco na tradução: “Este não é um editor com finalidades gerais. Ele serve para adaptar o conteúdo existente para a sua versão inicial”
    Automatizar os passos mais chatos. Não é mais preciso sair à caça de links ou categorias.
    Ferramentas não se metem no caminho. Focar no conteúdo e providenciar espaço para mais ferramentas.
  4. Qualidade é o mais importante: “Nós não queremos desarrumar a Wikipédia com traduções ruins feitas por semi-robôs”
    Controlar quantos usuários editam. Reforçar o propósito da ferramenta.
    Acompanhar os índices de eliminação. Menores do que quando os artigos são iniciados do zero.
  • Além da tradução:
    • Criar uma tradução é apenas um passo no processo.
    • Chegar até a ferramenta quando você precisa dela: links em cinza quando o artigo não existe no seu idioma
    • Convite para experimentar a ferramenta.
    • Comunicar os benefícios e o impacto (comunicação social nos canais tradicionais da Wikimedia).
  • Próximos passos:
    • Passo 1: Tornar as traduções mais fáceis.
    • Passo 2: Tornar o começo mais fácil.
    • Passo 3: Manter os usuários traduzindo.

Assignment 1: Becoming a Wikipedian

editar

Três turmas em três universidades.

Cursos sobre o mesmo tema: Comunidades Online

Wikipédia, uma comunidade entre muitas

(Todos os três professores são mais experientes como wikipedistas do que como professores)

  • WP no ensino superior (modelo clássico)
    • Objetivo de aprendizagem primário:
      • Aprender sobre um tópico em particular coberto pelo curso (idêntico ao modelo de aula "pré-wiki")
    • Avaliação:
      • Os alunos fazem contribuições aos artigos da WP neste tópico em particular
      • São avaliados como artigos tradicionais (em física, os conceitos da física, em sociologia etc.)
  • WP no ensino superior (nosso modelo)
    • Objetivo de aprendizagem primário:
      • Aprender sobre a WP como um exemplo de comunidade online
      • Desenvolver habilidades e experiências de colaboração na prática (online)
    • Critérios primários para avaliar contribuições à WP:
      • Demonstrar conhecimento dos processos, normas e procedimentos da WP
      • Reflexão crítica sobre a participação na Wikipedia
      • Aplicar teorias e conceitos do curso para explicar as experiências na Wikipédia
  • Como parecer diferente:
    • Ênfase no envolvimento profundo com a WP (e outras comunidades)
    • Alunos confusos na compreensão e reflexão crítica sobre os processos da WP
    • O tema e o conteúdo dos artigos da WP são relativamente pouco importantes (e.g. os alunos podem escrever sobre qualquer coisa). Os alunos são avaliados em relação a seu conhecimento sobre a WP, propriamente dita.
  • Exemplos de conceitos de aula:
    • Comprometimento
      • Discussão sobre porque as pessoas são comprometidas (e.g. Guild of copy, WikiWomen’s Collaborative, WikiProject Military History)
      • Avaliação da arrecadação de fundos da WP
    • Novatos
      • Comparação entre The Wikipedia Adventure, predefinição “normal” de boas-vindas, WikiEd Student Tutorial
    • Gratidão
      • Espalhar o “wikilove” na turma. Refletir sobre o processo e a experiência.

Exemplos de tarefas:

  1. Aprender sobre a Wikipedia
  2. Criar artigos, revisão por pares
  3. Escrever um ensaio de reflexão sobre a experiência
  • Exercícios relacionados:
    • Visitas de wikipedistas locais
    • Visita aos arquivos das universidades
    • Criação de artigos no WikiHow
    • Participação em projetos do Citizen Science
    • Atividades e grupo
  • Fraquezas do material atual
    • As introduções iniciais (e.g. WikiEd tutorial) têm o foco em como escrever bons artigos e gasta muito menos tempo na interação com a comunidade
    • A maior parte dos tutoriais não enfatiza interação com os outros
    • Criar espaço para interação é difícil em cursos de 10-12 semanas
      • e.g. Um aluno queria criar um artigo sobre um assunto (claramente notório dados os eventos recentes) que foi "fraudado" anos antes
  • Os alunos se envolveram em mais problemas do que em outras turmas
    • Os alunos ficaram sobrecarregados pelas regras, normas etc.
    • Estar a bordo da Wikipédia foi extremamente mais pesado quando comparado com outras comunidades
    • Feedback eram raros
    • Quase todos os feedback eram coercivos e negativos, e.g. muitos artigos novos foram nomeados para deleção
    • Pedir ajuda era frequentemente contraprodutivo:
      • Pedir ajuda no #wikipedia-help levou a AfDs de materiais de estudantes, colegas de classe, instrutores
  • Tópicos selecionados:
    • Os alunos tiveram dificuldades para selecionar os tópicos
    • A seleção aberta dos tópicos gerou muitos problemas relacionados ao conteúdo:
      • NPOV quando os usuários escolheram tópicos com os quais eram muito próximos
      • Problemas de notoriedade
  • Impressão geral dos alunos
    • Os alunos se sentiram empoderados e inspirados
    • Os alunos gostaram das habilidades e conhecimentos práticos da Wikipédia
    • A seleção aberta de tópicos permitiu aos estudantes se conectar diretamente com o trabalho do curso de modo que motivou o aprendizado
      • e.g. Um estudante de Gâmbia escreveu uma biografia do músico tradicional gambiense mais notável.
      • Um aluno tipicamente pouco motivado foi capaz de criar um artigo fantástico relacionado ao esporte nos EUA.
  • Coisas que poderíamos mudar
    • Expandir?
      • Idealmente, sim. Mas apenas com Wikipedistas experientes como instrutores e TAs.
      • “Become a Wikipedian”, MOOC?
    • Middle ground in topic selection?
      • e.g. selecionar artigos de uma lista de artigos solicitados
    • Compartilhar as reflexões na Wikipédia como um contra-argumento?
      • Sim!

Communicating your projects – Wikipedia Education Program as an example

editar

Comunicar é compartilhar informações sobre sua atividade por diferentes meios que podem incluir:

  • WMF blog
  • Blogs de afiliados
  • Mídia social
  • Etc.

Escolher qual meio de comunicação usar depende de diferentes fatores:

  • Qual a sua mensagem?
  • Qual é sua audiência?
  • O que você pretende atingir com a divulgação da sua mensagem?

Por que é importante comunicar em algum desses meios?

  • Há muitas razões pelas quais as pessoas podem querer se comunicar. Vamos tomar um exemplo simples:
    • Exemplo: Se você está planejando um evento (editathon, workshop…), você vai querer atingir alguns públicos-alvo: participantes (do evento), parcerias (para hospedar o evento), doadores/patrocinadores (para cobrir despesas), outros (aliados, apoiadores…)

Comunicação efetiva: 1) Escrita

  • Escrever um post em blog ou newsletter pode ajudá-lo no seguinte:
    • Outreach e promoção da atividade dentro e fora da comunidade Wikimedia
    • Alcançar novas comunidades para encontrar apoio e voluntários com os quais você não está conectado.
    • Compartilhar os casos de sucesso e lições do evento quando este terminar.
    • Inspirar os outros de outros lugares e comunidades com sua história.

2) Design gráfico

  • O design de um projeto representa sua identidade.
  • É importante seguir os guias e manter uma unidade visual dos projetos Wikimedia. Isso parece mais profissional, ajuda a estabelecer respeito e ajuda as pessoas a entender a identidade.
  • É legal que você queira ter o logo da Wikipedia ou outros projetos Wikimedia em certificados, material promocional etc. Mas é importante utilizar os mesmos valores usados no design original, i.e. as mesmas fontes, espaçamento, cores e dimensões (wikimediafoundation.org – Visual identity guidelines).

Pluricentric Languages and Wikipedia – Where to Draw the Line… and Where Not To

editar

Termo cunhado por William Stewart e Heinz Kloss no final da década de 1960

Definição de um idioma pluricêntrico:

  • Várias versões padrão
  • Usado além das fronteiras de entidades políticas individuais

Quase todos os grandes idiomas são pluricêntricos

Exceções: russo, japonês, albanês

Idiomas pluricêntricos assimétricos:

  • Encontrados em qualquer lugar onde haja uma variedade dominante da língua
  • A maioria devido a uma grande porcentagem de falantes nativos em um único país

Exemplo Alemão Exemplo Francês

Argumentos a favor e contra o uso de variantes nacionais de idiomas assimétricos na Wikimedia

  • Padronizar o idioma na Wikipédia de acordo com a maioria dos leitores torna mais fácil para os leitores
    • Mas isso se aplica a todos os artigos? O que dizer sobre temas locais?
  • Incentivar a diversidade na Wikipédia faz os usuários mais felizes
    • E mesmo dicionários em Alemão estão começando a acomodar outras variantes.
  • Desmotivar usuários de pequenos grupos parece uma má ideia

Variantes pluricêntricas simétricas

  • Encontradas quando existe dois ou mais centros que usam suas variantes próprias largamente disseminadas e padronizadas
  • en.wikipedia: WP:TIES
    • Definiu que “um artigo sobre um tópico que tem fortes laços com uma nação falante do inglês deve usar o inglês dessa nação”
    • Ao mesmo tempo, nenhuma trata dos artigos de acordo com Wikipedia:Ownership of articles
      • Áreas incertas são comuns sempre que dois ou mais países têm fortes laços com um tópico.
    • en.wikipedia: Livro de estilo (oportunidades para o compartilhamento; consistência nos artigos; fortes laços nacionais com um tópico; retendo a variedade existente).

Workshop: Content Translation Tool

editar

https://etherpad.wikimedia.org/p/wikimania-indigenous-languages