Estudo de tendências dos editores

Página dedicada aos estudo de tendências do editores da Wikipédia em português. Reunindo materiais e resultados relevantes sobre o tema. Essas tendências ajudarão num melhor entendimento do comportamento e evolução da Wikipédia, em língua portuguesa.

Estudos
Temas:
Editores
Filosofia
Wikipédia
Teorias e resultados

Questões

editar

Conjunto de questões com alta prioridade para a Wikipédia-pt. Sinta-se livre para fazer perguntas que nosso estudo pode ajudar a responder.

  • 1. Which editors are the ones that are leaving -- are they the new editors or the more tenured ones?
  • 2. Qualidade dos artigos criados por IPs - discussões recorrentes sobre limitar a edição de IPs.
    • Os artigos criados são mantidos ou eliminados? Se eliminados, são vandalismos ou erros de novatos? Se mantidos, há algum usuário novato editando o artigo pouco tempo depois?

A parte inicial, com a série histórica de 2001-7, pode ser vista aqui. Essa não é a final, mas oferece um ideia sobre as edições (criações de artigos) dos IPs, quando comparadas com usuários registrados.

  • 3. Distribuição geográfica da Wikimedia
    • Qual a quantidade de contas registradas mensalmente por região? - Onde a Wiki tem maior visibilidade?
  • 4. Artigos eliminados
    • Qual o percentual para cada tipo de justificativa de eliminação?
  • 5. Categorização de novos artigos
    • Como os novos artigos são categorizados? Em qual nível nas árvores de categorias?
  • 6. WikiPausa
    • É comum os editores entrarem em WikiPausa? Com que frequência, e por quanto tempo? - A WikiPausa faz parte do ciclo normal dos editores?
    • Há relação entre a WikiPausa e a situação em que a comunidade se encontra? - Motivos para a WikiPausa
  • 7. Ferramentas de cargos
    • Frequência de edições eliminadas / que são reversões e participação nas PEs dos Elimiunadores / Reversores / Administradores
    • Comparação entre Antes e Depois de receber as ferramentas. - Quando recebe as ferramentas, os editores mudam seu padrão de edições? Eles passam a focar mais nas eliminações das ERs que mandar páginas para ER? Ter a ferramenta incentiva os editores a combater mais o vandalismo, ou dificulta pelo medo de ser acusado de mal uso da ferramenta?
    • Comparação com outros editores que não tem os cargos - O que leva os editores a se tornarem eliminadores / reversores? O padrão de edições (reversão / eliminação) é suficiente ou há outros motivos para a decisão (situação da Wiki / modo de ver os cargos / etc)? Se possível, identificar candidatos com padrões de edição que podem ser indicados para esses cargos.

Ferramentas

editar

Algumas ferramentas foram herdadas do estudo Editor Trends, e outras foram adicionadas atendendo necessidades próprias.

Python > 2.6: Linguagem de programação orientada à objetos, interpretada e ágil.
MongoDB: Banco de dados orientado à documentos e de alta performance, faz uso de documentos com no estilo JSON.
Editor trends: Ferramenta desenvolvida por um grupo da Wikimedia Foundation, responsável pela descompactação do arquivo DUMP, disponível gratuitamente.
MySQL: Gerenciador de banco de dados, de código aberto.

O processo inicial é baixar um arquivo dump, formado por um arquivo xml compactado. Uma vez com o arquivo, é feita a extração, um processo que vai transformar um único arquivo (grande) xml em arquivos menores .csv. Depois dessa conversão os arquivos .CSVs podem usados por qualquer ferramenta de análise: R, Excel, Python, C++.

Tarefas

editar

No estudo sobre a qualidade do usuários anônimos, tipo IP, existem algumas diferenças do estudo do Editor Trends. O conjunto de dados é o mesmo, o que muda é a forma de processar o arquivo dump, liberado pela WMF, dessa vez as edições do tipo IP contam.

  • Extração dos dados do arquivo dump (Jonas): concluída
  • Processamento dos dados, criando lista de artigos e seus criadores (IP ou registrados) (Jonas): concluído

Referências

editar

Interessados em ajudar

editar