Les articles encyclopédiques de projets tels que le Brockhaus ou l’Encyclopedia Britannica ne peuvent pas être cités dans les articles scientifiques, car les auteurs des articles ne sont connus que des éditeurs, mais pas du lecteur. Les anciens auteurs des articles de Brockhaus ont des qualifications scientifiques élevées, plus de 51% ont une habilitation, un autre tiers ont un doctorat et les autres ont un diplôme universitaire.
L’encyclopédie en ligne Wikipédia devrait être complètement différente et pourtant comparable. Environ sept pour cent des auteurs inscrits ont un doctorat et le statut de leur éducation n’est pas connu pour de nombreux auteurs. Bien que les auteurs puissent être attribués aux articles, seuls quelques-uns des auteurs s’inscrivent sous leur vrai nom. La grande majorité des auteurs inscrits écrivent sous la protection d’un pseudonyme. De plus, pour la moitié de toutes les modifications, seules les adresses IP (Internet Protocol) des ordinateurs qui ont apporté les modifications sont enregistrées. Qui est l’auteur reste complètement flou.
Dans ces conditions, il est difficilement possible de citer proprement et scientifiquement un article de Wikipédia, aussi minutieux soit-il. Bien qu’il soit possible d’établir des liens vers des versions dites fixes, dont le texte est aussi immuable qu’une version imprimée, le problème de l’absence d’attribution à un ou plusieurs auteurs demeure. Ce statu quo – les wikipédiens souhaitent être cités, la science ne peut pas citer car il manque des informations sur l’auteur – n’a guère changé depuis des années, ou comme on disait actuellement : « Tout le monde les utilise, personne ne les cite ».
Cependant, il y a trois conditions qui, si elles sont remplies, doivent conduire à ce qu’un article de Wikipédia puisse être cité scientifiquement correctement avec le nom de l’auteur. Ces conditions sont difficiles à atteindre, mais avec actuellement 1,7 million d’articles sur Wikipédia en langue allemande, certains devraient répondre à ces exigences. Attention, il ne s’agit pas ici de trouver un moyen de rendre scientifiquement citables tous les articles de Wikipédia – cela ne peut pas fonctionner du fait de la construction globale, qui repose sur une approche collaborative – mais, à l’inverse, de regarder dans quelles conditions les articles pourraient être cités et devraient également être cités car ils peuvent être clairement attribués à un ou plusieurs auteurs.
Les trois conditions sont les suivantes : clair : l’auteur principal doit être nommément connu, proportion quantitative : sa proportion du texte doit dépasser une certaine limite et exactitude qualitative : l’auteur doit être responsable pour l’exactitude de la version de l’article cité.
Désormais, la base de données Wikipedia offre toutes les possibilités pour vérifier le respect de ces conditions.
Car en plus des textes des articles, la base de données enregistre également toutes les modifications et tous les auteurs associés avec une précision de caractère dans l’historique des versions. Sur la base de ces métadonnées, il est possible de prouver exactement qui a écrit ou modifié quel caractère et quand. En moyenne, environ 50 versions sont disponibles par article. Parcourir ces données « à la main » prend énormément de temps, mais depuis quelques années, les programmeurs ont (encore) développé des outils avec lesquels l’historique des versions peut être évalué automatiquement. De cette manière, il est possible de déterminer rapidement et facilement l’importance de la part quantitative d’un auteur dans le texte de l’article. 6 Des valeurs moyennes ont été déterminées pour ces partages d’auteur : environ 2,6 utilisateurs écrivent plus de 5 % du texte d’un article. En moyenne, un auteur principal écrit environ 70 % du texte et un deuxième auteur contribue à 13 % supplémentaires. En moyenne, 83 % d’un article peuvent être clairement attribués à deux auteurs.
Bien sûr, il existe également de nombreux articles auxquels plus de 3 000 auteurs ont contribué et auxquels presque personne n’a contribué à plus de dix pour cent en raison de la forte densité d’éditeurs différents. 8 Avec ces articles, aucun auteur n’atteint la limite d’attribution claire et les articles ne sont donc pas citables.
Pour être citables et donc également des articles citables, les conditions ci-dessus doivent être remplies comme suit :
(1) L’auteur principal doit s’être inscrit sous son vrai nom. Cela concerne actuellement un peu plus de sept pour cent de tous les auteurs enregistrés. Il est seulement possible d’attribuer une personne réelle aux informations données dans l’article.
(2) La proportion quantitative doit au moins dépasser les valeurs moyennes, c’est-à-dire que le premier auteur principal doit avoir écrit au moins 70 % et le deuxième auteur principal au moins 13 % de l’article. Ou la part d’un seul auteur principal dans le texte doit être supérieure à ces 83 %. Plus un sujet est spécifique, plus il est probable que cette condition soit remplie. Plus c’est général, plus les auteurs se sentent obligés de contribuer quelque chose en collaboration.
(3) L’auteur principal doit garantir l’exactitude qualitative de la version de l’article. Il est chargé de s’assurer que, par exemple, un « non » inséré de manière incorrecte ne déforme pas complètement le sens, mais est à nouveau supprimé. C’est le plus souvent le cas pour les articles qui ont fait l’objet d’un processus d’examen par les pairs et qui ont reçu le statut « à lire » ou « excellent ». La version qui apparaît à la fin de cette revue est relativement certaine que l’auteur principal a activement observé tous les changements et que cette version de l’article est correcte.