|
TEI-CMC version of Wikipedia discussions associated with the article "Quotient
intellectuel"
|
Open Resources and TOols for LANGuage
|
This page: https://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-qi_discu-tei-v1
Back to corpus main page: https://hdl.handle.net/11403/comere/cmr-wikiconflits
Download the TEI file: https://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-qi_discu-tei-v1.xml
How to cite this resource
Poudat,C., Grabar , N., Jin, K. & Paloque-Berges, C. (2015). TEI-CMC version of
Wikipedia discussions associated to the article "Quotient intellectuel". In Corpus
Wikiconflits "Conflits dans le Wikipédia francophone" (cmr-wikiconflits), CoMeRe corpora
repository. Ortolang.fr : Nancy. [ cmr-wikiconflits-qi_discu-tei-v1 ;
https://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-qi_discu-tei-v1
]
Overview of the corpus
This file contains discussions associated with the wikipedia
article "Quotient intellectuel" (cmr-wikiconflits-qi-tei-v1) from 2004 to 2014, transformed into TEI-CMC format.
Discussions have been reorganized out of the main discussion page and all archives of
discussion pages. It represents a subpart of the corpus Wikiconflits "Conflits
dans le Wikipédia francophone" (cmr-wikiconflits).Keywords : Computer Mediated Communication; CMC; Wikipedia; discussion;
References
Poudat, C;, Jin, K., & Chanier, T. (2014). Wikiconflits, un corpus extrait de
Wikipédia : principe et méthode d'élaboration. In Poudat,C., Grabar , N., Jin, K. &
Paloque-Berges, C. (2015). Corpus Wikiconflits, conflits dans le Wikipédia francophone".
Banque de corpus CoMeRe. Ortolang.fr : Nancy. [cmr-wikiconflits-tei-v4.1-manuel.pdf ;
https://hdl.handle.net/11403/comere/cmr-wikiconflits]
Composition
- https://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-qi-tei-v1.xml: Article associated with the current discussions
- https://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-qi_discu-tei-v1.xml: This file in TEI-CMC format.
- https://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-contributors-tei-v1.xml: TEI file which lists the 3971 contributors and gives them an ID, which is used
here
- https://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-qi_histo-html.zip: History of dicussions and article related to the topic "Quotient Intellectuel" in
the HTML Wikipedia format
- https://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-tei-v4.1-manuel.pdf: Manual, written in French, which explains what part of Wikipedia.fr has been
selected and what automatic processing has been done on Dumps.
Download the corpus corresponding to this topic:
https://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-qi_discu-tei-v1.zip (24,5 Mo)
Coverage: 52 participants ; 170 contributions ; 20 059 tokens (this file only)
Rationale for this corpus
The corpus Wikiconflits "Conflits dans le Wikipédia francophone"
cmr-wikiconflits) gathers conflictual discussions around a set of
(pseudo-)scientific topics: "Quotient Intellectuel","Igor et Grichka Bogdanoff",
"Organismes génétiquement modifiés", "Chiropratique", "Histoire de la Logique",
"Eolienne", "Psychanalyse" (see cmr-wikiconflits-tei-v4.1-manuel.pdf for
selection criteria). For each topic, versions of the article have been transformed into
TEI, talk / discussions pages have been reorganized , alongside pages related to conflicts
and neutral points of view, all formatted into TEI-CMC. History pages have also been
extracted as-is in HTML Wikipedia formats, as well as pages and talk pages of the more
important contributors (left in wikicode format).
This corpus has been created by the CoMeRe project, which aims to gather
different corpora that represent the forms of communication in French on different
networks (Internet, phone, etc.), all structured and informed in the same way, diffused in
open access formats for research purposes. The CoMeRe projet has received the support of
ORTOLANG (the French equivalent of DARIAH) and of the national consortium Written-Corpus
('Corpus-écrits') , subsection of
Huma-Num.
Editorial procedures
The body is divided into divisions (div), one per subject. Every
division is segmented into contribution (post), one per author (see
tagsDecl for details).
Contributors to discussions may not respect the recommended (by Wikipedia) ways of
reacting / posting an answer / a question: ident not present with insertions appearing
in the previous contribution as if everything had been written by one person ; no
signature, etc. Therefore after the automatic decompositon into seperate conrtibutions
(post), some manual checks and corrections have been made: when adding
missing information in attributes of the post(date, contributors id), or when
segementing a contribution into several parts, because they were from different authors,
or when relating different post together because they orignally were part of
the same contribution (i.e. before another contributor wrote inside it without taking
respecting the wikipedia format). In the latter case, a join may have been
added in order to establish these links. It should be noted that correctors when
reestablishing the discussion thread, avoided changing the original contents of the text
(words/ tokens ; they did not introduce signatures, for example). Information about
these problems and the manual correction is explained in .
Correctors (i.e. authors of this corpus) may have left some XML comments between 2
post in order to explain what they did.
Every subject of discussion has been assembled here. For this purpose, we have searched
in the main discussions page, and its related archives. All redundant information
between the main discussion page and its archives have been suppressed. All missing
information (missing in the main page but present in the archives) has been included
here. Then each contribution has been segmented into one message (post).
Description of the Interaction Space
CMC Environment
Structure of interactions
- div: one division per discussion subject
- head: title of the discussion subject
- post: one post corresponds to one contribution from one author
- xml:idID of the post
-
when-isodate of post, ISO 8601 format
-
whoid of the author of the post with a prefix ":psn" (see
listPrefixDef) . In order to find ist of partcipants, IDs, aliases see
particDesc.
-
nlevel of indentation (may not be accurate, is not sufficient to
distinguish what part of text is an answer to another contribution). When n=0, the
contribution opens a new discussion subject
- ref ID of the post to which the current post answers
- p: A post may contain one or more paragraphs
- signed: Signature of a post (may not exist)
Data Collection
Data collected : From 2004-04-30 to 2013-09-08
location:
French Wikipedia website
Discussion page associated to an article
France
Language of the data:
français
Types of interaction
- channel: mode: w,
Discussion written in Wikipedia
- constitution: type: single,
Selection among Wikipedia articles of (pseudo-)scientific topics where
conflictual discussions happened. See projectDesc for more
information
- derivation: type: original,
- domain: type: public,
- factuality: type: fact,
- interaction: type: complete,
active: plural,
passive: world,
- preparedness: type: formulaic,
- purpose: type: express,
degree: high,
Participants
For the list of participants / contributors see listPrefixDef and
notesStmt
Extracts of Interactions
quotient intellectuel et intelligence
-
POST:
xml:id:
cmr-wiki-c001-a70
|
when-iso:
2009-01-09T16:32
|
who:
psn:cmr-wikiconflits-ip01673
|
n:
0
|
p: Je suis surpris que la référence ;
p: "l'enfant à l'intelligence troublée" par Bernard Gibello (Païdos - Le centurion) ne
soit pas donnée en référence bibliographique, d'autant plus que ce livre va être réédité
par Dunod en mai prochain.
p: Je peux participer activement à la réécriture de l'article, qui en effet est
déplorable, car rempl de présupposés idéologiques non discutés.
p: Comment fait-on ?
p: je n'ai pas compris
Signature: Professeur Bernard Gibello GibelloB@aol.com
-
POST:
xml:id:
cmr-wiki-c001-a71
|
when-iso:
2009-03-14T06:33
|
who:
psn:cmr-wikiconflits-ip00992
|
n:
1
|
ref:
#cmr-wiki-c001-a70
|
p: L'article était en effet très neutre il y a à peu près un ou deux ans, et apparemment
quelques contributeurs ont depuis cru utile d'ajouter des remarques "bien pensantes" ou
"politiquement correctes" sans se donner la peine de les sourcer. Le plus simple à faire
en pareil cas est de cliquer sur l'onglet "Modifier" et de faire ceci : :{{ref nec|ici, le passage qui n'est pas sourcé}}, ce qui écrira
dans l'article : {{ref nec|ici, le passage qui n'est pas
sourcé}}. Si personne ne peut en donner de référence valable (c'est à dire
autre chose qu'un blog personnel), le passage finira par disparaître jusqu'à ce que
quelqu'un puisse en donner la source.
Signature: 212.198.146.203 (d) 14 mars 2009
à 06:33 (CET)
Réaction d'un contributeur
-
POST:
xml:id:
cmr-wiki-c001-a76
|
when-iso:
2009-09-30T19:45
|
who:
psn:cmr-wikiconflits-p678119
|
n:
0
|
p: J'en ai marre mais MARRE qu'on se permette de supprimmer les informations centrales que
j'ajoute sur ce post, sous prétexte qu'ils ne corresponde pas à l'idéologie marxiste de
wikipédia !!! Quand je lis une femme qui écrit plus haut "je me suis permis d'efface un
article (en l'occurrence le mien) je suis partiale ? Oui complètement et j'assume,
complètement favorable à la cause humaine" Pour qui se prend-t-elle ??? C'est ça la
science ???
Signature: {{non signé|Dumoulinb}}, le 30 septembre 2009 à
19:45
-
POST:
xml:id:
cmr-wiki-c001-a77
|
when-iso:
2009-10-02T00:34
|
who:
psn:cmr-wikiconflits-p677628
|
n:
1
|
ref:
#cmr-wiki-c001-a76
|
p: Il y a certes un problème de respect mais il me semble bilatéral, je conçois votre
réaction pour des suppressions pures et simples surtout sur des motifs idéologiques mais
admettez tout de même que vous manquez tout autant de tolérance. il est demandé de
laisser vire tous les points de vue et de développer les sujets, surtout polémiques,
dans des articles séparés. Vos réactions violentes et vos commentaires souvent puérils
n'engagent pas à vous respecter. Essayez de suivre les règles et de respecter les
autres. La version anglaise de cet article est beaucoup plus équilibrée sur ce point et
nettement moins orientée que ce que vous cherchez à imposer. N'oubliez pas que Wikipédia
est une communauté d'individus, le vivre ensemble commence par le respect et au vu de
l'historique, je suppose que vous êtes l'anonyme qui a si souvent posté ce même contenu
n'importe comment depuis des mois. j'observe une amélioration, il ne vous reste plus
qu'à avoir une démarche scientifique et cela passera mieux. Peut-être n'avez-vous pas
fait d'études, ce qui peut générer une certaine frustration mais vous ne devez pas vous
en formaliser, ici tout le monde est à égalité, c'est la qualité de l'information et et
sa présentation qui compte. Nous avons un devoir d'informer ET de neutralité de point de
vue donc de laisser son contradicteur se loger contre notre propre opinion, dans le
respect et la rigueur.
p: --
Signature: Parthes (d) 2
octobre 2009 à 00:34 (CEST)
-
POST:
xml:id:
cmr-wiki-c001-a78
|
when-iso:
2009-10-02T18:50
|
who:
psn:cmr-wikiconflits-p678119
|
n:
0
|
p: Mais je vous emmerde espèce de grosse vache stalinienne. Je suis biologiste, allez donc
terminer vos primaires arriéré prétentieux que vous êtes.
-
POST:
xml:id:
cmr-wiki-c001-a79
|
when-iso:
2009-10-03T06:02
|
who:
psn:cmr-wikiconflits-p146348
|
n:
1
|
ref:
#cmr-wiki-c001-a78
|
p: "Biologiste" (et ça veut dire quoi, d'abord ?) ne rend pas spécialement compétent sur
le QI , ni sur la physique quantique. Y a même des cas historiques avérés d'incompétence
et de fraude. Pour le reste, la stupidité des arguments ci-dessous suffit à vous
disqualifier.--
Signature: Dfeldmann
(d)
3 octobre 2009 à 06:02 (CEST)
Credits, Publication Statement and Rights
Publisher(s)
Date: 2015-03-01
Identifier(s)
uri: cmr-wiki-c001
url: https://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-qi_discu-tei-v1
Licence
http://creativecommons.org/licenses/by-sa/3.0/
Following Wikipedia.fr recommendation this corpus (and all its related contents) can be freely distributed and shared
subject only to attribution, and share alike. How to reference / cite this contents is
given in the titleSmt
Credits
-
Sponsor(s): Consortium Corpus-écrits. La création de l’Infrastructure de Recherche
CORPUS (Coopération des Opérateurs de Recherche Pour un Usage des Sources numériques)
a ouvert la possibilité de constituer un consortium linguistique spécialement dédié
aux Corpus écrits. Ce consortium est géré par l'Institut de Linguistique
Françaiseet fait partie de la TGIR (Très Grande Infrastructure de
Recherche) Huma-Num (
FRANCE)
http://corpusecrits.huma-num.fr/
-
Sponsor(s): Laboratoire de recherche sur le langage
http://lrl.univ-bpclermont.fr
-
Author(s): Céline, Poudat ; Natalia, Grabar ; Kun, Jin ; Camille, Paloque-Berges ;
- editor:
Céline, Poudat ; Thierry, Chanier ;
- depositor:
Thierry, Chanier ;
- developer:
Paul, Lotin ;
- participant:
Ciara, Wigham ;