|
TEI-CMC version of Wikipedia discussions associated with the article "Organisme
génétiquement modifié (OGM)"
|
Open Resources and TOols for LANGuage
|
This page: http://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-ogm_discu-tei-v1
Back to corpus main page: http://hdl.handle.net/11403/comere/cmr-wikiconflits
Download the TEI file: http://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-ogm_discu-tei-v1.xml
How to cite this resource
Poudat,C., Grabar , N., Jin, K. & Paloque-Berges, C. (2015). TEI-CMC version of
Wikipedia discussions associated to the article "Organisme génétiquement modifié (OGM)".
In Corpus Wikiconflits "Conflits dans le Wikipédia francophone" (cmr-wikiconflits),
CoMeRe corpora repository. Ortolang.fr : Nancy. [ cmr-wikiconflits-ogm_discu-tei-v1 ;
http://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-ogm_discu-tei-v1
]
Overview of the corpus
This file contains discussions associated with the wikipedia
article "Organisme génétiquement modifié (OGM)" (Genetically modified organism - GMO-
cmr-wikiconflits-ogm_p1-tei-v1) from 2006 to 2014, transformed into
TEI-CMC format. This sub-corpus also includes article and discussions related to "Débat
sur les organismes génétiquement modifiés" (Genetically modified food controversies).
Discussions have been reorganized out of the main discussion page and all archives of
discussion pages. This set represents a subpart of the corpus Wikiconflits
"Conflits dans le Wikipédia francophone"
(cmr-wikiconflits).Keywords : Computer Mediated Communication; CMC; Wikipedia; discussion;
References
Poudat, C., Jin, K., & Chanier, T. (2014). Wikiconflits, un corpus extrait de
Wikipédia : principe et méthode d'élaboration. In Poudat,C., Grabar , N., Jin, K. &
Paloque-Berges, C. (2015). Corpus Wikiconflits, conflits dans le Wikipédia francophone".
Banque de corpus CoMeRe. Ortolang.fr : Nancy. [cmr-wikiconflits-tei-v4.1-manuel.pdf ;
http://hdl.handle.net/11403/comere/cmr-wikiconflits]
Composition
- http://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-ogm_p1-tei-v1.xml: Part 1 article "Organisme génétiquement modifié (OGM)" associated with the current
discussions. TEI format
- http://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-ogm_p2-tei-v1.xml: Part 2 article "Organisme génétiquement modifié (OGM)" associated with the
current discussions. TEI format
- http://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-ogm_p3-tei-v1.xml: Part 3 article "Organisme génétiquement modifié (OGM)" associated with the
current discussions. TEI format
- http://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-ogm_p4-tei-v1.xml: Part 4 article "Organisme génétiquement modifié (OGM)" associated with the
current discussions. TEI format
- http://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-ogm_p5-tei-v1.xml: Part 5 article "Organisme génétiquement modifié (OGM)" associated with the
current discussions. TEI format
- http://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-ogm_discu-tei-v1.xml: This file. Discussion associated to the article / page "Organisme génétiquement
modifié (OGM)" in TEI-CMC format.
- http://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-ogm_discu_neut-tei-v1.xml: Discussion about neutrality associated to the article / page "Organisme
génétiquement modifié (OGM)" in TEI-CMC format.
- http://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-debat_ogm-tei-v1.xml: Article "Débat sur les organismes génétiquement modifiés" associated with a discussion. TEI format
- http://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-debat_ogm-tei-v1.xml: Discussion associated to the article / page "Débat sur les organismes génétiquement modifiés". TEI-CMC format
- http://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-ogm_histo-html.zip: History of dicussions and articles related to the topic "Organisme génétiquement
modifié (OGM)" (including the debate / controversies) in the HTML Wikipedia
format
- http://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-contributors-tei-v1.xml: TEI file which lists the 3971 contributors and gives them an ID, which is used
here
- http://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-tei-v4.1-manuel.pdf: Manual, written in French, which explains what part of Wikipedia.fr has been
selected and what automatic processing has been done on Dumps.
Download the corpus corresponding to this topic:
http://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-ogm_discu-tei-v1.zip (141 Mo)
Coverage: 137 participants ; 3 077 contributions ; 305 141 tokens (only for this file)
Rationale for this corpus
The corpus Wikiconflits "Conflits dans le Wikipédia francophone"
cmr-wikiconflits) gathers conflictual discussions around a set of
(pseudo-)scientific topics: "Quotient Intellectuel","Igor et Grichka Bogdanoff",
"Organismes génétiquement modifiés", "Chiropratique", "Histoire de la Logique",
"Éolienne", "Psychanalyse" (see cmr-wikiconflits-tei-v4.1-manuel.pdf for
selection criteria). For each topic, versions of the article have been transformed into
TEI, talk / discussions pages have been reorganized , alongside pages related to conflicts
and neutral points of view, all formatted into TEI-CMC. History pages have also been
extracted as-is in HTML Wikipedia formats, as well as pages and talk pages of the more
important contributors (left in wikicode format).
This corpus has been created by the CoMeRe project, which aims to gather
different corpora that represent the forms of communication in French on different
networks (Internet, phone, etc.), all structured and informed in the same way, diffused in
open access formats for research purposes. The CoMeRe projet has received the support of
ORTOLANG (the French equivalent of DARIAH) and of the national consortium Written-Corpus
('Corpus-écrits') , subsection of
Huma-Num.
Editorial procedures
The body is divided into divisions (div), one per subject. Every
division is segmented into contribution (post), one per author (see
tagsDecl for details).
Contributors to discussions may not respect the recommended (by Wikipedia) ways of
reacting / posting an answer / a question: ident not present with insertions appearing
in the previous contribution as if everything had been written by one person ; no
signature, etc. Therefore after the automatic decompositon into seperate conrtibutions
(post), some manual checks and corrections have been made: when adding
missing information in attributes of the post(date, contributors id), or when
segementing a contribution into several parts, because they were from different authors,
or when relating different post together because they orignally were part of
the same contribution (i.e. before another contributor wrote inside it without taking
respecting the wikipedia format). In the latter case, a join may have been
added in order to establish these links. It should be noted that correctors when
reestablishing the discussion thread, avoided changing the original contents of the text
(words/ tokens ; they did not introduce signatures, for example). Information about
these problems and the manual correction is explained in .
Correctors (i.e. authors of this corpus) may have left some XML comments between 2
post in order to explain what they did.
Every subject of discussion has been assembled here. For this purpose, we have searched
in the main discussions page, and its related archives. All redundant information
between the main discussion page and its archives have been suppressed. All missing
information (missing in the main page but present in the archives) has been included
here. Then each contribution has been segmented into one message (post).
Description of the Interaction Space
CMC Environment
Structure of interactions
- div: one division per discussion subject. When there is a top-level division
with subtype equal to "ill-formed-discussion", it means that: 1) the original discussion
was ill-formed (mainly because participants did not respect Wikipedia discussion
guidelines) ; 2) the automatic processing cannot correct an ill-formed discussion ; 3) a
manual check should be done, but has not yet been done.
- head: title of the discussion subject
- post: one post corresponds to one contribution from one author
- xml:idID of the post
-
when-isodate of post, ISO 8601 format
-
whoid of the author of the post with a prefix ":psn" (see
listPrefixDef) . In order to find ist of partcipants, IDs, aliases see
particDesc.
-
nlevel of indentation (may not be accurate, is not sufficient to
distinguish what part of text is an answer to another contribution). When n=0, the
contribution opens a new discussion subject
- ref ID of the post to which the current post answers
- p: A post may contain one or more paragraphs
- signed: Signature of a post (may not exist)
Data Collection
Data collected : From 2006-01-24 to 2014-02-01
location:
French Wikipedia website
Discussion page associated to an article
France
Language of the data:
français
Types of interaction
- channel: mode: w,
Discussion written in Wikipedia
- constitution: type: single,
Selection among Wikipedia articles of (pseudo-)scientific topics where
conflictual discussions happened. See projectDesc for more
information
- derivation: type: original,
- domain: type: public,
- factuality: type: fact,
- interaction: type: complete,
active: plural,
passive: world,
- preparedness: type: formulaic,
- purpose: type: express,
degree: high,
Participants
For the list of participants / contributors see listPrefixDef and
notesStmt
Extracts of Interactions
montrer ? démontrer ? affirmer ?
-
POST:
xml:id:
cmr-wiki-c010-a239
|
when-iso:
2008-01-14T20:21
|
who:
psn:cmr-wikiconflits-p150465
|
n:
0
|
p: je reviens sur ce point de vocabulaire qui ne me semble pas être de détail .
p: Il s'agit dans la phrase : "Par ailleurs, l'ONU a également montré que les OGM qui
ont été commercialisés dans le monde n'ont aucune nocivité[8]-> renvoie à un
document de l'OMS qui tente en 20 points de rassurer le lecteur quand à l'utilisation
des ogm.
p: J'ai précédement exprimé des doutes quand à l'utilisation à bon escient du terme
"montré". Effectivement, ni l'ONU, ni l'OMS ne "montre" quoi que ce soit puisqu'en
aucun cas ces instances ne procèdent à des tests. Un terme plus approprié me semble :
"cautionner" -> déf. CNRTL : Garantir, assurer, soutenir de son crédit et de son
autorité. Cautionner un gouvernement, une politique. Il me semble que c'est
précisemment ce que l'ONU et l'OMS font. Il suffit de changer le mot dans la phrase
.
p: Je propose que le prochaîn qui soit d'accord avec cette proposition procède au
changement, à moins qu'il y est entre temps quelqu'un qui s'y oppose.Flop (d) 14 janvier 2008 à
20:21 (CET)
-
POST:
xml:id:
cmr-wiki-c010-a240
|
when-iso:
2008-01-14T20:32
|
who:
psn:cmr-wikiconflits-p144425
|
n:
1
|
ref:
#cmr-wiki-c010-a239
|
p: "Cautionner" a en effet cette signification, mais également une connotation négative.
Ce mot est en effet souvent utilisé de manière péjorative dans les discours
politiques. "Affirmer" me semblerait plus neutre. --Christophe Dioux
(d) 14
janvier 2008 à 20:32 (CET)
-
POST:
xml:id:
cmr-wiki-c010-a241
|
when-iso:
2008-01-15T00:46
|
who:
psn:cmr-wikiconflits-p150465
|
n:
2
|
ref:
#cmr-wiki-c010-a240
|
p: "affirmer", est le plus neutre et me conviendrait mais ne semble pas convenir à MACROECO[oui ?]. Néanmoins , "montrer" ne convient pas, car il est
faux.
p: …attendons peut-être de nouvelles propositions…Flop (d) 15 janvier 2008 à
00:46 (CET)
-
POST:
xml:id:
cmr-wiki-c010-a242
|
when-iso:
2008-01-15T00:57
|
who:
psn:cmr-wikiconflits-p9039
|
n:
3
|
ref:
#cmr-wiki-c010-a241
|
p: affirmer : "soutenir que quelque chose est vrai". Là, l'ONU
fait plus que cela, elle montre [que les OGM sont...] est vrai en se basant sur les
études scientifiques réalisées. –
Signature: MACROECO
[oui ?] 15 janvier 2008 à 00:57 (CET)
-
POST:
xml:id:
cmr-wiki-c010-a243
|
when-iso:
2008-01-15T22:59
|
who:
psn:cmr-wikiconflits-p144425
|
n:
4
|
ref:
#cmr-wiki-c010-a242
|
p: En disant que "l'ONU montre que", Wikipédia prend partie sur la validité du
raisonnement de l'ONU. J'ai une grande confiance dans l'ONU, mais Wikipédia n'a pas à
prendre position sur la validité de ses raisonnements. Cela dit, la nouvelle
formulation (citation) règle encore plus élégamment le problème.--Christophe Dioux
(d) 15
janvier 2008 à 22:59 (CET)
C'est reparti pour une page de NPOV
-
POST:
xml:id:
cmr-wiki-c010-a246
|
when-iso:
2008-01-15T21:54
|
who:
psn:cmr-wikiconflits-p144425
|
n:
0
|
p: Désolé, mais je crois qu'il n'y avait plus d'autre solution, au point où en est
arrivé cet article, que de montrer clairement à nos lecteurs qu'il rencontre un
problème de NPOV, surtout en période de d'élections en France. Je propose de
poursuivre sur les moyens de résoudre le problème de neutralité sur la page ad hoc,
donc:
p:
Discuter:Organisme génétiquement modifié/Neutralité Si tout le monde y
met de la bonne volonté, je pense qu'on devrait pouvoir parvenir à un accord assez
vite. Cordialement. --Christophe
Dioux (d) 15
janvier 2008 à 21:54 (CET)
-
POST:
xml:id:
cmr-wiki-c010-a247
|
when-iso:
2008-01-15T23:09
|
who:
psn:cmr-wikiconflits-p144425
|
n:
1
|
ref:
#cmr-wiki-c010-a246
|
p: Je viens de faire quelques propositions de neutralisation qui me semblaient assez
évidentes, mais n'hésitez pas à révoquer dans le cas contraire. Il en reste
quelques-unes de moins évidentes, mais on a déjà vu des choses autrement plus
complexes. Il reste la question de la taille du paragraphe franco-centré que je trouve
non-neutre car induisant l'idée d'une opposition aux OGM plus largement partagée à
travers le monde qu'elle ne l'est en réalité (je m'en explique davantage dans la page
de NPOV).
p: A demain soir en ce qui me concerne. Très sincèrement.
p: --Christophe
Dioux (d) 15 janvier 2008 à 23:09 (CET)
-
POST:
xml:id:
cmr-wiki-c010-a248
|
when-iso:
2008-01-15T23:23
|
who:
psn:cmr-wikiconflits-p144425
|
n:
2
|
ref:
#cmr-wiki-c010-a247
|
p: Vues les dernières formulations trouvées par Macroeco. Elles me conviennent
parfaitement. Ne reste plus qu'à résoudre cette question du chapitre franco-centré qui
continue à déséquilibrer la neutralité globale de l'article, de mon point de vue, pour
les raisons mentionnées plus haut. En plus de ça, en période électorale en France, ce
chapitre est un véritable appeau à tribuns, amha. Donc, si on laisse le contenu
détaillé ici, on est assurés qu'il redeviendra source de conflit de neutralité en
moins d'une semaine, j'en ai bien peur.--Christophe Dioux
(d) 15
janvier 2008 à 23:23 (CET)
-
POST:
xml:id:
cmr-wiki-c010-a249
|
when-iso:
2008-01-15T23:29
|
who:
psn:cmr-wikiconflits-p9039
|
n:
3
|
ref:
#cmr-wiki-c010-a248
|
p: Il n'y a qu'à le faire passer en AdQ, puis ensuite le verrouiller –
Signature: MACROECO
[oui ?] 15 janvier 2008 à 23:29 (CET)
-
POST:
xml:id:
cmr-wiki-c010-a250
|
when-iso:
2008-01-15T23:39
|
who:
psn:cmr-wikiconflits-p144425
|
n:
4
|
ref:
#cmr-wiki-c010-a249
|
p:
{{mdr}}
p: Bon, je vois que cet article a considérablement évolué en l'espace de la soirée. Je
viens de voir aussi le changement du titre du paragraphe qui posait problème. Ca me
semble bien mieux comme ça. Il y a aussi le changement de titre du paragraphe sur les
médias, qui est bien, maintenant.
p: Une question: Cette critique sur les médias est elle aussi principalement française?
Parce que, pour l'instant, le chapitre ne parle que de la France. Si elle l'est, il
faudrait peut-être en faire une partie d'un article détaillé Conflit
autour des OGM en France et en ce qui me concerne, la controverse de
neutralité serait résolue. Ne resterait plus qu'à attendre l'avis de {{u|Flop}} et à présenter mes excuses pour une procédure de
NPOV lancée peut-être un peu trop vite (mais d'un autre côté, {{u|Sand}} n'aime pas qu'on mette des {{m|non
neutre}} sans mettre de bandeau NPOV et bon... ya du pour et ya du
contre...)
p: Merci MacroEco pour ces réactions efficaces et rapides et à demain soir (ce coup-ci
je vais me coucher pour de bon!)
p: --Christophe
Dioux (d) 15 janvier 2008 à 23:39 (CET)
-
POST:
xml:id:
cmr-wiki-c010-a251
|
when-iso:
2008-01-16T10:27
|
who:
psn:cmr-wikiconflits-p150465
|
n:
5
|
ref:
#cmr-wiki-c010-a250
|
p: La procédure de NPOV , et la procédure de neutralisation n'ont pas du tout été
placées trop vite et les retouche de MacroEco, aussi rapides qu'elles soit, ne sont
pas toujours exemptes de malignité.(je n'insulte personne : la malin prend possession
des êtres le plus souvent à leur insu).
p: Je rappelle que cet article est classé d'importance maximum. Il y a tout les ans , au
moins 3 élèves de term.S par lycée français qui fait un exposé sur les ogm et donc le
1° réflexe de travail sera de consulter WP. Ces 3 étudiants vont se faire l'écho,
auprès de leur classe, de tous les points qui seront notés dans l'article. Ce sont
donc 35 x (le nombre de lycées français), ingénieurs potentiels qui vont établir des
connaissances futures à partir de la trame du récit qu'ils auront rencontré dés
l'abord. Cette perspective me suffit à envisager que l'on puisse désirer produire un
travail sérieux et le plus objectif possible. Il y a d'autres lieux d'influence …Flop (d) 16 janvier 2008 à
10:27 (CET)
Credits, Publication Statement and Rights
Publisher(s)
Date: 2015-03-20
Identifier(s)
uri: cmr-wiki-c010
url: http://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-ogm_discu-tei-v1
Licence
http://creativecommons.org/licenses/by-sa/3.0/
Following Wikipedia.fr recommendation this corpus (and all its related contents) can be freely distributed and shared
subject only to attribution, and share alike. How to reference / cite this contents is
given in the titleSmt
Credits
-
Sponsor(s): Consortium Corpus-écrits. La création de l’Infrastructure de Recherche CORPUS (Coopération des
Opérateurs de Recherche Pour un Usage des Sources numériques) a ouvert la possibilité
de constituer un consortium linguistique spécialement dédié aux Corpus écrits. Ce
consortium est géré par l'Institut de Linguistique Françaiseet fait
partie de la TGIR (Très Grande Infrastructure de Recherche)
Huma-Num (
FRANCE)
http://corpusecrits.huma-num.fr/
-
Sponsor(s): Laboratoire de recherche sur le langage
http://lrl.univ-bpclermont.fr
-
Author(s): Céline, Poudat ; Natalia, Grabar ; Kun, Jin ; Camille, Paloque-Berges ;
- editor:
Céline, Poudat ; Thierry, Chanier ;
- depositor:
Thierry, Chanier ;
- developer:
Paul, Lotin ;