|
TEI-CMC version of Wikipedia discussions associated with the article "Histoire de la
logique"
|
Open Resources and TOols for LANGuage
|
This page: http://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-histologique_discu-tei-v1
Back to corpus main page: http://hdl.handle.net/11403/comere/cmr-wikiconflits
Download the TEI file: http://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-histologique_discu-tei-v1.xml
How to cite this resource
Poudat,C., Grabar , N., Jin, K. & Paloque-Berges, C. (2015). TEI-CMC version of
Wikipedia discussions associated to the article "Histoire de la logique". In Corpus
Wikiconflits "Conflits dans le Wikipédia francophone" (cmr-wikiconflits), CoMeRe corpora
repository. Ortolang.fr : Nancy. [ cmr-wikiconflits-histologique_discu-tei-v1 ;
http://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-histologique_discu-tei-v1
]
Overview of the corpus
This file contains discussions associated with the wikipedia
article "Histoire
de la logique" (cmr-wikiconflits-histologique-tei-v1) from 2006 to 2010, transformed into TEI-CMC format.
Discussions have been reorganized out of the main discussion page and all archives of
discussion pages. It represents a subpart of the corpus Wikiconflits "Conflits
dans le Wikipédia francophone" (cmr-wikiconflits).Keywords : Computer Mediated Communication; CMC; Wikipedia; discussion;
References
Poudat, C;, Jin, K., & Chanier, T. (2014). Wikiconflits, un corpus extrait de
Wikipédia : principe et méthode d'élaboration. In Poudat,C., Grabar , N., Jin, K. &
Paloque-Berges, C. (2015). Corpus Wikiconflits, conflits dans le Wikipédia francophone".
Banque de corpus CoMeRe. Ortolang.fr : Nancy. [cmr-wikiconflits-tei-v4.1-manuel.pdf ;
http://hdl.handle.net/11403/comere/cmr-wikiconflits]
Composition
- http://hdl.handle.net/11403/comere/cmr-wikiconflits/Histoire_de_la_logique.xml: Article associated with the current discussions. As-is from Wikipedia.It has not transformed into TEI format
- http://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-histologique_discu-tei-v1.xml: This file in TEI-CMC format.
- http://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-contributors-tei-v1.xml: TEI file which lists the 3971 contributors and gives them an ID, which is used
here
- http://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-histologique_histo-html.zip: History of dicussions and article related to the topic "Histoire de la Logique" in
the HTML Wikipedia format
- http://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-tei-v4.1-manuel.pdf: Manual, written in French, which explains what part of Wikipedia.fr has been
selected and what automatic processing has been done on Dumps.
Download the corpus corresponding to this topic:
http://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-histologique_discu-tei-v1.zip (5,2 Mo)
Coverage: 6 participants ; 46 contributions ; 3358 tokens (this file only)
Rationale for this corpus
The corpus Wikiconflits "Conflits dans le Wikipédia francophone"
(cmr-wikiconflits) gathers conflictual discussions around a set of
(pseudo-)scientific topics: "Quotient Intellectuel","Igor et Grichka Bogdanoff",
"Organismes génétiquement modifiés", "Chiropratique", "Histoire de la Logique",
"Eolienne", "Psychanalyse" (see cmr-wikiconflits-tei-v4.1-manuel.pdf for
selection criteria). For each topic, versions of the article have been transformed into
TEI, talk / discussions pages have been reorganized , alongside pages related to conflicts
and neutral points of view, all formatted into TEI-CMC. History pages have also been
extracted as-is in HTML Wikipedia formats, as well as pages and talk pages of the more
important contributors (left in wikicode format).
This corpus has been created by the CoMeRe project, which aims to gather
different corpora that represent the forms of communication in French on different
networks (Internet, phone, etc.), all structured and informed in the same way, diffused in
open access formats for research purposes. The CoMeRe projet has received the support of
ORTOLANG (the French equivalent of DARIAH) and of the national consortium Written-Corpus
('Corpus-écrits') , subsection of
Huma-Num.
Editorial procedures
The body is divided into divisions (div), one per subject. Every
division is segmented into contribution (post), one per author (see
tagsDecl for details).
Contributors to discussions may not respect the recommended (by Wikipedia) ways of
reacting / posting an answer / a question: ident not present with insertions appearing
in the previous contribution as if everything had been written by one person ; no
signature, etc. Therefore after the automatic decompositon into seperate conrtibutions
(post), some manual checks and corrections have been made: when adding
missing information in attributes of the post(date, contributors id), or when
segementing a contribution into several parts, because they were from different authors,
or when relating different post together because they orignally were part of
the same contribution (i.e. before another contributor wrote inside it without taking
respecting the wikipedia format). In the latter case, a join may have been
added in order to establish these links. It should be noted that correctors when
reestablishing the discussion thread, avoided changing the original contents of the text
(words/ tokens ; they did not introduce signatures, for example). Information about
these problems and the manual correction is explained in .
Correctors (i.e. authors of this corpus) may have left some XML comments between 2
post in order to explain what they did.
Every subject of discussion has been assembled here. For this purpose, we have searched
in the main discussions page, and its related archives. All redundant information
between the main discussion page and its archives have been suppressed. All missing
information (missing in the main page but present in the archives) has been included
here. Then each contribution has been segmented into one message (post).
Description of the Interaction Space
CMC Environment
Structure of interactions
- div: one division per discussion subject
- head: title of the discussion subject
- post: one post corresponds to one contribution from one author
- xml:idID of the post
-
when-isodate of post, ISO 8601 format
-
whoid of the author of the post with a prefix ":psn" (see
listPrefixDef) . In order to find ist of partcipants, IDs, aliases see
particDesc.
-
nlevel of indentation (may not be accurate, is not sufficient to
distinguish what part of text is an answer to another contribution). When n=0, the
contribution opens a new discussion subject
- ref ID of the post to which the current post answers
- p: A post may contain one or more paragraphs
- signed: Signature of a post (may not exist)
Data Collection
Data collected : From 2006-03-27 to 2010-09-18
location:
French Wikipedia website
Discussion page associated to an article
France
Language of the data:
français
Types of interaction
- channel: mode: w,
Discussion written in Wikipedia
- constitution: type: single,
Selection among Wikipedia articles of (pseudo-)scientific topics where
conflictual discussions happened. See projectDesc for more
information
- derivation: type: original,
- domain: type: public,
- factuality: type: fact,
- interaction: type: complete,
active: plural,
passive: world,
- preparedness: type: formulaic,
- purpose: type: express,
degree: high,
Participants
For the list of participants / contributors see listPrefixDef and
notesStmt
Extracts of Interactions
Phrase cryptique
-
POST:
xml:id:
cmr-wiki-c021-a1
|
when-iso:
2006-03-27T09:44
|
who:
psn:cmr-wikiconflits-p45672
|
n:
0
|
p: Que veut dire la phrase «On n'aurait pas encore falsifié de théorème
majeur avec ces méthodes» à propos des logiques non-standards?
Signature: Pierre de
Lyon 27 mars 2006 à 09:44 (CEST)
-
POST:
xml:id:
cmr-wiki-c021-a2
|
when-iso:
2006-03-27T11:56
|
who:
psn:cmr-wikiconflits-p53231
|
n:
1
|
ref:
#cmr-wiki-c021-a1
|
p: Rien, c'est une faute de frappe, «On n'aurait pas encore démontré de
théorème majeur avec ces méthodes» est la phrase voulue. Merci de la
remarque.
Signature: Jean-Luc
W 27 mars 2006 à 11:56 (CEST)
-
POST:
xml:id:
cmr-wiki-c021-a3
|
when-iso:
2006-03-27T19:26
|
who:
psn:cmr-wikiconflits-p45672
|
n:
2
|
ref:
#cmr-wiki-c021-a2
|
p: Je suis désolé, mais je ne comprends pas plus. Je vois pas ce que vient faire ce
conditionnel. Est-ce que cela se veut être une affirmation du genre «A ce jour, aucun
théorème majeur n'a été démontré en utilisant seulement les techniques de démonstration
de l'analyse non-standard»? NB: j'ai réécrit les phrases qui précédaient.
Signature: Pierre de
Lyon 27 mars 2006 à 19:26 (CEST)
-
POST:
xml:id:
cmr-wiki-c021-a4
|
when-iso:
2006-03-28T11:40
|
who:
psn:cmr-wikiconflits-p53231
|
n:
3
|
ref:
#cmr-wiki-c021-a3
|
p: C'est clairement mieux, mais je ne me sentais pas d'être aussi affimatif vu que je n'ai
pas regardé ce genre de chose depuis dix ans. Si ta formulation est justifiée par de
bonnes sources, elle est clairement meilleure.
Signature: Jean-Luc
W 28 mars 2006 à 11:40 (CEST)
-
POST:
xml:id:
cmr-wiki-c021-a5
|
when-iso:
2006-03-29T13:20
|
who:
psn:cmr-wikiconflits-p45672
|
n:
4
|
ref:
#cmr-wiki-c021-a4
|
p: Hélas, je suis incompétent sur le sujet de l'analyse non standard.
Signature: Pierre de
Lyon 29 mars 2006 à 13:20 (CEST)
-
POST:
xml:id:
cmr-wiki-c021-a6
|
when-iso:
2006-03-29T13:33
|
who:
psn:cmr-wikiconflits-p53231
|
n:
5
|
ref:
#cmr-wiki-c021-a5
|
p: Je vais faire un peu de recherche, ce conditionnel est bien génant, et personne n'y
comprendra rien en l'état.
Signature: Jean-Luc
W 29 mars 2006 à 13:33 (CEST)
Maladie infectieuse
-
POST:
xml:id:
cmr-wiki-c021-a11
|
when-iso:
2007-11-03T18:43
|
who:
psn:cmr-wikiconflits-p271725
|
n:
0
|
p: On ne nous dit pas quelle est la maladie infectieuse à laquelle Hilbert aurait mis
fin. J'ai plutôt l'impression qu'on a confondu Hilbert et Poincaré - Poincaré avait
qualifié la théorie des ensembles de "maladie" (le pauvre, s'il revenait....) Mais je
laisse, au cas où on voudrait bien mettre une source. -
Signature: Michel421 3 novembre 2007 à 18:43 (CET)
-
POST:
xml:id:
cmr-wiki-c021-a12
|
when-iso:
2007-11-10T00:22
|
who:
psn:cmr-wikiconflits-p92456
|
n:
1
|
ref:
#cmr-wiki-c021-a11
|
p: Je ne tiens pas du tout (cf. ci-dessous) à défendre l'article, mais je serais curieux
de savoir si l'on peut donner une référence de ce propos de Poincaré. Je l'ai déjà vu
cité, mais jamais référencé. Les écrits de Poincaré que j'ai lu sur le sujet sont
nettement plus mesurés. Bref ça m'intéresserait de savoir d'où ça vient (même si c'est
indirect). Par ailleurs Hilbert a pu dire quelque chose de ce genre (j'essayerai de
vérifier), mais dans les années 1920, dans un article où il présente son programme.
Signature: Proz 10
novembre 2007 à 00:22 (CET)
-
POST:
xml:id:
cmr-wiki-c021-a13
|
when-iso:
2007-11-11T00:44
|
who:
psn:cmr-wikiconflits-p271725
|
n:
2
|
ref:
#cmr-wiki-c021-a12
|
p: Ca viendrait du mathématicien anglais Ian Stewart "Poincaré disait que les
générations futures considéreront ces théories comme une maladie" ; je viens de voir
ça cité par un blog
mais j'avais lu auparavant une phrase similaire. J'essayerai de retrouver où.
Signature: Michel421 11 novembre 2007 à 00:44 (CET)
-
POST:
xml:id:
cmr-wiki-c021-a14
|
when-iso:
2007-11-12T01:08
|
who:
psn:cmr-wikiconflits-p92456
|
n:
3
|
ref:
#cmr-wiki-c021-a13
|
p: Je tombe là-dessus en cherchant tout autre chose dans l'encyclopédie anglaise : http://en.wikipedia.org/wiki/Talk:Axiomatic_set_theory#why_i_deleted_.22set_theory_is_a_disease_from_which_mathematics_will_one_day_recover.22
Ca semble possible (Dans ses écrits Poincaré est assez critique sur ce qu'il appelle
le "Cantorisme", mais s'est intéressé de près aux travaux de Cantor et ne dit pas
qu'il faut tout jeter).
Signature: Proz 12
novembre 2007 à 01:08 (CET)
Credits, Publication Statement and Rights
Publisher(s)
Date: 2015-03-15
Identifier(s)
uri: cmr-wiki-c021
url: http://hdl.handle.net/11403/comere/cmr-wikiconflits/cmr-wikiconflits-histologique_discu-tei-v1
Licence
http://creativecommons.org/licenses/by-sa/3.0/
Following Wikipedia.fr recommendation this corpus (and all its related contents) can be freely distributed and shared
subject only to attribution, and share alike. How to reference / cite this contents is
given in the titleSmt
Credits
-
Sponsor(s): Consortium Corpus-écrits. La création de l’Infrastructure de Recherche CORPUS (Coopération des
Opérateurs de Recherche Pour un Usage des Sources numériques) a ouvert la possibilité
de constituer un consortium linguistique spécialement dédié aux Corpus écrits. Ce
consortium est géré par l'Institut de Linguistique Françaiseet fait
partie de la TGIR (Très Grande Infrastructure de Recherche)
Huma-Num (
FRANCE)
http://corpusecrits.huma-num.fr/
-
Sponsor(s): Laboratoire de recherche sur le langage
http://lrl.univ-bpclermont.fr
-
Author(s): Céline, Poudat ; Natalia, Grabar ; Kun, Jin ; Camille, Paloque-Berges ;
- editor:
Céline, Poudat ; Thierry, Chanier ;
- depositor:
Thierry, Chanier ;
- developer:
Paul, Lotin ;