Communiquez cette page à vos correcteurs
(tuteurs, directeurs de mémoire, enseignants, ...), en particulier
sur votre environnement ENT/LMS : www.urkund.fr/correcteurfaq
Lire les réponses aux questions dans
la deuxième partie de cette page.
1- Pourquoi Urkund n'offre sa licence qu'aux institutions (unités
de formation, départements, établissements...) plutôt
qu'aux individualités (enseignant isolé, chercheur, étudiants,
doctorants...) ?
Pourquoi Urkund ne facture qu'en fonction du nombre d'auteurs (effectifs
étudiants ...) et non en fonction du nombre d'enseignants ou du
nombre de documents contrôlés ?
2- Puis-je transférer
le rapport et/ou l'analyse à un collègue, à
un auteur (étudiant, doctorant...) ?
3- En combien de temps Urkund traite
un document ? (extrait le texte, comparaisons, création de l'analyse)
4- Pourquoi Urkund propose rarement plus d'une vingtaine
de sources alors d'autres systèmes en proposent plusieurs
dizaines voir plusieurs centaines ?
5- Est-ce qu'Urkund analyse la totalité d'un document
déposé ? Même s'il comporte plus de 1000
pages ?
6- Mes déposants disposent-ils
de leur droit d'auteur ? Peuvent-ils rendre le contenu de leurs
documents confidentiel ?
7- Certains de mes déposants
ne sont pas francophones, peuvent-ils recevoir les communications
dans une autre langue que celle paramétrée pour mon
établissement ou pour mon propre compte Urkund ?
8- Je souhaite déposer de
nombreux documents à l'insu de mes auteurs (étudiants,
doctorants) ? Comment puis-je
déposer plusieurs dizaines de documents au cours d'une seule
dépose ?
9- J'ai changé d'adresse électronique
ou je souhaite utiliser une adresse distincte de celle renseignée
dans mon compte Urkund. Je souhaite continuer à recevoir les
rapports d'analyse. Que dois-je faire ?
10- Nous utilisons un compte générique
Urkund avec une adresse électronique générique
du type : aes-rh-M2.notreécole@analyse.urkund.com pour la collecte
et le contrôle des mémoires de nos étudiants AES RH
M2. Nous souhaiterions que tous les responsables de mémoires
puissent recevoir les rapports d'analyse par e-mail. Comment procéder ?
11- Que dois-je communiquer à mes déposants
pour qu'ils suivent correctement la procédure ?
12- Je ne souhaite plus recevoir de rapports d'analyse
par e-mail. Que dois-je faire ?
13- Je ne reçois pas ou plus les rapports d'analyse
par e-mail. Que dois-je faire ?
14- J'ai supprimé par mégarde des rapports
d'analyse reçu par e-mail. Que dois-je faire ?
15- Puis-je redéposer un document soumis préalablement
par un déposant (étudiants ...) ?
16- Y-a-t'il une taille limite pour
chaque document ?
17- Puis-je supprimer physiquement un
document déjà déposé ? Quel est l'objet
de la "corbeille" qui apparait dans mon compte web Urkund?
18- Quand je dépose des documents
depuis mon compte Urkund, une erreur apparait avant la fin du chargement ?
Pourquoi ? Que dois-je faire ?
19- Quels sont les formats de documents
acceptés par Urkund ?
20- Dans une analyse, une
surbrillance rose parcours tout le document. Pourquoi ? Est-il possible
de supprimer cette surbrillance ?
21- Les citations sont-elles
exclues automatiquement lors de l'analyse du document
?
22- Les annexes et bibliographies
sont-elles exclues automatiquement de l'analyse du document
?
23- Un simple document .txt a été
déposé et Urkund n'a pas su interpréter correctement
les caractères accentués. Pourtant Urkund dit pouvoir
gérer tous les types de caractères accentués pour
toutes les langues utilisant l'un des 3 alphabets suivants : latin, cyrillique
ou grec
Pourquoi ces disfonctionnements apparaissent-ils ? Y-a-t'il
une solution ?
24- Qu'est ce que les "metadata"
qui apparaissent parfois dans l'analyse de documents au format MS Office
2007 ?
25- Pourquoi une fois les metadata
nettoyées par l'équipe support d'Urkund, le nouvel l'indice
de similitude se trouve fortement réduit ?

1-
Simplement parce que nous considérons qu’Urkund doit venir en soutien
à un projet pédagogique, à une politique anti-plagiat se
focalisant sur les auteurs de travaux universitaires (étudiants,
doctorants...) plutôt que sur les correcteurs (enseignants...).
Cette politique est rarement le fait d’un individu isolé mais plutôt d’une
concertation au sein d’une unité de formation.
La finalité de cette politique anti-plagiat doit être d’encourager les
auteurs de travaux universitaires à produire des travaux originaux et
à développer leur capacité de recherche et d’écriture. La solution Urkund
s’adresse donc d’abord à une population d’auteurs de travaux universitaires
et non à une population d’enseignants.
Urkund fonctionne essentiellement grâce à son effet dissuasif
et préventif sur une population d’auteurs. Urkund ne facture donc pas
le nombre de documents contrôlés mais facture l’effet dissuasif et son
emprise sur une population d’auteurs donnée. Cette population peut être
restreinte à une seule formation spécifique de 40 étudiants,
à plusieurs formations (Bachelor et Master), à un département,
à une UFR, à un programme, à tout un établissement
(licence full campus).
Lire la première question de la FAQ déposants
traitant du même thème. Lire
ici.

2-
Transfert à un collègue :
Vous pouvez transférer le rapport d'analyse qu'Urkund vous aura
envoyé à vos collègues. Ils pourront accéder
à l'analyse et télécharger le document original depuis
ce rapport sans devoir connaitre les codes d'accès de votre compte
Urkund.
Vous pouvez transférer l'analyse directement à vos collègues
en cliquant sur l'option depuis l'analyse elle-même. L'analyse n'est
protégée par aucun code ou mot de passe. Elle sera donc
très facilement accessible pour vos collègues.
Transfert à l'auteur du document lui-même
:
Même si Urkund vous permet de transférer
facilement le rapport ou l'analyse à un auteur (étudiants,
doctorants), nous ne vous le recommandons pas pour des raisons pédagogiques
importantes. Ces raisons sont largement abordées dans un document
disponible dans la documentation
générale (cf. Une
politique anti-plagiat).
2 raisons essentielles :
1- Les analyses d’Urkund ne font que présenter des similarités et non
du plagiat avéré. C'est au corps enseignant/pédagogique que revient la
responsabilité de déterminer la présence de plagiat avéré.
La définition du plagiat est complexe et son degré de gravité menant éventuellement
à une série de sanctions graduées reste du domaine du correcteur (enseignant,
professeur ...) et de la pédagogie. La compréhension et l’interprétation
d’une analyse est rarement mécanique, si c'était le cas, Urkund
le ferait directement lui même (par exemple : le plagiat d’un descriptif
de société provenant de wikipedia ou du site même de la société n’est
pas comparable au plagiat d’une problématique ou d’une conclusion récupérée
sur un autre travail universitaire).
La valorisation de la qualité du travail académique et l'interprétation
des résultats d'Urkund incombent exclusivement au corps professoral qui
aura la maturité intellectuelle et les savoirs suffisants et non à l'étudiant
ou au doctorant. C'est ensuite à l'enseignant de revenir auprès de l'étudiant
concerné pour lui transmettre ses indications pédagogiques.
2- Sans accompagnement pédagogique, l'auteur (étudiant, doctorant)
aura une lecture et une interprétation uniquement mécanique de l’analyse.
Il se focalisera sur la technique de camouflage des passages identifiés
par Urkund. L’auteur recalibrera son document en fonction du fonctionnement
du système Urkund (un maquillage technique plutôt qu'une réflexion)
et non pas en fonction de la méthodologie enseignée. L’objet du système
anti-plagiat est totalement biaisé car il s’agit bien de forcer les auteurs
à suivre une méthodologie et non de lui apprendre à éviter les mailles
d’un système anti-plagiat.
L'enseignement universitaire doit rester dans son rôle d'amener
les auteurs à produire des travaux originaux et à développer
des capacités de recherche et d'écriture. C'est une tache
qui incombe au corps enseignant, Urkund le supporte dans cette tache mais
il nous semble important de souligner qu'Urkund ne peut pas et ne doit
pas se substituer aux enseignants.
En conclusion, le transfert de l'analyse d'Urkund à l'auteur
d'un travail universitaire est certainement une excellente manière
de simplifier la tache du correcteur en le déchargeant de ses "obligations"
pédagogiques.
Cependant nous considérons que c'est une erreur pédagogique
importante que de laisser l'auteur d'un document recalibrer son document
en fonction de la grille d'analyse d'Urkund. La valeur du travail académique
réalisé dans ces circonstances pourra être sujette
à discussion.
 
3-
URKUND traite un document et finalise l'analyse
de ce document en quelques minutes. Ce traitement dépasse rès
rarement plus de 10 minutes.
En revanche, il existe une file d'attente de documents à traiter
qui en règle générale ne dépasse pas 5 minutes
en début de journée et s'allonge au fil de la journée
pour atteindre de 30 minutes à une heure en début de soirée.
En période de pointe (mars, mai, novembre), cette file d'attente
peut dépasser plusieurs heures, très rarement plus d'une
dizaine d'heures.
URKUND garantit la remise de l'analyse en 24 heures.
 
4-
Dès sa création en 2000, Urkund
a pris le pari de la synthèse, de la pertinence et de l'automatisme
afin d'aider les correcteurs à rapidement approfondir chaque document
sans perdre de temps à supprimer manuellement des paragraphes ou
des sources sans intérêt.
Urkund n'est donc certainement pas un outil enclin à l'exhaustivité
mais plutôt qui recherche en permanence le gain de synthèse
et de pertinence en minimisant toujours l'intervention manuelle du correcteur.
Si vous recherchez de l'exhaustivité, de très bons moteurs
de recherche vous y aideront parfaitement.
Urkund ne perçoit pas d'intérêt pédagogique
à rechercher l'exhaustivité des sources. L'objet premier
d'Urkund est d'apporter la preuve qu'un travail universitaire n'a pas
été élaboré selon une méthodologie
duement enseignée (citations, annotations ...) ou n'a pas le seau
de l'authenticité intellectuelle, c'est à dire n'atteint
pas le niveau de production d'écriture minimum ou suffisant aux
yeux du correcteur.
Ce qui importe réellement, c'est de démontrer le manque
de rigueur dans le suivi d'une méthodologie enseignée ou
le manque de travail de recherche et de production d'écriture de
la part d'un auteur.
Même s'il ne sera jamais possible de déterminer avec certitude
les sources primaires réellement utilisées dans l'élaboration
d'un document, Urkund, avec sa pertinence et sa synthèse, essaye
de s'en rapprocher.
Nous ne pensons pas sérieusement qu'un des critères de qualité
d'un système anti-plagiat puisse être déterminé
par la quantité de sources proposées.
 
5-
Oui, Urkund analyse 100% du contenu d'un document
déposé. Le nombre de pages et de caractères n'est
pas limité. Urkund analyse chaque semaine plusieurs centaines de
thèses issues de nos établissements utilisateurs européens
comportant entre 900 000 et 1 000 000 de mots. Cela représente
pour chaque thèse entre 5 et 6 millions de caractères (hors
caractère espace), entre 60 000 et 80 000 lignes et entre 1200
et 1500 pages.
Le poids d'un document de ce type (avec peu d'images insérées)
représente 6 à 7 Mo. Urkund limite chaque document à
une taille de 30 Mo au delà duquel nous demandons au déposant
ou au correcteur de nous faire parvenir le document afin que nous le traitions
séparément.
Urkund peut traiter séparément des documents ayant un poids
maximum de 100 Mo. Pour tous documents ayant un poids supérieur,
il est demandé de scinder le document en 2 fichiers séparés.

6-
Oui, vos déposants sont responsables de
leur droit d'auteur. Lors de la dépose, un accusé
de réception leur notifie que les documents déposés
ont bien été pris en compte. Cet accusé de réception
comporte l'option leur permettant de rendre confidentiel le contenu de
leur document (opt-out). Une fois le contenu du document rendu confidentiel,
plus personne ne peut ni le visualiser ni le télécharger,
à l'exception de vous-même, leur correcteur.
Notez que les documents rendus confidentiels
restent physiquement sur les serveurs d'Urkund et continueront d'être
comparés aux nouvelles déposes. Rendre confidentiel un document
ne le soustrait aucunement aux futures comparaisons avec les nouveaux
documents déposés.
Si vous déposez vous-même les documents à l'insu de
vos auteurs, vous prenez la responsabilité et assumez l'exécution
de leur engagement, s'il existe, de rendre confidentiel le contenu de
leurs documents. Rappelez-vous que c'est une charge et une responsabilité
en plus. C'est une des raisons pour laquelle Urkund vous incite à
impliquer vos auteurs dans la dépose de leurs documents plutôt
que de déposer vous-même leurs documents à leur insu.

7-
Oui, vos déposants peuvent choisir la
langue dans laquelle ils recevront les communications Urkund (Accusés
de réception, erreur de dépose, confirmation de confidentialité
d'un contenu etc...) indépendamment de la langue paramétrée
par défaut sur votre compte ou sur le compte de votre établissement.
Pour se faire, vos déposants devront dans un premier temps déposer
un premier document et recevoir un premier accusé de réception.
Depuis cet accusé de réception un lien leur est proposé
pour renseigner leur nom et prénom ainsi que pour modifier la langue
dans laquelle ils souhaitent recevoir les futures communications.
Urkund se développe chaque jour et propose actuellement
(06/2009) 11 langues à vos étudiants (norvégien,
suédois, finlandais, danois, anglais, allemand, français,
portugais, espagnol, italien, russe).
 
8-
Si votre établissement possède une
licence excellence, nous vous incitons à déposer vos
documents depuis votre messagerie électronique. Vous pourrez déposer
un grand nombre de documents (plusieurs dizaines et même plusieurs
centaines) en une seul dépose (une seule soumission).
Seule la capacité de votre messagerie limitera le nombre de documents
à déposer. Gmail propose à titre indicatif un maximum
de 20 Mo au total par e-mail.
Vous recevrez un accusé de réception ainsi qu'un rapport
d'analyse pour chaque document déposé.
Pour vous éviter de recevoir un trop grand nombre de rapports
par e-mail, vous avez le loisir de "zipper" vos documents
en un seul et unique document ayant le format .zip. Vous recevrez alors
un unique rapport d'analyse consolidant tous les résultats des
documents déposés.
 
9-
Vous devez modifier les paramètres de votre
compte Urkund en visitant www.urkund.fr/login.
Entrez vos identifiants et sélectionnez "settings" puis
"edit". Modifiez l'adresse électronique renseignée
par la nouvelle adresse électronique de votre choix. Validez.
À partir de cette modification vous recevrez toute les communications
en tant que correcteur à l'adresse nouvellement renseignée.8-
Je souhaite déposer de nombreux documents
à l'insu de mes auteurs (étudiants, doctorants) ?
Comment puis-je déposer plusieurs dizaines de documents au
cours d'une seule dépose ?
 
10-
Urkund ne permet pour l'instant d'associer qu'une
seule adresse électronique à un compte Urkund.
Cependant pour diffuser plus largement les rapports d'analyse Urkund à
plusieurs correcteurs, vous devrez demander la création d'une
liste de distribution à votre CRI.
L'adresse pourra prendre la forme suivante : aes-rh-m2@votreécole.fr
ou memoire@votreécole.fr
Vous aurez informé votre CRI des adresses électroniques
de tous les correcteurs devant recevoir les rapports d'analyse de cette
formation.
Vous associerez cette adresse au compte générique Urkund
dédié aux étudiants d'AES RH M2. Tous les rapport
d'analyse seront envoyés à cette adresse électronique.
Cette adresse étant une liste de distribution, tous les correcteurs
inscrits par votre CRI sur cette liste recevront les rapports d'analyse
simultanément.
Avec un seul compte générique, tous les correcteurs (responsable
de mémoires, de stage, enseignants, vacataires, etc.) recevront
simultanément les rapports d'analyse
À titre exceptionnel, nous pouvons créer provisoirement
des listes de distributions. Cependant, comme vos adresses électroniques
de correcteurs changent d'une année universitaire à l'autre,
nous ne souhaitons pas remplacer le service de votre CRI et nous vous
demandons de vous adresser à leurs services.
 
11-
Téléchargez nos recommandations
(depuis la documentation
générale) ou directement en cliquant ici.
Communiquez-leur l'adresse de dépose Urkund. Elle peut se présenter
de 2 manières:
- soit générique liée à une formation, une
année (L2, M1...) : aes-rh-M2.ecole@analyse.urkund.com
- soit nominative et personnelle : prenom.nom.ecole@analyse.urkund.com
Communiquez-leur les modalités de dépose :
- la date et l'heure butoir
- rappelez-leur les sanctions encourues pour plagiat avéré,
tentative de se soustraire au contrôle, retard ou absence de soumission
- optionnellement, ajoutez l'obligation d'imprimer l'accusé de
réception et de l'agrafer à la copie papier. Cela vous permettra
de vous assurer plus facilement que vos auteurs aient bien soumis en temps
et en heure leurs documents sur Urkund.
- Vous pouvez leur remettre la procédure standard en ligne : www.urkund.fr/deposant.htm,
ou télécharger le document word depuis la documentation
générale afin dans modifier le contenu avant
de leur remettre.
- Pour répondre à leur question, vous pouvez les informez
de la FAQ disponible ici : www.urkund.fr/deposantfaq
 
12-
Vous devez modifier les paramètres de votre
compte Urkund en visitant www.urkund.fr/login.
Entrez vos identifiants et sélectionnez "settings" puis
"edit" . Inhibez la sélection "recevoir les rapports
par e-mail". Validez.
À partir de cette modification vous ne recevrez plus aucun rapport
d'analyse par e-mail.
13-
Vérifiez :
- que vos collègues reçoivent correctement les leurs. Si
ce n'est pas le cas, votre service informatique bloque certainement l'entrée
des messages électroniques en provenance de nos serveurs. Contactez-les
en leur demandant de laisser passer les e-mails en provenance des domaines
www.urkund.com et www.urkund.se
- si vous recevez vos analyses sur une messagerie de particulier du type
"orange.fr, free.fr etc...", vérifiez que votre anti-spam
n'élimine pas vos rapports.
- vérifiez que les paramètres de votre compte Urkund comportent
votre adresse électronique correctement orthographiée
- vérifiez que l'option "Rapport par e-mail" présente
dans les paramètres de votre compte Urkund soit correctement sélectionnée.
Nous rappelons que les licences enseignement LDE (Licence Découverte)
ne proposent pas l'option du push e-mail. Les utilisateurs de ces licences
doivent se connecter à leur compte web Urkund pour accéder
à leurs analyses et documents originaux.
Si vous n'arrivez pas à récupérer vos rapports d'analyse
envoyés par e-mail, vous pouvez toujours retrouver les analyses
et documents originaux en vous connectant à votre compte et en
cliquant
ici.
Si vous avez perdu vos codes d'accès, cliquez
ici. Vous devrez fournir votre adresse électronique
actuellement renseignée dans les paramètres de votre compte
Urkund. Si vous ne la connaissez pas, demandez à l'administrateur
Urkund de votre établissement.
 
14-
Urkund ne peut vous renvoyer à plusieurs
reprises vos rapports d'analyse. Cependant, vous pouvez toujours retrouver
les analyses et documents originaux en vous connectant à votre
compte et en cliquant
ici.
Si vous avez perdu vos codes d'accès, cliquez
ici. Vous devrez fournir votre adresse électronique
actuellement renseignée dans les paramètres de votre compte
Urkund. Si vous ne la connaissez pas, demandez à l'administrateur
Urkund de votre établissement.
 
15-
Non, car si vous déposez un document préalablement
déposé par un auteur, la nouvelle version du document que
vous déposerez sera comparée avec la version soumise antérieurement
par le déposant auteur. Urkund identifiera 100% de similarité
avec le document antérieur. Si vous souhaitez redéposer un
document, demandez à l'auteur de redéposer le document.
L'exclusion des versions antérieures sont automatiques et transparentes
si ce sont les auteurs qui déposent et redéposent eux-mêmes
leurs propres documents.
À partir de september 2009, les correcteurs auront la possibilité
d'exclure manuellement une source ou une section de texte. Il est
à noter que cette fonctionnalité sera une source de travail
supplémentaire pour l'enseignant alors que la fonction est automatique
dans le cas des déposes faites par les auteurs eux-mêmes.
 
16-
La taille de chacun des documents vos déposants
ne doit pas dépasser 30 Mo. Au delà de 30 Mo, vos déposants
doivent vous avertir et vous remettre le document personnellement. Vous
vous chargerez de nous informer et de nous remettre votre document éventuellement
par d'autres moyens que par messagerie électronique par exemple
au moyen d'un accès FTP. Nous le déposerons un serveur
particulier pour éviter d'affecter le bon déroulement
des autres analyses en cours. Aucun document dépassant 100 Mo
n'est accepté.
Conservez à l'esprit que votre
dépose est limitée par votre propre messagerie électronique.
Certaines vous limiteront à 30 Mo (gmail.com), d'autres à
5 Mo et parfois même à seulement 2 Mo.
Si vous avez plusieurs documents à
soumettre en un seul e-mail, pensez à vérifier les possibilités
de votre messagerie électronique.
Les établissements ayant une licence découverte ne peuvent
déposer de documents par e-mail. Les documents doivent être
déposés par les correcteurs eux-mêmes depuis le
compte Urkund de l'établissement.
Les déposes de documents faites directement sur un compte Urkund
(interface web) sont limitées à 2 Mo. Effectivement, après
100 secondes d'inactivité, tous les navigateurs internet provoquent
une erreur "time out" (temps dépassé).
 
17-
Non, il est impossible de supprimer physiquement
et manuellement un ou plusieurs documents déposés sur
Urkund.
La base de documents déposés est la garantie d'obtenir
toujours plus de pertinence lors du controle de nouveaux documents.
D'une certaine manière, cet archivage met fin aux échanges
de documents sur les forums ou à l'achat de documents sur les
sites de triches.
À titre indicatif, en 2008, Urkund a reçu quelques 450
000 documents, en 2009, Urkund devrait avoir reçu un peu plus
de 760 000 documents soit près de 70% d'accroissement. En 2010,
pour ces 10 ans d'anniversaire, Urkund prévoit de recevoir
plus d'1 million de documents.
Si votre établissement a un règlement
intérieur qui impose la suppression physique des documents
déposés, un avenant peut être ajouté aux
termes de la licence.
Urkund supprimera physiquement tous les documents
en provenance de votre établissement à une fréquence
à déterminer (mensuelle, trimestrielle, annuelle etc.).
Dans ce cas précis, tous les bénéfices liés
à la protection contre les plagiats ultérieurs des documents
déposés et la lutte contre les échanges et achats
de documents seront annulés. D'autre part, les documents étant
physiquement supprimés, la base donnée doit être
modifiée par notre équipe technique et toutes les analyses
en lien avec ces documents supprimés physiquement ne seront
plus accessibles.
Un certificat de suppression physique des documents signé par
un représentant d'Urkund vous sera remis.
Actuellement, en Europe continentale (France, Benelux, Allemagne,
Autriche, Péninsule ibérique), aucun établissement
n'a mis en oeuvre une telle procédure.
La "corbeille" qui apparait dans chaque compte
web Urkund ne permet pas de supprimer physiquement un document mais
uniquement de l'archiver au même titre que le répertoire
"archive".
 
18-
Effectivement, tous les navigateurs donnent une
erreur "time out" (temps dépassé) après
plus 100 secondes d'inactivité. Selon la vitesse de votre internet
vous pourrez charger des documents ayant une taille de 3.5 à 5
Mo. Dans tous les cas, après 100 secondes, si votre document
n'est pas entièrement chargé, une erreur apparaitra automatiquement.
Si votre établissement possède une licence excellence,
nous vous incitons à déposer vos documents depuis votre
messagerie électronique. Vous serez uniquement limité
par les capacités de votre messagerie. À titre indicatif,
le webmail gmail autorise 20 Mo de documents joints.
Si vous avez plusieurs documents à déposer, joignez-les
à votre message. Si vous souhaitez consolider vos rapports d'analyse
(pour éviter de recevoir trop de rapports par e-mail) vous pouvez
aussi zipper vos documents.
Rappelez-vous qu'effectuer les déposes par vous-même n'est
pas recommandé et qu'il est préférable d'impliquer
directement les auteurs des travaux universitaires.
 
19-
.doc, .docx, .odt, .sxw, .txt, .ppt, .pps, .xls,
.xlsx, .ods, .odf, .rtf, .pdf (généré par Adobe Acrobat),
.pdf (généré par LateX), .html, .htm, .sxd, .odp,
, ainsi qu'une vingtaine d'autres formats plus spécifiques.
De nombreux logiciels open source ou gratuits proposent la création
de document PDF. Cependant ces documents PDF ne suivent que rarement toutes
les spécifications d'Adobe auxquelles Urkund se réfère
pour extraire et convertir le contenu des documents déposés.
Pour éviter ces problèmes d'extraction et de conversion,
n'utilisez pas ces logiciels (Liste non exhaustive : PDF Creator, Quartz
PDFContext pour Mac OS, Ghostscript ...)
 
20-
La surbrillance qui apparait dans l'analyse est
uniquement indicative. Elle aide à mieux visualiser le texte mis
entre guillemets par l'auteur. Cette fonctionnalité prend en compte
les standards ISO des guillemets des différents pays européens.
Si l'auteur n'a pas correctement utilisé les guillemets selon le
standard ISO (anglais, allemand, français etc.) notamment pour
ouvrir, fermer ou imbriquer des guillemets dans d'autres guillemets, le
système ne peut interpréter correctement le sens de guillemets.
Il en résulte une surbrillance inadéquate.
Afin de ne pas gêner le correcteur dans sa lecture, il est possible
de désélectionner l'option de surbrillance dans le menu
déroulant des options. Une désélection de cette fonction
fait disparaitre la surbrillance.
 
21-
Non, les citations, c-à-d. le texte mis
entre guillemets, ne sont pas exclues lors de l'analyse. Cependant le
système vous permet de visualiser le texte mis entre guillemets
afin de mieux apprécier le travail d'écriture de l'auteur.
En premier lieu, il est difficile d'identifier de manière fiable
le texte entre guillemets du fait de l'existence de différents
standard ISO européens s'agissant de la syntaxe des guillemets
(cf. faq nº19 ci-dessus) mais aussi parce que ces standards ne sont
pas toujours respectés par les auteurs. D'autre part, un auteur
pourrait volontairement encadrer son travail de guillemets "blanche"
et donc transparente, pour soustraire, à l'insu de son correcteur,
une grande partie sinon la totalité de son travail au contrôle
d'Urkund.
 
22-
Non, les annexes et bibliographies ne sont pas
exclues automatiquement lors de l'analyse. Il existe quelques standards
notamment américains (MLA, APA, LSA etc. que vous pouvez découvrir
en visitant la page suivante http://www.library.american.edu/subject/citation.html)
trop peu utilisés en Europe par les auteurs pour qu'Urkund puisse
les identifier de manière fiable. Vous trouverez de nombreuses
informations sur comment insérer une bibliographie avec l'éditeur
Word 2007 dans ces différents standards (http://blogs.msdn.com/microsoft_office_word/archive/2007/12/14/bibliography-citations-1011.aspx)
Nous suggérons dans nos premières recommandations (cf. documentation
générale, au début de cette même page ou directement
en cliquant ici)
une séparation du travail d'écriture du reste (énoncé,
annexes, bibliographie etc.). En demandant aux auteurs de déposer
leur travail en document séparés, vous obtenez une meilleure
pertinence dans l'analyse du travail d'écriture de vos auteurs.
Vous limitez le bruit créé par les annexes et bibliographies.
Vous pourrez très prochainement (1er trimestre 2010) exclure manuellement
et individuellement chaque source et passage de texte que vous ne souhaitez
pas analyser dans un document. Cette fonctionnalité vous permettra
d'exclure le bruit des annexes et bibliographies. Cependant, cette tache
restera manuelle et donc une source de travail supplémentaire.
 
23-
À la différence des autres types de format (.odt, .doc,
.pdf, .html), le format .txt est un format brut de code source sans
meta-data indiquant le type d'encodage des caractères.
Pour cette raison, il n'y a pas de méthode universelle et fiable
pour détecter le type de codage des caractères utilisés
dans les fichiers .txt.
Un fichier .txt créé depuis un système d'exploitation
windows en langue chinoise ne sera pas le même qu'un fichier créé
depuis un système en langue grecque, géorgienne, serbe ou
turque. Ouvrir le même fichier .txt sur un autre système
d'exploitation peut produire des erreurs d'interprétation des caractères
accentués. Cela arrive parfois sur des pages web mal encodées
ou ayant un codage des caractères incompatibles avec la configuration
de votre navigateur. Vous pouvez alors modifier manuellement le type d'encodage
(menu : voir/encodage caractères/ etc...) de votre navigateur.
Si la détection automatique ne se fait pas correctement, le système
d'exploitation utilisera son encodage régional par défaut.
Windows utilise l'encodage "windows-1252" compatible avec ISO-8859-1
pour les pays occidentaux (Standard Western Encoding).
Urkund n'offre pas la possibilité de modifier manuellement le type
d'encodage des caractères. Urkund essaye lors de la convertion
initiale des documents nécessaire à leur traitement (extraction,
comparaison) de reconnaitre automatiquement l'encodage des caractères
du fichier. Si cette conversion ne permet pas cette reconnaissance automatique,
le traitement se fera avec l'encodage par défaut "windows-1252"/compatible
ISO-8859-1. Ce problème peut être le fait d'une sauvegarde
depuis un autre type de système d'exploitation - Linux, Androïd,
Unix, Mac - ou d'un système utilisant un autre language.
Il apparait clairement que ce traitement par défaut occasionne
une erreur d'interprétation des caractères accentués
quelque soit la langue ou l'alphabet.
En interne, Urkund utilise des formats unicodes qui supportent tous les
fichiers et fonctionnent avec quasiment tous types de caractères
et d'alphabets. Malheureusement, ces encodages unicodes ne sont d'aucune
aide lorsque la conversion initiale est incapable de reconnaitre l'encodage
des caractères.
Nous pourrions bien évidemment modifier l'encodage par défaut
actuellement "windows-1252" par un unicode UTF-8 qui accepterait
certainement plus de caractères accentués que l'encodage
"windows-1252". Il y aurait donc une amélioration pour
certains fichiers .txt comportant des caractères accentués
mais de manière générale, le problème d'encodage
resterait présent car l'UTF-8 n'est pas l'encodage par défaut
dans tous les systèmes d'exploitation (linux, mac, ...), ne l'est
pas non plus sur de nombreuses applications (PDF LateX etc.) et enfin
de nombreux utilisateurs continueront d'envoyer leurs documents sauvegardés
avec d'autres types d'encodages de caractères. Dans les 2 cas,
le problème reste donc entier.
C'est donc malheureusement un choix d'encodage de caractères difficile
à faire. Le choix d'Urkund suit le choix du plus grand nombre et
pour l'instant l'encodage de caractères "windows-1252"
compatible ISO-8859-1 reste l'encodage le plus utilisé par
les utilisateurs d'Urkund.
Il n'y a aucune solution technique fiable pour résoudre ce problème
autre que de spécifier explicitement l'encodage utilisé
dans le document lui-même (meta-data), une chose impossible à
réaliser avec un fichier .txt.
L'unique solution est de soumettre vos documents dans un format qui permette
d'interpréter correctement l'encodage des caractères (rtf,
odt, doc, pdf, html, etc...). Il vous suffit pour cela, de sauvegarder
vos document au format .txt dans un autre format (par exemple .odt ou
.docx).
 
24-
Les "metadata" correspondent à
du code source dont l'objet est de véhiculer de manière
transparente pour l'utilisateur (invisible pour l'utilisateur) des informations
relatives à un objet ou un document.
Ainsi chaque page web à des metadata qui lui sont propres, il en
va de même pour un document Word ou Excel de Microsoft Office. Les
metadata font parties de la structure de la plupart des documents.
Les dernières version de MS Word et MS Excel (2007) dont l'extension
est .docx ou .xlsx comportent un certain nombre de fichier incorporés
écrit le plus généralement en code "Open XML".
Ces metadata servent par exemple à standardiser l'insertion d'une
bibliographie, d'une note de bas de page etc... Elles sont normalement
invisibles pour l'utilisateur et ressemblent généralement
à ça :
Il arrive pour des raisons complexes souvent dues à la structure
même du document que ces metadata soient extraites conjointement
avec le contenu textuel du document à controler et analyser. Ainsi,
au lien de n'extraire et analyser que le texte produit par l'auteur d'un
document, des metadata se mêlent au texte de l'auteur et deviennent
apparentes.
Il y a de très fortes chances qu'auparavant, un autre document
comportant presque les mêmes metadata ait
été analysé par Urkund et qu'il soit dans ses archives.
Il en découle des similarités de metadatas sans intérêt
entre 2 documents augmentant d'autant l'indice de similarités.
Ces cas sont particulièrement rares puisque nous identifions moins
de 1% de cas sur 100 documents au format MS Word 2007.
Si vous décelez la présence de metadata dans un de vos documents
analysés, n'hésitez pas à contacter notre équipe
pour qu'elle nettoye le document de ces metadatas afin d'obtenir un indice
de similarité plus pertinent.
 
25-
Il arrive que des metadatas proviennent d'objets
insérés (tableau ou graphique excel inséré)
dans un document word. La structure interne du document Word en devient
très complexe et provoque parfois l'apparition (lors de l'extraction
du texte) d'une partie du code source du document normalement invisible
aux yeux de l'auteur.
Dans ces cas particuliers l'analyse n'est d'ailleurs pas du tout accessible.
Votre navigateur est dans l'impossibilité d'ouvrir l'analyse du
fait d'un trop grand nombre de ligne à afficher.
Pour remédier à ce problème, contactez notre équipe
technique qui nettoyera les metadata liées aux tableaux excel,
graphiques et permettra à votre navigateur de correctement ouvrir
l'analyse.
En rêgle générale suite à ce nettoyage, l'indice
de similitude s'en trouve fortement réduit. Effectivement, le code
source d'un objet inséré peut correspondre à une
quantité de texte qui peut être relativement importante en
comparaison au texte produit par l'auteur. Il pourra ainsi représenter
50 % voir même 80% de la totalité du texte. Si ce code source
est similaire à des archives d'Urkund, l'indice initial de similarité
sera alors proche de 80%.
Une fois le document nettoyé, le nouvel indice de similitude peut
parfaitement tomber à 0% si la seule similarité identifiée
était liée à ce code source apparent.
26-
Qu'est-ce que je dois faire si je reçois
un alerte concernant l'expiration de java-script dans mon analyse?
Parfois, et seulement dans des cas très rares, le java-script expire.
Et on Ce problème est causé par trop de métadata trop dans le document
ou avec un document qui est inhabituellement grand.
Le navigateur sera alors automatiquement annoncé un avertissement, qui
avertit que ce document pourrait accabler son stockage en mémoire.
De tels cas se produisent surtout à des thèses de doctorat avec plus de
1000 pages. Il suffit de cliquer sur «Continuer» pour voir l'analyse ou
alternativement "close" pour arrêter l'analyse.
|