Le guide-âne du webmestre
Conversion de word en HTML
Outil, conseils, astuces

logo guide-âne du webmestre

4 pages

par Edith Micheli avec la participation d'Anne Bedel et Christophe Jacquemin

ouvert le 4-8-99

SENHTML
(un grand merci à Sébastien Dubourg du Sénat)

ou comment le Sénat convertit les documents word en html (avec sommaire automatique, repartition des pages html, conversion des images, etc ... sous Linux et Windows.)
http://www.senat.fr/dev/guidefr.html

Téléchargement (c'est gratuit)
Version W95/W98/NT disponible à http://www.senat.fr/dev/senhtml_w32_3.0.5.zip
Version Linux 2 (ELF) disponible à http://www.senat.fr/dev/senhtml_linux_3.0.5.tar.gz

Vous devez écrire un document sous word ? posez-vous la question suivante:
Sur quel support sera-t-il diffusé?:
1-papier?
2-internet?
3-papier et internet?

Le tableau ci-dessous concerne les cas 2 et 3.
Si vous êtes dans le cas 2, ne finassez pas inutilement sous word97, puisque la plupart des attributs décrits dans le tableau ci-dessous ne seront qu'imparfaitement, ou pas du tout convertis en HTML.
Si vous êtes dans le cas 3, il est conseillé de réaliser 2 documents:
-l'un, basique, en vue d'une conversion parfaite en HTML
-l'autre, copie du premier, enrichi des fonctionnalités propre à word97 (si vous le désirez) en vue de son édition papier.

Pour un document HTML, tenez compte au minimum des six règles d'or suivantes:

  1. Pas de titre en majuscules, cela HURLE! et c'est moins lisible qu'en minuscules.

  2. Pas de souligné (pour ne pas confondre avec un lien hypertexte).

  3. Pas de tabulations

  4. Pas de justification

  5. Prévoir toujours une ligne par item dans un tableau (voir fiche tableau)

  6. Pour aller à la ligne en fin de phrase, utiliser la combinaison des touches "MAJ" +"entrée" (la touche "entrée" seule, crée une ligne intercalaire qui ne se voit que lors de la conversion en  HTML).

NB: Choisir de préférence un nom "significatif" du document sur 8 caractères maximum, écrit en minuscules, sans accent. exemple: guidane.htm.

WORD
(éléments appliqués sur le document)

conversion HTML
O éléments conservés
A conversion approximative
N pas de conversion

résultat en HTML
conseils, astuces

Tabulations
A Les tabulations sont convertis en code HTML, représentées dans la source HTML sous la forme &#9. Les tabulations peuvent s'afficher sous la forme d'espaces dans certains navigateurs internet,
Ne plus utiliser les tabulations
Tableaux A Les tableaux sont convertis bien que les paramètres non pris en charge par l'environnement de création de pages HTML soient supprimés.

Les bordures en couleur et d'épaisseur variable ne sont pas conservées
Ne plus utiliser les tabulations (en particulier les tabulations numériques)
Voir fiche spécifique sur les  tableaux

Marges N Pour définir la présentation de votre page, vous pouvez utiliser un tableau
Mode plan , listes numérotées de titres et de plan A Les listes numérotées de titres et de plan sont converties en texte ordinaire (sans style) mais conservent leur aspect. La hiérarchie du plan peut être perturbée
Commentaires N Les commentaires que vous insérez à l'aide de la commande Commentaire du menu Insertion sont supprimés. Toutefois, après avoir enregistré le document dans un format HTML, vous pouvez saisir des commentaires, puis leur appliquer le style Commentaires. Les commentaires ne sont pas visibles lorsque vous affichez la page HTML qui les contient dans un navigateur internet
Tailles des polices

 

A Word affiche les polices en utilisant des tailles comprises entre 9 et 36
HTML affiche des tailles comprises entre 1 et 7
<FONT SIZE>.  La taille HTML la plus proche disponible est appliquée aux polices.
Utiliser la taille standard pour la frappe courante et H1, H2, H3 ...pour les titres.
Effets relief, ombré, empreinte, tout en majuscules, petites majuscules, barré double et contour, surlignage N Ces formats de caractères sont annulés, mais le texte auquel ils étaient appliqués est conservé
Styles
gras,
barré; italique et souligné...
O gras, barré; italique et souligné
Ne pas utiliser la style "souligné" qui peut être confondu avec un lien hypertexte

Si vous convertissez par exemple un style qui inclut les formats gras et ombré, le format gras est conservé en tant que format direct, mais le format ombré est supprimé

Certains effets de soulignement spéciaux, tels que les soulignements en pointillé, sont convertis en soulignement simple tandis que d'autres demeurent inchangés

Graphismes A Les graphismes, tels que les images, sont convertis au format GIF (.gif), sauf s'ils sont déjà au format JPEG (.jpg).

Les dessins, par exemple les zones de texte et les formes, demeurent inchangés.

Les traits sont convertis en traits horizontaux

Lettrines N Les lettrines sont supprimées.

Vous pouvez cependant, en HTML, augmenter la taille d'une lettre en la sélectionnant et en cliquant sur l'icône Agrandir la police .
Vous pouvez également utiliser une image représentant une lettre.

Dessins, tels que les formes automatiques, les effets de texte, les zones de texte et les ombres N Les dessins sont supprimés.

Vous pouvez utiliser les outils de dessin dans l'environnement de création de pages HTML en insérant des images Word. L'image est alors convertie au format GIF.

Équations, graphiques et autres objets OLE A Ces éléments sont convertis en images GIF.

L'aspect est conservé, mais ne vous pourrez pas mettre à jour ces éléments.

Numérotation des pages N Étant donné qu'un document HTML est considéré comme une seule et unique page, quelle que soit sa longueur, la numérotation des pages est supprimée
Symboles et caractères spéciaux

Menu Insertion
Commande Caractères spéciaux
O (pour certains caractères) voir la liste des caractères spéciaux de la police wingdings dans la fiche "des images sans gif"
dont voici un extrait
+é"(èçà)=$ l m o ù r lmù*²wn²<
Champs N Les valeurs de champ sont converties en texte, et les codes de champ sont supprimés.

Si vous insérez par exemple un champ DATE, le texte de la date sera converti, mais la date ne sera plus mise à jour

Tables des matières et index A Les informations sont converties, mais les index et les tables des matières et des illustrations ne peuvent pas être mis à jour automatiquement après la conversion car ils sont générés à partir de codes de champ.

Les numéros de page contenus dans les tables des matières sont remplacés par des astérisques * qui constituent des liens hypertexte sur lesquels le lecteur peut cliquer pour se déplacer dans la page HTML.
Vous pouvez remplacer les astérisques par le texte que vous souhaitez afficher comme lien hypertexte

Marques de révision N Les modifications saisies avec la fonctionnalité Suivi des modifications sont conservées, mais les marques de révision sont supprimées
Bordures autour des paragraphes et des mots N Vous pouvez placer des bordures autour d'un tableau et insérer des traits horizontaux pour mettre en relief ou séparer les différentes parties de votre page HTML
Bordures de page N Il n'existe pas d'équivalent HTML pour les bordures de page

Vous pouvez améliorer la présentation de vos pages en ajoutant un arrière-plan à l'aide de la commande Arrière-plan du menu Format de Front page.

Vous pouvez aussi placer des bordures autour d'un tableau et insérer des traits horizontaux pour mettre en relief ou séparer les différentes parties de votre page HTML

En-têtes et pieds de page N Il n'existe pas d'équivalent HTML pour les en-têtes et les pieds de page
Notes de bas de page et notes de fin N Il est préférable d'éviter les notes de bas de page, qui ne sont pas adaptées à l' hypertexte.
Mettre ces notes directement derrière la phrase, entre parenthèses et en italique.
Texte animé

Menu Format
Commande Police
Onglet Animation

N Les animations sont supprimées, mais le texte auquel elles étaient appliquées est conservé.
Pour obtenir un effet animé, insérez du texte déroulant dans votre page dans l'environnement de création de pages HTML

 

Renvois, Comparaison de versions, Publipostage N  
Documents maîtres N Les documents maîtres ne sont pas pris en charge lors de la création de pages HTML.

Vous pouvez subdiviser des volumes de texte importants en pages HTML distinctes, puis insérer dans une page HTML des liens hypertexte vers les documents ainsi obtenus

Colonnes de type journal N Pour disposer vos données dans plusieurs colonnes, utilisez des tableaux.

http://www.admiroutes.asso.fr/webmestre/word.htm
©droits de diffusion