La mise à disposition sous OSP des formats binaires d’Office a été annoncé le 16 janvier. Ces formats sont maintenant disponibles en téléchargement sur le site MSDN. Microsoft sponsorise également un projet Open Source sur SourceForge (http://b2xtranslator.sourceforge.net/) pour créer des outils, proposer des guide et montrer comment traduire un document au format binaire vers le format DIS 29500 (Ecma 376 - Office Open XML).  Le traducteur sera disponible sous une licence open source Berkeley Software Distribution (BSD). Le contributeur principal au projet est DIaLOGIKa qui est également contributeur au projet Open XML/ODF Translator.

L'architecture générale des traducteurs est la suivante:

 

clip_image002

 

La roadmap du projet est la suivante :

  • Milestone 0 (15 février 2008): lancement du projet sur SourceForge
  • Milestone 1 (1er avril 2008): premiers résultats
    • Spécification technique sur la manière de lire et de parser les documents Office Word.
    • Première version d’un parser (ligne de commande) capable de lire et d’interpréter les éléments d’un document Word binaire.
    • Documentation améliorée du mapping doc/docx.
    • Scope détaillé du traducteur implémenté à l’étape suivante.
  • Milestone 2 (30  juin  2008): traducteur Word finalisé et plus
    • Traducteur des formats binaire Word vers le format Open XML Word.
    • Documentation finale du mapping doc/docx.
    • Documentation préliminaire du mapping ppt/pptx, xls/xlsx.