mai provato su word, ma ricordo la volta che ho dovuto parsare un file excell.
il problema è che bisogna letteralmente "decifrare" i codici usati all'interno del documento per la formattazione.

Sicuramente trovi decine di classi già pronte per farlo all'interno di http://www.phpclasses.org/