docx nach plaintext konvertieren unzip -p some.docx word/document.xml | sed -e ’s/<[^>]{1,}>//g; s/[^[:print:]]{1,}//g‘