Pandoc: швейцарский нож для преобразования текста

Не единожды при создании текстов (особенно технических документов) в Microsoft Word, да и в других WYSIWYG редакторах, ловил себя на том, что оформление документа отнимает внимание и не даёт полностью сосредоточиться. Постоянно хотелось разделить задачи написания содержания и оформления, но не было подходящего инструмента: хотелось чего-то очень простого и понятного, и чтобы не надо переключаться между клавиатурой и мышью, и чтобы ещё и не переучиваться, и чтобы всё работало быстро.



В большей части текстовых документов используется минимальный набор оформления текстовых блоков,- простой текст (абзац), заголовки разных уровней и списки. Для подобного форматирования можно пользоваться лёгкими форматами, типа wiki, а потом переводить получившийся текст в необходимый формат с помощью какой-то специальной утилиты.

И вот, наконец, нашлось простое и удобное решение: 
содержание можно создавать в простом текстовом редакторе, например Notepad++, используя при этом простейшую разметку markdown или reStructuredText, а затем с помощью pandoc, содержание переводится в HTML, PDF или даже в Word docx.

Всего 4 простых шага, на примере разметки Markdown:

  1. Создаём текст:

    # Заголовок начинается с решётки

    Текст абзаца отделяется от заголовка и списка пустой строкой. Больше никаких правил нет.

    - элементы маркированного списка начинаются с чёрточки или звёздочки
    * списки могут быть вложенными
       1. элементы нумерованного списка начинаются с цифры.
       3. цифры могут быть любыми
       2. markdown автоматически исправит нумерацию
    - список отделяется от абзаца пустой строкой

  2. Сохраняем текстовый файл, в этом примере пусть будет markdownexample.txt
  3. Конвертируем в командной строке. Pandoc распознаёт исходный формат, ему нужно сказать только в какой тип преобразовать, например docx:

    pandoc markdownexample.txt -o markdownexample.docx

  4. Получаем результат
По опыту продолжительного иcпользования,- скорость создания и удобство работы с длинными по содержанию, но несложными по форматированию документами оказалась чуть-ли не в 2 раза выше, чем при работе с WYSIWYG. А кроме того,- набор правил разметки и в Markdown и в reStructuredText значительно больше, о правилах разметки можно прочитать по ссылкам ниже. Набор входных и выходных форматов Pandoc тоже шире, ссылки для интересующихся внизу.

Ссылки по теме:


Комментарии

Популярные сообщения