Skip to main content

Форматы данных: такие, чтобы с ними можно было работать

Вначале обратимся к собственному опыту. Что удобнее - работать с текстом документа или с его сканом? А если текст не копируется? Любые проблемы при работе с информацией, размещенной в открытом доступе, вызывают раздражение. Именно поэтому Требования к структуре сайта содержат специальный раздел «Требования к файлам». Первое требование заключается в обеспечении возможности поиска и копирования фрагментов текста средствами веб-обозревателя («гипертекстовый формат»). Например, в большом тексте, размещенном на сайте, вам требуется найти отдельный фрагмент, содержащий слово «фрагмент». Любой сайт дает возможность пользования поисковым окном (обычно оно всплывает при нажатии кнопок Ctrl и F). Туда вводится искомое слово - и пользователь перемещается в нужное место текста. Человек может выделить необходимый текст, скопировать его, вставить в свой документ, отправить по мессенджеру и т.д. Другое требование состоит в обеспечении возможности сохранения документов на технических средствах пользователей. Причем после сохранения пользователи должны иметь возможность поиска и копирования произвольного фрагмента текста средствами соответствующей программы для просмотра («документ в электронной форме»). По сути, это продолжение возможностей работы с текстом, только в формате скачиваемых файлов. Эти условия не всегда выполняются. Например, файл или страница могут быть защищены паролем, не позволяющим совершать действия по ознакомлению, копированию и выводу документа на печать. Положения п. 5 Требований к структуре сайта не допускают подобного применительно к общедоступной информации, размещенной на сайте образовательной организации. Существует и другая проблема, с которой наверняка сталкивались большинство пользователей. «Формат не поддерживается»: скачанный документ не открывается, компьютер «не видит» информацию или выдает ее в форме нечитаемых иероглифов. Сайт образовательной организации не должен быть в этом смысле проблемным. Именно поэтому, согласно п. 5 Требований к структуре сайта, форматы размещенной на сайте информации должны позволять свободный доступ к ней на основе общедоступного программного обеспечения. То есть для работы с информацией пользователи не должны устанавливать специальные программы или совершать другие загрузки. Работа с информацией должна быть привычной, не требовать от пользователя дополнительных усилий по адаптации этой информации. Форматы файлов документов (они обозначаются в названии документа в самом конце, после точки) могут быть следующими:

  • Portable Document Files (.pdf);
  • Microsoft Word или Microsoft Excel (.doc, .docx, .xls, .xlsx);
  • Open Document Files (.odt, .ods).

Документы, которые разрабатывает и утверждает организация самостоятельно, могут размещаться в графическом формате в виде графических образов их оригиналов. Но следует помнить, что данный формат является факультативным. Если, например, приказ размещается в сканированном виде, его надо дополнить читаемым файлом с расширением «.pdf», «.docx» или другим из вышеперечисленных. Что касается формата PDF, такой файл может быть конвертирован как из «вордовского» документа, так и из сканированного. В первом случае сохраняется возможность поиска, то есть данный формат приоритетный. Во втором случае возможности поиска нет, а значит, это может быть только дублирующий файл (поскольку он не позволяет пользователям искать и копировать фрагменты текста средствами веб-обозревателя). И снова обратимся к собственному опыту. Случалось ли вам скачивать документ, который «съедает много Интернета»? Или, наоборот, полученный файл настолько «невесом», что его можно изучать только «под микроскопом»? Сталкивались ли вы с некачественным сканированием, когда, например, часть документа отсутствует? Чтобы исключить и эти сюрпризы, в Требованиях к структуре сайта имеется п. 6, содержащий условия, которым должны соответствовать размещаемые файлы. Максимальный размер размещаемого файла не должен превышать 15 Мб. Но что делать, если размер больше? В этом случае файл должен быть разделен на несколько частей, соответствующих данному требованию. Сканирование бумажных документов должно выполняться с разрешением не менее 100 dpi, текст в электронной копии документа должен быть читаемым. Обратите внимание на разрешение: ранее действовавшие требования допускали разрешение не менее 75 dpi. Если электронные документы заверены электронной подписью (ЭП), она должна соответствовать условиям ст. 6 Федерального закона от 06.04.2011 N 63-ФЗ «Об электронной подписи». Только в этом случае электронный документ будет признан равнозначным подписанному документу на бумажном носителе. Здесь надо учесть, что отсканированный документ с печатями и подписями - это не документ, заверенный электронной подписью, а образ документа. «Вордовский» документ со сканом последней страницы, где стоят печать и подписи, - это тоже образ документа. ЭП должен быть подписан именно размещаемый «вордовский» документ. Если платформа сайта позволяет подписывать документы ЭП, можно использовать свой ресурс. Если нет, следует обратиться к иным сервисам.