Сравнительный обзор офлайн-браузеров
Функциональность, поддержка протоколов и вебтехнологий
Краткий обзор популярных офлайн-браузеров
На первый взгляд вопрос о скачивании сайтов в век недорогого и быстрого Интернета вызывает, по меньшей мере, удивление. Действительно, прошли времена, когда приходилось закачивать необходимые интернет-ресурсы по ночам — по более низким тарифам. Сегодня многие пользователи находятся в онлайне чуть ли не круглосуточно и в любой момент могут зайти на интересующую страницу и уточнить тот или иной нюанс.
Однако потребность в скачивании отдельных разделов сайтов возникает и в нынешнее время, поскольку некоторую информацию (онлайновую документацию, разнообразные справочные пособия, учебники, статьи из журналов, уроки по конкретной тематике и т.п.) удобнее держать под рукой — то есть на жестком диске. Дело в том, что при изучении какихто новых объемных материалов (скажем, документации по Maya) обращаться к документам приходится многократно, нередко возвращаясь к изучению конкретного раздела, метода, функции, термина и т.д. Каждый раз на загрузку нужного ресурса (кстати, для этого ссылку на него придется держать на видном месте в «Избранном») и поиск на нем ответа на конкретный вопрос может потребоваться немало времени, ведь проведение поиска предусмотрено не на каждом сайте. Зато у себя на жестком диске открыть страницу с интересующей информацией можно будет мгновенно, воспользовавшись специализированной поисковой утилитой. Поэтому закачивание избранных разделов сайтов на жесткий диск представляет несомненный интерес для преподавателей, студентов и прочих пользователей, которым приходится изучать теоретические материалы по какойлибо тематике. Кроме того, данная возможность может показаться привлекательной мобильным пользователям, которые в силу обстоятельств не в любой момент могут получить доступ к Интернету, а ноутбук с заранее скачанным сайтом всегда будет у них под рукой (даже в самолете).
Таким образом, сохранение на жестком диске избранных разделов вебресурсов со всеми подстраницами — для ряда пользователей банальная необходимость. Вопрос лишь в том, каким инструментарием для этого воспользоваться. Сохранять страницы по одной средствами браузера — удовольствие сомнительное, поскольку потребуется масса времени. Кроме того, при таком сохранении связи между страницами нарушаются. Поэтому для быстрого сохранения подобной информации обычно прибегают к помощи офлайн-браузеров (Offline Explorer, WebCopier Pro, Teleport Pro и пр.). Они смогут записать на жесткий диск все страницы сайта из указанного раздела, не забыв про картинки и связи, причем при соответствующей настройке проведут данную операцию даже без вашего участия в автоматическом режиме. Обзаведясь любым из названных программных продуктов, вы сможете без какихлибо усилий скачать на диск многостраничный документ и затем уже в спокойной обстановке изучить материалы, перемещаясь со страницы на страницу по ссылкам, как в онлайне.
Нелишне отметить и тот факт, что в закачиваемых на диск файлах применяется относительная трансляция ссылок, а значит, скачанные сайты можно будет перемещать в другие каталоги без потери их работоспособности. Более того, при желании скачанную информацию несложно будет конвертировать в формат CHM и/или записать на CD-, DVD- или Blu-ray-диск.
Технология скачивания сайтов никакой сложности не представляет — достаточно создать новый проект (чаще всего это осуществляется с помощью мастера) и запустить его на выполнение. В ходе создания проекта потребуется указать адрес скачиваемого сайта и определить параметры скачивания (глубину сканирования, необходимость скачивания картинок/видео, допускаемые к загрузке расширения файлов и пр.). Выполнение проекта обычно может быть запущено по требованию либо автоматически — по расписанию.
Функциональность, поддержка протоколов и вебтехнологий
Все современные офлайн-браузеры, разумеется, поддерживают многопоточное скачивание и докачку после обрыва связи (см. таблицу) и умеют маскироваться под интернет-браузеры (это необходимо при скачивании информации с сайтов, в которых заблокирован доступ для офлайн-браузеров). Поэтому любое из рассматриваемых решений обеспечивает быстрое и надежное скачивание простых по структуре вебсайтов. С HTTPS-сайтами сложнее, поскольку поддержка протокола HTTPS предусмотрена не во всех программах. Это же относится и к сайтам, требующим авторизации, — в большинстве офлайн-браузеров предусмотрена поддержка авторизации на базовом уровне, в то время как на сайтах могут быть реализованы более сложные схемы аутентификации (например, проверка подлинности на основе форм, NTLM-аутентификация).
Еще один нюанс — уровень поддержки программами современных вебтехнологий, который в разных офлайн-браузерах заметно различается. На практике это означает, что простые по структуре сайты без проблем закачиваются любым решением. Что касается корректного распознавания и извлечения ссылок из CSS, XML/XSL/DTD и Table Of Contents (TOC), анализа MP3-списков и файлов форматов PDF, SWF, SVG и пр., то всё это в полном объеме реализовано только в Offline Explorer Pro.
Кроме того, нужно обратить внимание на возможность настройки ограничений в отношении того, какая информация должна скачиваться на диск, а какие файлы следует исключить (с учетом расширений файлов, их размеров и местонахождения). Это крайне важно, поскольку без установки подобных ограничений вы рискуете закачать на диск слишком много ненужной информации. Функционал для настройки такого рода ограничений в офлайн-браузерах заметно различается.
Краткий обзор популярных офлайн-браузеров
Offline Explorer Pro 5.9
Разработчик: MetaProducts Corporation
Сайтпрограммы: http://www.offlineexplorerpro.com/
Размер дистрибутива: 8,33 Мбайт
Работа под управлением: Windows 2000/NT4.0/XP/2003/Vista
Способ распространения: shareware (30-дневная демо-версия — http://www.metaproducts.com/download/opsetup.exe)
Цена: 950 руб.
Offline Explorer Pro — один из лучших и наиболее активно развивающихся офлайн-браузеров. Среди конкурентов он выделяется наиболее полной поддержкой современных вебтехнологий, Flash-анимации, скриптов и динамического содержимого страниц. Благодаря этому он может полностью загружать практически любые по наполнению вебсайты, извлекая самую разнообразную информацию, включая Flash-файлы, PDF-документы, XML/XSL-файлы, видео QuickTime (MOV), Java- и VB-скрипты и т.д. Offline Explorer Pro умеет скачивать вебсайты, а также FTP-серверы и защищенные вебсайты (HTTPS). Предусмотрена работа с паролями для сайтов, требующих авторизации (включая NTLM-аутентификацию). Возможна закачка всего сайта целиком, его отдельных разделов либо файлов строго определенных форматов (например, изображений из галереи, Flash-анимации и др.). Кроме того, в программе предусмотрена загрузка потокового аудио/видео (по протоколам RTSP, PNM, MMS и NSV-SHOUTcast) и закачка BitTorrent-раздач, что невозможно ни в одном другом аналогичном решении.
Offline Explorer Pro позволяет создавать и управлять множеством проектов, которые можно структурировать, объединяя в тематические группы, и допускает одновременное скачивание до 500 файлов. Предусмотрено регулирование загрузки страниц путем применения фильтров, позволяющих определять, какие файлы должны быть загружены, а какие — пропущены. Так, фильтры URL могут использоваться для ограничения загрузки с учетом протокола, имени сервера, пути и имени файла — например несложно настроить проект так, чтобы закачка производилась только по протоколу HTTP, только с конкретного сервера либо только из исходной папки и т.п. Кроме того, не составит труда заставить программу пропускать в ходе загрузки страницы с конкретными адресами. В свою очередь, фильтры содержания позволяют фильтровать страницы с учетом ключевых слов внутри текста страниц. При желании возможна принудительная остановка загрузки в случае превышения объема скачанной информации, слишком большого количества файлов (больше, чем задано в настройках) и длительности загрузки.
Запуск проектов обычно производится вручную либо по расписанию, возможен запуск из командной строки. Предусмотрено управление скоростью загрузки: разрешается производить загрузку в фоновом режиме либо установить один из трех предустановленных режимов загрузки. По завершении скачивания программа может автоматически разорвать интернет-соединение и активировать «спящий» режим либо выключить компьютер.
Закачанные вебстраницы просматриваются непосредственно из Offline Explorer Pro во встроенном браузере, который при желании несложно отключить, либо во внешнем интернет-браузере. При просмотре во встроенном браузере любую из страниц несложно распечатать. Кроме того, можно провести поиск в закачанных файлах — по ключевым словам в именах файлах и полнотекстовый по тексту страниц. Загруженные в конкретном проекте файлы могут быть скопированы в указанный каталог, сохранены в файл HTML Help (CHM), заархивированы в ZIP-архив и др.
Дополнительно предоставляется возможность извлечения данных с закачанных страниц — реализуется это с помощью утилиты TextPipe (http://www.datamystic.com/textpipepro.exe) от компании DataMystic. Извлеченные данные сохраняются в виде, удобном для загрузки в базу данных и дальнейшего анализа.
WebCopier Pro 5.4
Разработчик: MaximumSoft Corp.
Сайт программы: http://www.maximumsoft.com/products/wc_pro/overview.html
Размер дистрибутива: 2,71 Мбайт
Работа под управлением: Windows XP/2003/Vista
Способ распространения: shareware (15-дневная демо-версия — http://www.maximumsoft.com/downloads/index.html#wc_pro_download)
Цена: 50 долл.
WebCopier Pro — офлайн-браузер, позволяющий скачивать обычные и защищенные вебсайты и FTP-серверы. Допускается скачивание очень больших ресурсов (размером более 2 Гбайт) и сайтов, требующих авторизации. Программа обладает поддержкой большинства современных вебтехнологий — умеет извлекать ссылки из JavaScript, Java Classes и Macromedia Flash, анализировать файлы форматов PDF, XML, RSS, SWF, FLV, WAP, VRML и SVG, а также MP3-списки. Наряду со стандартным анализатором она имеет профессиональный анализатор (обеспечивает более точный анализ HTML-форм, JavaScript и DHTML) и в дополнение к сбалансированному методу загрузки предоставляет рекурсивный метод, который может оказаться полезным при скачивании больших многоуровневых сайтов с изображениями, расположенными на разных уровнях.
WebCopier Pro обеспечивает управление множеством проектов (для удобства их распределяют по разным тематическим группам) и может загружать до сотни файлов одновременно. Система фильтров позволяет четко регулировать, какие файлы будут скопированы, а какие — окажутся пропущенными. В частности, несложно установить разрешение/запрет на скачивание изображений, видео и аудиоконтента, архивов, документов определенных форматов, проводить загрузку только по конкретным протоколам, скачивать файлы только с начального сервера или со всех серверов, из исходной папки либо изо всех папок и др. Кроме того, для каждого проекта можно определить максимальный объем скачанного контента, максимальное количество файлов, которые могут быть загружены с сайта, минимальный/максимальный размер файла и максимальное время, которое может быть потрачено на загрузку. Настройки скачивания при необходимости сохраняются в шаблонах.
Запуск проектов на скачивание (в зависимости от настроек) производится автоматически сразу после их создания либо позднее — по требованию или в соответствии с заданным расписанием. Последние два варианта позволяют запускать на скачивание сразу несколько проектов — в этом случае программа выполнит проекты друг за другом безо всякого вмешательства пользователя. При необходимости после завершения автоматического скачивания офлайн-браузер может самостоятельно разорвать соединение и выключить компьютер. Предусмотрено управление скоростью загрузки данных через слайдер скорости.
Загруженные файлы можно просмотреть во встроенном браузере, причем еще до завершения выполнения проекта, либо открыть для просмотра во внешнем браузере. Предусмотрен экспорт закачанного проекта в различные форматы (в частности, в CHM-файл и ZIP-архив), а также сохранение в указанной папке на жестком диске, Zip-диске, CD-RW. Возможен автоматический экспорт данных проекта сразу после завершения его загрузки.
Teleport Pro 1.63
Разработчик: Tennyson Maxwell Information Systems, Inc.
Сайт программы: http://www.tenmax.com/teleport/pro/home.htm
Размер дистрибутива: 841 Кбайт
Работа под управлением: Windows 95/98/Me/NT/2000/XP/2003/Vista/2008/7
Способ распространения: shareware (демо-версия на 40 запусков — http://www.tenmax.com/teleport/pro/download.htm)
Цена: 49.95 долл.
Teleport Pro — один из старейших на рынке офлайн-браузеров. Программа умеет работать с веб и FTP-серверами и позволяет скачивать сайты в полном объеме либо осуществлять закачку только конкретных разделов выбранных ресурсов, предоставляет доступ к сайтам, требующим авторизации. Она обладает неплохой поддержкой современных вебтехнологий (хотя внешне и выглядит несколько устаревшей) — в частности может использоваться для скачивания динамически генерируемых сайтов (ASP, PHP и др.), умеет обрабатывать простые сценарии JavaScript и cookies, извлекать ссылки из CSS, корректно обрабатывает Flash-апплеты и MP3-списки.
Офлайнбраузер Teleport Pro настроен на работу с однимединственным проектом, поэтому при необходимости одновременного выполнения нескольких проектов потребуется запустить соответствующее количество копий приложения и в каждой из них создать свой проект. Типов проектов множество — можно провести полное скачивание сайта, создать его точную копию с полным сохранением всей внутренней структуры, осуществить составление списка файлов сайта (такой проект выполняется очень быстро, поскольку сами файлы не скачиваются) и др. Скачивание может вестись в десять потоков.
При необходимости несложно скачать только файлы заданного размера или типа либо файлы, включающие указанные ключевые слова. Предоставляется возможность установки ограничений на скачивание графики и аудио, а также определения ключевых слов, которые должны содержаться на страницах. Кроме того, при настройке проекта несложно задать список исключений — адресов и типов файлов, которые не должны скачиваться. То же самое касается страниц с ключевыми словами. Можно также установить предельные размеры файлов (скажем, заставить программу скачивать только высококачественные изображения) и определить, нужно ли загружать фоновые изображения и Java-апплеты.
Запуск рабочего проекта производится вручную или автоматически, при желании можно установить на выполнение несколько проектов, и они будут запускаться друг за другом. Допускается настройка программы на автоматический разрыв соединения после завершения скачивания. Скачанные страницы могут открываться для просмотра непосредственно из Teleport Pro, при этом загружаются они во внешнем браузере.
PageNest 3.27
Разработчик: Solent Software
Сайт программы: http://pagenest.com/index.html
Размер дистрибутива: 1,8 Мбайт
Работа под управлением: Windows XP/Vista/7
Способ распространения: Free Edition — freeware; Pro Edition — shareware (функционально ограниченная демо-версия — http://pagenest.com/download.html)
Цена: Free Edition — бесплатно (только для некоммерческого использования); Pro Edition — 39,95 долл.
PageNest — активно развивающийся офлайн-браузер, ранее известный под именем Web Stripper. Программа предназначена для скачивания вебсайтов, включая сайты, требующие авторизации. Данный офлайн-браузер поддерживает многие современные вебтехнологии и может применяться для скачивания динамически генерируемых сайтов (ASP, PHP и др.), умеет обрабатывать сценарии JavaScript и cookies, извлекать ссылки из CSS и пр. Программа представлена в двух редакциях: бесплатной Free Edition и коммерческой Pro Edition. Возможности бесплатной редакции позволяют выполнять быстрое многопоточное скачивание сайтов с базовым регулированием параметров скачивания, что вполне устроит многих пользователей. Платная редакция предоставляет инструментарий для расширенной фильтрации закачиваемого контента (с учетом имени сервера, пути, имен файлов и др.), умеет скачивать сайты с авторизацией, поддерживает работу по расписанию и др.
PageNest позволяет управлять множеством проектов, удобно структурированных по категориям, и может загружать до сотни файлов одновременно. Все проекты автоматически распределяются по виртуальным папкам в соответствии с настройками их обновления. Используя систему ограничений, можно задать глубину сканирования для указанного ресурса и/или для внешних ссылок, ограничить типы форматов файлов (правда, допускается отключение только графики, мультимедиа и любых других данных, кроме присутствующих в HTML-файлах) и указать минимальный/максимальный размер файлов. Предусмотрена фильтрация в соответствии с заданными правилами, с помощью которых несложно настроить включения/исключения с учетом имен сервера, путей, файлов и т.д. Разрешается установить лимит на общее время скачивания и максимально допустимое количество скачанных файлов.
Запуск проектов на скачивание производится автоматически сразу после их создания (в редакции Free Edition), по требованию или в соответствии с расписанием (Pro Edition), что позволяет запускать на скачивание сразу несколько сайтов автоматически — друг за другом. При этом программа может быть настроена на автоматический разрыв соединения и выключение компьютера по завершении закачки всех предусмотренных проектов. Скачанные страницы открываются для просмотра во встроенном браузере либо просматриваются в интернет-браузере, установленном на компьютере.
Web Transporter 3.42
Разработчик: RealSofts, Inc.
Сайт программы: http://www.realsofts.com/realsofts.com/ru/wt/index.html
Размер дистрибутива: 1,97 Мбайт
Работа под управлением: Windows 98/Me/NT/2000/XP
Способ распространения: shareware (демо-версия, приостанавливающая работу через произвольные промежутки времени, — http://www.realsofts.com/realsofts.com/ru/download.htm)
Цена: 250 руб.
WebTransporter — простой и удобный офлайн-браузер, который позволяет загружать файлы по протоколу HTTP (в том числе с закрытых сегментов сайта с авторизацией), что обеспечивает возможность полного или частичного копирования сайта. В программе реализовано распознавание cookies, Java-скриптов и Java-апплетов, возможно извлечение ссылок из Cascading Style Sheets (*.css), а также Flash- и XML-файлов.
WebTransporter позволяет управлять только одним проектом — значит, произвести закачку нескольких проектов можно однимединственным способом — запустив соответствующее количество копий программы. Проекты бывают двух видов: для скачивания сайта/раздела и для скачивания заданных документов. Скачивание может вестись в 15 потоков.
Предусмотрена возможность настройки ограничений через фильтры, с помощью которых несложно разрешить или запретить скачивание файлов конкретных форматов (отдельно для изображений, аудио, видео, архивов и пр.), а также определить URL, которые следует пропускать во время загрузки либо, наоборот, обязательно загружать. При создании проекта можно ограничить область сканирования заданным сайтом. Возможна принудительная остановка скачивания, если на диске осталось мало места и/или было скачано определенное в настройках количество файлов.
Запуск рабочего проекта осуществляется вручную или по расписанию, в последнем варианте возможен разрыв соединения и выключение компьютера после завершения скачивания проекта. Просмотр закачанного сайта производится во встроенном браузере либо во внешнем браузере, установленном по умолчанию. Скачанная в конкретном проекте информация может быть скомпилирована в CHM-файл или упакована в ZIP-архив.
Заключение
Как следует из всего вышесказанного, функционал офлайн-менеджеров от разных разработчиков весьма схож. В целом все они обеспечивают надежную и быструю закачку вебсайтов — целиком или только определенных подразделов. Поэтому ряду домашних пользователей для решения данной задачи вполне достаточно обзавестись бесплатным инструментом PageNest Pro (Free Edition) либо приобрести предлагаемую за символическую плату программу WebTransporter. Однако следует иметь в виду, что поддержка современных вебтехнологий в данных решениях реализована далеко не в полном объеме, а это значит, что вероятность попасть на сайт, который скачать не удастся, выше, чем в других рассмотренных программах. Вместе с тем пользователям, которых интересует только скачивание сайтов с документацией, беспокоиться особо не стоит, поскольку подобные ресурсы, как правило, имеют простую вебструктуру.
Когда нужна закачка сложных вебсайтов, защищенных вебсайтов (HTTPS) и ресурсов, требующих расширенной авторизации (например, NTLM-аутентификации), придется выбрать более функциональное решение — лучше всего программу Offline Explorer Pro, которая отличается широкой функциональностью, имеет русскоязычный интерфейс и предлагается по приемлемой цене. При необходимости резервного копирования сайтов с регулярным обновлением копий разумнее будет остановить свой выбор на WebCopier Pro. Что касается программы Teleport Pro, то, несмотря на заслуженную популярность, сегодня она уступает по функциональности решениям Offline Explorer Pro и WebCopier Pro, да и стоит заметно дороже первого из них. Кроме того, программа не имеет русскоязычного интерфейса, поэтому для российских пользователей менее привлекательна.