Признаюсь: не люблю варезные сайты. Для меня они ассоциируются с ломаным и нерабочим софтом, вирусами, троянами, навязчивой рекламой и прочими «прелестями». Большая часть таких сайтов работает на движке DLE. Движок этот платный, но я еще не встречал никого, кто покупал лицензию. Но не будем погружаться в размышления о защите авторских прав, перейдем ближе к делу.
Несколько месяцев назад мне достался варезный сайт на DLE, медленно, но верно, выпадающий из индекса Яндекса. Сайт мне был не нужен, поэтому никаких действий над сайтом я не проводил, лишь установил код Sape, дабы успеть хоть немного подзаработать перед тем, как ресурс будет окончательно выкинут на обочину жизни. После того, как последняя страница покинула индекс «зеркала рунета», встал острый вопрос: а что дальше делать с сайтом?
После некоторых раздумий, решил использовать часть контента с сайта в других своих проектах. Например, создать псевдоблог о фильмах. Собственно, о технической стороне переноса контента с DLE на WordPress сегодня разговор и пойдет. Кроме прямых рук и смекалки, нам понадобиться публикатор TextKit (программа платная, у меня версия Standard, на бесплатной версии такие выкрутасы вряд ли пройдут).
Экспорт записей из DLE
Публикации с варезника можно было бы скопировать всевозможными грабберами или, скажем, используя специальную программку для конвертации баз данных, но мы легких путей не ищем. Было решено забрать весь контент с сайта через RSS. Все 2,5 тыс. записей.
Заходим в админку сайта:
Настройка системы — Настройка RSS экспорта новостей
Количество экспортируемых новостей — устанавливаем значение примерно равное количеству публикаций на сайте.
Формат экспорта RSS потока — Полный.
(Картинка кликабельна)
Теперь заходим по адресу mysite.com/rss.xml и смотрим что получилось. Сразу предупреждаю: страничка грузиться будет долго. Рассматриваем нашу RSS-ленту и тут сталкиваемся с проблемой: DLE отправляет в RSS не полную запись, а лишь ее вводную часть. Так этот движок устроен: каждая новость состоит из двух частей: {short-story} — вступление, {full-story} — полная версия. Можно долго ломать голову и ковыряться в php-файлах движка и шаблона, но гораздо легче прочитать эту статью и сделать все в точности, как в ней описано. Отдельной респект автору статьи — p.b.Leo. Если мы сделали все правильно (кавычки нужно будет отредактировать), в RSS у нас теперь подается полная версия записей сайта. Осталось дело за малым: сграббить RSS-фид. Этим займется TextKit. (прям в рифму получилось)
Запускаем RSS граббинг
Запускаем TextKit, Импорт — Загрузка RSS
Запускаем граббер RSS
Получаем все записи нашего DLE-сайта, аккуратно расфасованные по папочкам-рубрикам.
Теперь можно создать из полученных записей файл импорта для WordPress или Joomla, но мы еще будем заниматься редактированием, так что пока просто сохраним проект. Как из файлов, экспортированных из варезника на DLE, мы будем создавать киноблог, я расскажу в следующий раз, а пока на этом закончим.
Спасибо за внимание!
Нефига непонятно зачем эти варезники!!
Хорошая статья!