Очистка HTML кода от "мусора" (в частности создаваемого в Word)

« Предыдущая запись
 
  Следующая запись »
 

День добрый, дорогие читатели! Надеюсь у вас также хорошо, как и у нас - солнце светит, птички поют, тепло и наступило лето! У меня пока диссертация, поэтому последних месяца полтора я пишу только раз в неделю, физически не успеваю. Но не будем о грустном, перейдём к делу!

Когда-то давно я копался в интернете на тему поиска скрипта, очищающего код HTML от мусора, который, в частности, оставляет всеми нами "горячо любимый" в этом плане Microsoft Word. Ранее я использовал очистку кода посредством Adobe Dreamweaver, но у него было два недостатка:

  1. Порой очищает далеко не всё, что хотелось бы.
  2. При очень большом количестве кода скрипт очистки выдаёт ошибку.

Второй пункт стал для меня критичен, так как мне приходилось работать с большими таблицами html, от которых на одном сайте никак нельзя было отойти, а всю информацию они предоставляли в Ворде.

Таким образом, блуждая долго по интернету, я нашёл скрипт, который справляется со всем этим хозяйством на ура, и при этом полностью настраиваем.

Очистить HTML

В целом код для очистки не сложный, разобраться проблем не должно возникнуть. Однако есть одно маленькое но: скрипт работает корректно только в Internet Exploited Explorer. А скачать в архиве пример можно по ссылке:

 

 

 

И напоследок поделюсь одной из любимых широкоформатных обоин (1920x1200), валяющихся бесхозно у меня на компе. Наслаждайтесь летом, обоиной, и очищайте Ваш HTML код от всякого мусора! =)

001 thumb Очистка HTML кода от "мусора" (в частности создаваемого в Word)

, , ,

1 звезда2 звезд3 звезд4 звезд5 звезд (ещё не оценили)
Понравилась статья или журнал? Подписывайся на продолжение!
Отзывов: 22 на запись

"Очистка HTML кода от "мусора" (в частности создаваемого в Word)"

  1. А где сам скрипт то???

  2. Во-первых есть ссылка “Очистить HTML”, по ней лежит рабочий скрипт, которым уже можно пользоваться (при желании его можно сохранить как страницу из браузера и она будет работать). Во вторых есть кнопка “Скачать” – там в архиве лежит файл.

  3. не до конца понял о каком мусоре идёт, речь и что так мусорит HTML ?)

  4. попробуй создать в ворде табличку простую, ну или просто текст, и сохрани как html. потом посмотри в код, увидишь о каком мусоре речь =)

  5. ясн. тогда мне такое знакомо.)
    знаю что ещ некоторые генераторы кода страдали когда-то такой проблемой, во фронтпэйдже например.
    а где эт может понадобиться ?

  6. как приведённый пример – при работе с таблицами, особенно когда их много и с нуля рисовать и забивать их гиблое дело.
    в целом скрипт довольно специфический и назначение может само всплыть, когда будет надо. а так, специально сложно придумать =)

  7. Скрипт то, что надо. Очень помог :)

  8. Всегда пожалуйста =)

  9. Могу привести пример когда мне был просто необходим этот скрипт: заказанные копирайтеру текста были набраны в мелкософт-ворде, в итоге при копировании прямо из ворда и вставке текста в форму визуального редактора (SPAW Editor v.2), на страницах вываливался весь мусор о котором говорится выше. Чтоб от него избавится пришлось все прогнать через блокнот, но при этом потерялись все полезные тэги (типа жирного шрифта, выделение текста цветом), пришлось все редактировать прямо в визуальном редакторе ручками.
    Спасибо за скрипт, найти бы его раньше…

  10. дааа, я тоже заморачивался раньше иначе, пока не обзавёлся этим скриптом. я делал через дримвивер, но он очищает маловато, да и гигантский код (больше 2-4 тыщ строчек) он запарывал и говорил – не буду

  11. А у меня почему-то не работает =(. Что сохраненный вариант, что у Вас на сайте. Вводишь текст, нажимаешь “оптимизировать” и вообще весь текст исчезает!

  12. В ишаке тестите? Если нет, то гоу в ишак, а если в ишаке, то стоит взять другую версию.

  13. Большущее спасибо! Я огнелисом пользовался и ничего не работало. Открыл ишаком и все ОК. Еще раз спасибо!

  14. Ю а велкам! В след.раз внимательнее текст читайте, у меня было указано, что только в ишаке работает ;)

  15. Евгений
    11/03/2011 at 23:58 Постоянная ссылка Цитировать

    http://wordoff.org/clean
    очень помогло – чистит всё!
    но автору тоже спасибо!

  16. Спасибо за ссылку и всегда пожалуйста!

  17. К сожалению, из кода htm, (созданного старым MS Mord 97), этот скрипт удаляет и полезные теги: font, size, в, span – удаляются.

  18. Прежде всего – всё что удаляется, можно настроить в скрипте. А во-вторых, теги font, size, b уже давно несемантичны

  19. Разобрался, Спасибо!! Прошлый раз пользовался скриптом онлайн, по ссылке. Но если скачать, то действительно – легко его настроить ))

  20. Ю а велкам! =)

  21. Автор, спасибо огромное.
    Здоровья Вам и денег столько сколько хотите!

    Я вспомнил все матерные слова пока чистил код вставленный из ворда – чтоб они там здохли в своем микрасуфте (гарите в аду).

    Скрипт помог – все работает прекрасно.
    Код чистый – я счастлив.

    Еще раз спасибо!

  22. Александр Шуйский
    06/11/2012 at 20:10 Постоянная ссылка Цитировать

    Большое спасибо! Рад, что оно очень помогло =)

Добро пожаловать, коллега! Вы можете оставить свой отзыв:





Допустимые XHTML-теги:

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Подписка на комментарии