はじめに
サーバーにhtml5に対応したtidyをインストールしたかったのでメモ
Tidyではversion5.Xと表示されるものはHTML5対応です。
windows版
HTML Tidy for Windows released on 25 March 2009
HTML Tidy for Windows version 5.9.14
Linux版
HTML Tidy for Linux version 5.6.0
下記から
https://www.html-tidy.org/
インストール
環境
AlmaLinux release 8.7 (Stone Smilodon)
梱包されるバージョン
tidy.x86_64 5.6.0-5.el8
下記でインストール
yum install tidy
perlでHTML::Tidy5を入れたいので下記も・・
yum install libtidy libtidy-devel
サーバーの内容によって下記も・・gccとcpanmをインストール
yum install gcc
yum install perl-App-cpanminus.noarch
CPANにHTML::TidyとHTML::Tidy5があるのでHTML::Tidy5を入れます。
cpanm Alien::Tidyp
cpanm HTML::Tidy5
HTML::Tidyもインストール可能ですが・・HTML5タグarticle,main,sectionなどがもれなく、クリーニングされます。
HTML::Tidy5使い方・・
show_warningsとか過去のオプションしてすると動作しないので注意が必要です。
use HTML::Tidy5;
my $html="html tag....";
my $tidy = HTML::Tidy5->new({config_file => 'htmltidy.cfg'});
my $cnv = $tidy->clean($html);
なんでPerl?
Movabletypeのプラグイン動かしたかったので・・・
プラグインはこれ・・・
あ・・そのままじゃ・・動かないですよ。。use HTML::Tidy5に作り替えましょう・・
https://github.com/movabletype/mt-plugin-tidings
番外
htmltidy.cfgは長年使っている・・・これ・・Windows版でも活躍中・・・・
indent-with-tabs:yes
quiet:yes
tidy-mark:no
new-blocklevel-tags:title,li
uppercase-tags:no
add-xml-decl:no
add-xml-space:no
ascii-chars:no
assume-xml-procins:no
bare:no
break-before-br:no
clean:no
decorate-inferred-ul:no
drop-empty-paras:no
drop-font-tags:no
drop-proprietary-attributes:no
enclose-block-text:no
enclose-text:no
escape-cdata:no
fix-backslash:yes
fix-bad-comments:yes
fix-uri:yes
hide-comments:no
hide-endtags:no
indent:auto
indent-attributes:no
indent-cdata:no
input-xml:no
join-classes:no
join-styles:no
literal-attributes:no
logical-emphasis:no
lower-literals:yes
markup:yes
ncr:yes
numeric-entities:no
output-html:no
output-xhtml:no
output-xml:no
preserve-entities:yes
punctuation-wrap:no
quote-ampersand:yes
quote-marks:yes
quote-nbsp:yes
replace-color:no
show-body-only:no
show-warnings:yes
split:no
uppercase-attributes:no
vertical-space:no
word-2000:no
wrap-asp:yes
wrap-attributes:no
wrap-jste:yes
wrap-php:yes
wrap-script-literals:no
wrap-sections:no
indent-spaces:4
tab-size:4
wrap:0
char-encoding:raw
input-encoding:raw
newline:CRLF
output-bom:auto
output-encoding:raw
WindowsではVCで自作のGUIを使っています。対象ディレクトリ指定して。ディレクトリ内を変換してくれます。htmltidy.cfgとかも入れてます。
良かったら・・・ノークレームで・・・
さいごに
おぼえがきです・・