Life is Adventure!

Gallery2カストマイズ | Home | HTML5 Ruby

hao123 by 百度

hao123 toolbarが勝手にインストールされた。Gallery2 HTML5モジュールをインストールするときに気づいたのでキャンセルしたが、これを無視され強制的にインストールされた。Chromeでタブを開くと、スタートページでhao123のページが表示されてしまう。hao123の検索結果は中国語のページがほとんどになってしまう。困っている人がたくさんいる。Googleで、”hao123"を検索すれば、「勝手にインストールされた!」、「削除できない!」といったページが表示される。私も削除する方法を探すために余計な時間を取られてしまった。

[ツール]→[拡張機能]を開いて、hao123 toolbarを削除した。検索のデフォールトもhao123に変更されていたので、[設定]→[検索]で検索エンジンをGoogleに戻した。

hao123は、「百度 Baidu(バイドゥ)」の仕業だ。中国企業で、アジア最大の検索サービスで確かに業績を伸ばしているのだろうが、そのやり方にアンフェアなところがある。それを知ったのは数年前のことだ。個人的に困ったのは、自営サイトのクロールが頻繁に行われサーバの負荷が高まったことだ。

頻繁にクロールして最新のウェブ情報を提供すれば検索サービスは向上するだろうし、自分のサイトのアクセス数を増やそうとしている人/企業は歓迎することだろう。しかし、私はアクセスを増やそうという気はない。

不特定多数のアクセスが増えれば、必然的にスパムも増える。数年前にサイトの異常に気づいて調べたら、百度が頻繁にクロールしていた。中国語のスパムが急増していた。その処理に大変な時間を取られた。たまらなくなって、コメントとトラックバックを禁止し、「百度」からのアクセスを拒否するようにした。

トレンドマイクロもウィルス汚染の原因になったりしたので拒否した。Yetiも拒否。

〔参考〕 .htaccess 記述 (2008年に設定したので見直す必要がある)


## トレンドマイクロ、百度、Yetiクローラのアクセス禁止

SetEnvIf User-Agent "Arachmo" deny_ua
SetEnvIf User-Agent "Yeti" deny_ua
SetEnvIf User-Agent "Baidu" deny_ua
order allow,deny
allow from all
#baidu
deny from 119.63.192.
deny from 119.63.193.
deny from 119.63.194.
deny from 119.63.195.
deny from 119.63.196.
deny from 119.63.197.
deny from 119.63.198.
deny from 119.63.199.
#Trendmicro
deny from 216.104.15.
deny from 150.70.84.
deny from env=deny_ua


もちろん、robots.txtでクロールを拒否するようにしたが、これを無視する礼儀知らずの検索エンジンがあるので、.htaccess でも拒否するようにした。

今日の言葉: 

counter