Keep Coding!

A fearless adventure in knowing what to do when no one’s there telling you what to do.

kimonolabsの使い方な話。(設定変更編)

kimonoのサービスは終了したようです

jp.techcrunch.com

kimonoの仕組み?

kimonoの使い方 基礎編の続きです。

kimonoの動作の流れとしては、 1.スクレイピング 2.kimonolabsサーバに保存 3.kimono APIの呼び出し 4.kimonolabsからデータを取得 のようになっています。

kimono APIを呼び出した時に、対象のWebページに、直接アクセスする訳ではないようです。

なので、kimonoを使って一定時間毎にデータを取得したい時には、"kimonoがスクレイピングするタイミング"と"kimono APIを呼び出すタイミング"に気をつけなければいけないようです。

kimono クローラーの設定

前置きが長くなりましたが、今回は、そんなkimonoのクローラーの設定についてです。

とりあえず、クローラーの設定画面を開きましょう。 CRAWL SETTINGタブです。

ac.png

今回は、クローリングのタイミングの設定と、クローリング対象ページの設定を行いたいと思います。

クローリング頻度

kimonoは、どのタイミングでクローリングを行うか決めることができます。

aa.png

2015/7/16時点では、「手動」「毎時間」「毎日」「毎週」「毎月」のタイミングから選べます。 ちなみに、手動以外は、前回のクローリング実行時を基準としているようです。

クローリング対象URLの設定

クローリング対象は、最初に作成した時のページ以外も指定出来たりします。 左のCRAWL STRATEGYです。

ab.png

CRAWL STRATEGYのGenerated URL listを選択します。 すると下にURL GENERATERが表示されるので、これを使って設定していきます。

ページ数なんかを設定して、検索結果とか記事一覧とかが複数ページに分かれているときに使うと便利です。

おわり

クローラーの設定をしました。上手く設定できるとアンテナサイトが作れそうな感じがしますね。