どこまで情報を取得できますか?

取得できるのは

  • タイトル
  • 本文
  • 投稿日
  • テーマ(カテゴリ)

となります。アメブロには対応していますが、他のブログサービスには調整が必要なこともございます。ご了承ください。

どんな風に保存されるの?

WordPressの投稿の1つとして、「下書き」状態で保存されます。

画像は、WordPressが設置されているサーバー内に、「ameblo_images」というフォルダを自動的に作成し、日付ごとのフォルダに分けて保存します。

例えば、2016年7月19日の記事であれば、「ameblo_images/20160719」というフォルダに、画像の名前を引き継いだ状態で保存されます。

アメブロの利用規約に違反しないの?

以下、Amebaの利用規約の一部を引用します。

第12条(知的財産権等)

  1. 本サービスを構成する文章、画像、プログラムその他一切の情報について発生している著作権その他の知的財産権、肖像権及びパブリシティ権その他の人格権ならびに所有権その他の財産権は、利用者が自ら作成したもの(第10条第2項に掲げる場合を除きます)に関する権利を除き、当社又は当該権利を有する第三者に帰属しています。
  2. 当社は、利用者が本サービスにおいて投稿、アップロード又は保存した全ての情報(文字情報、画像情報等を含みますがこれらに限られません)について、これらを保存・蓄積した上、本サービスの円滑な運営、改善、当社又は本サービスの宣伝告知等(第三者のメディアへの掲載を通じた紹介記事・コンテンツ等も含まれます。)を目的として、あらゆる態様で利用できるものとし、利用者はこれに同意するものとします。
  3. 利用者は、自己の著作物に関して、第三者の権利侵害等の問題が発生した場合、自己の費用と責任においてかかる問題を解決するとともに、当社に何等の迷惑又は損害を与えないものとします。

となっており、「自分で作成した文章と、撮影した写真」に関しては、あなた自身に著作権があります。

また、らくらくバックアップツールは、「下書き」として保存をするため、ご自身が作成したコンテンツを、ご自身の著作権と管理体制の元に、保存する行為となります。

「自分で作った内容を、自分の手元に保存をしておく」という目的のみに限ってツールを作成しているので、Ameba様の利用規約を遵守しているとともに、他のブログサービス様の利用規約にも則った運営を、自己責任の上でお願いいたします。

らくらく保存なのか、らくらくバックアップなのか、はっきりしてください

混乱させて大変申しわけありません。

「アメブロ 保存」という検索ワードと

「アメブロ バックアップ」という検索ワードだと

アメブロ 保存 のほうが優位だったので、そちらを前面に出していますが
ツールとしては、「らくらくバックアップ」で行きたいなぁ・・・と、思っています。

アクセス解析や順位を見ながら、統合してまいります。

どうしてアメブロを保存できるんですか?

技術的な話になり、恐縮ですが、お付き合いください。

アメブロらくらくバックアップは、記事の中にある要素を取得する仕組み(web scraping)を使っています。

ブログを取得する流れとしては、大まかに以下の通りです。

  1. あらかじめ、取得するタイトルや本文の場所を決めておく
  2. WordPressの自動処理を使って、定期的にFeedから最新情報のURLを見に行く
  3. 最新情報の「タイトル・投稿日・テーマ・本文(と、画像)」を取得する
  4. それぞれ、WordPressにバックグラウンド投稿する
  5. 本文の画像は、1つずつ分解して、指定のフォルダに保存する
  6. 本文の画像リンクは、URLを変更して、自分のサーバーのものを表示するようにする

といった処理をしています。

興味がある方は、「スクレイピング」などで検索をしてみてください。

ただし、あくまでも自分の書いた記事や画像を取得する目的で使うように、お願いいたします。

過去の記事をすべて取得するにはどうすればいいですか?

アメブロらくらくバックアップには、2つの取得パターンがあります。

  1. 新着情報を、Feedから取得する
  2. 過去の全記事を、URLリストから取得する

Feedから取得する場合は、自動的に最新10件を取得してくるだけですが、過去の全記事を取得するには、少しコツが必要となります。

過去の全記事を取得する方法

まずは、過去の全記事のURLリストが必要となります。

Macですと、SiteSuckerなどで、「ブログ名/entry-」というパスのhtmlをすべて取得します。

この時にできたファイルリストが、「全記事のリスト」となります。

Finderなどのファイルリストをすべて選択し、テキスト形式のリストに保存し直します。

それを、WordPressのメディアアップロードでアップロードし、アップした先のURLを、ブログ読み込み設定に記入すれば、全件取得を行います。

すべてのブログ記事を取得し終わったら、2重取得を防ぐために、全件取得のチェックは外しておきましょう。

過去の記事は何件まで取得できますか?

基本的には、取得する件数の上限はありません。

これまでの例ですと、1000件以上のアメブロ記事をWordPresに保存したことも数回あります。

コツとしては、100件単位くらいのリストにして、100件ずつ取得していくようにすると、処理が途中で止まってしまった場合でも、復旧することが容易になります。

サーバーに負荷はかかりますか?

はい、かなりかかります。

おそらく、普通に取得をするだけだと、サーバー上でプログラムが停止します。

なので、1記事を5秒ずつ間隔をあけて取得し、10件おきにさらに60秒ほど間隔をあけて取得しています。

なので、取得スピードはかなりゆっくりですが、サーバー上で自動的に動くプログラムとなるので、席を離れてパソコンを閉じていても、取得し続けてくれます。

ただ、やはりサーバーごとに負荷に耐えられる容量が決まっているので、プログラムが止まってしまう場合があります。

その場合は、サーバーに対応した取得間隔に修正をして、再チャレンジしていただく必要があります。その際には、有償サポートをご検討ください。

設定したのに動かない

申しわけありません。

その場合は、3つの可能性が考えられます。

  1. 設定方法が間違っている
  2. WordPressにアクセスがほとんどない
  3. プラグイン側の処理が間違っている

 

1.設定方法が間違っている

設定が間違っている恐れがあります。

もう一度、「ブログ読み込み設定」の内容をご確認ください。

どうしてもわからない場合は、設置サポートを行っていますので、サポートにご相談ください。

 

2.WordPressにアクセスがほとんどない

自動取得には、WP_Cronを利用しています。

これは、WordPressにアクセスがあった時に、起動する処理となります。

逆に言うと、WordPressへのアクセスが極端に少ない場合は、この処理が動かないということになり、自動取得ができません。

その場合は、アクセスがなくてもCronを動かせる処理を書く必要がありますので、サポートにご相談ください。

 

3.プラグイン側の処理が間違っている

申し訳ありません。

研究中のプラグインとなりますので、まれに不具合が出る恐れもございます。

その場合は、問題提起していただければ、こちらで修正対応して、公開してまいります。

ご指摘いただけると幸いです。