NickTomlin · June 25, 2013 15:14
diff --git a/index.js b/index.js
 var Crawler = require('crawler').Crawler;
 var fs = require("fs");

 var pageCache = {};
 write = fs.createWriteStream('crawled.txt');

 write.on('error', function(err){
  console.log(err);
 });

 var posts = function(error, result, $) {
     $title = $('.entry-title').text();
     $content = $('.entry-content').html();


     console.log("====" + $title + "====");
     console.log($content);

     pageCache[$title] = $content;
     write.write($content);
 };

 var pages = function(error, result, $) {
   $next = $('.nav-previous a');
   $posts = $(".type-post .more-link");

   $next.each(function(index, a){
      c.queue(
        [{
          "uri": a.href,
          "callback": pages
        }]
      );
    });

   $posts.each(function(index, a ){
    c.queue(
      [{
        "uri": a.href,
        "callback": posts
      }]
    );
   });
 };

 var c = new Crawler({
  "maxConnections": 10,
  "callback": pages
 });

 c.queue("http://addyosmani.com/blog/");

 /*
 for each top level page, grab all the posts on the page,
 AND grab the next page link, if it exists.
 */
	var Crawler = require('crawler').Crawler;
	var fs = require("fs");

	var pageCache = {};
	write = fs.createWriteStream('crawled.txt');

	write.on('error', function(err){
	console.log(err);
	});

	var posts = function(error, result, $) {
	$title = $('.entry-title').text();
	$content = $('.entry-content').html();


	console.log("====" + $title + "====");
	console.log($content);

	pageCache[$title] = $content;
	write.write($content);
	};

	var pages = function(error, result, $) {
	$next = $('.nav-previous a');
	$posts = $(".type-post .more-link");

	$next.each(function(index, a){
	c.queue(
	[{
	"uri": a.href,
	"callback": pages
	}]
	);
	});

	$posts.each(function(index, a ){
	c.queue(
	[{
	"uri": a.href,
	"callback": posts
	}]
	);
	});
	};

	var c = new Crawler({
	"maxConnections": 10,
	"callback": pages
	});

	c.queue("http://addyosmani.com/blog/");

	/*
	for each top level page, grab all the posts on the page,
	AND grab the next page link, if it exists.
	*/