Skip to content

Instantly share code, notes, and snippets.

@jude90
Last active April 30, 2016 13:24
Show Gist options
  • Save jude90/36c3e82886d6c64d447d to your computer and use it in GitHub Desktop.
Save jude90/36c3e82886d6c64d447d to your computer and use it in GitHub Desktop.
How to up a data box

windows 用户如何利用vagrant 搭建一个 数据科学实验环境

本文将启动一台虚拟机,其中预先安装了:

  • Python,包括 Python Notebook, NumPy, SciPy, matplotlib, pandas, scikit-learn 和 SymPy
  • R ,包括ggplot2, plyr, dplyr, lubridate, zoo, forecast, 和 sqldf

在看完这篇博客之后,你可以在一分钟(不包含镜像下载时间)内得到一个数据科学的实验环境,快速进行数据科学的学习和探索。

vagrant 是一个虚拟环境构建工具。在用vagrant 创建一个数据科学 工具箱之前。你需要:

  1. 安装virtualbox , vagrant 使用virtualbox 来运行虚拟机 。下载地址

  2. 安装vagrant 。在vagrant的官网下载vagrant的 windows安装包。 下载地址

  3. 打开你的git bash ,或者其他 shell 命令行工具。输入vagrant 如果输出

$ vagrant.exe
Usage: vagrant [options] <command> [<args>]

    -v, --version                    Print the version and exit.
    -h, --help                       Print this help.
....

说明vagrant 安装成功

  1. 创建 数据科学实验环境的 目录,比如一个 叫 ds_env 的文件夹。
  2. 进入ds_env 文件夹,执行命令 vagrant.exe init data-science-toolbox/dst,这条命令声明了虚拟机将要使用的镜像名,也就是 预先安装了
  3. 执行命令 vagrant.exe up 启动虚拟机。
  4. 等虚拟机启动后, 执行vagrant.exe ssh 登录虚拟机。
  5. 你已经有了自己的数据科学工具箱。开始探索吧。

PS: 如果你在第6步的 vagrant up 过程里遇到了问题,比如网速太慢,或者提示找不到镜像等 各种问题。可以在百度网盘 下载镜像文件,然后执行 vagrat box add 镜像文件路径 --name data-science-toolbox/dst 添加镜像。然后重复执行vagrant up

这是一个针对windows 用户(勇敢的小白)的指导手册,想了解更多的细节。可以参考: Vagrant 官方文档

Data Science toolbox 手册

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment