windows 用户如何利用vagrant 搭建一个 数据科学实验环境
本文将启动一台虚拟机,其中预先安装了:
- Python,包括 Python Notebook, NumPy, SciPy, matplotlib, pandas, scikit-learn 和 SymPy
- R ,包括ggplot2, plyr, dplyr, lubridate, zoo, forecast, 和 sqldf
在看完这篇博客之后,你可以在一分钟(不包含镜像下载时间)内得到一个数据科学的实验环境,快速进行数据科学的学习和探索。
vagrant 是一个虚拟环境构建工具。在用vagrant 创建一个数据科学 工具箱之前。你需要:
-
安装virtualbox , vagrant 使用virtualbox 来运行虚拟机 。下载地址
-
安装vagrant 。在vagrant的官网下载vagrant的 windows安装包。 下载地址
-
打开你的git bash ,或者其他 shell 命令行工具。输入
vagrant
如果输出
$ vagrant.exe
Usage: vagrant [options] <command> [<args>]
-v, --version Print the version and exit.
-h, --help Print this help.
....
说明vagrant 安装成功
- 创建 数据科学实验环境的 目录,比如一个 叫 ds_env 的文件夹。
- 进入ds_env 文件夹,执行命令
vagrant.exe init data-science-toolbox/dst
,这条命令声明了虚拟机将要使用的镜像名,也就是 预先安装了 - 执行命令
vagrant.exe up
启动虚拟机。 - 等虚拟机启动后, 执行
vagrant.exe ssh
登录虚拟机。 - 你已经有了自己的数据科学工具箱。开始探索吧。
PS: 如果你在第6步的 vagrant up
过程里遇到了问题,比如网速太慢,或者提示找不到镜像等 各种问题。可以在百度网盘 下载镜像文件,然后执行 vagrat box add 镜像文件路径 --name data-science-toolbox/dst
添加镜像。然后重复执行vagrant up
。
这是一个针对windows 用户(勇敢的小白)的指导手册,想了解更多的细节。可以参考: Vagrant 官方文档