Skip to content

Instantly share code, notes, and snippets.

@ethan605
Last active August 29, 2015 14:17
Show Gist options
  • Save ethan605/a9f57394ed8b7743fca1 to your computer and use it in GitHub Desktop.
Save ethan605/a9f57394ed8b7743fca1 to your computer and use it in GitHub Desktop.
System admin Job descriptions
# Job descriptions
## 1. Mô tả công việc:
* Quản trị & bảo trì hàng ngày hệ thống servers sản phẩm trực tuyến phục vụ 100k người dùng
* Báo cáo hàng tuần các thông tin về hệ thống & người dùng
* Phát triển (mở rộng, nâng cấp) & quản lý hệ thống để phục vụ thêm nhiều người dùng
* Xử lý nóng khi có sự cố phát sinh
## 2. Yêu cầu Kỹ năng
* Sử dụng thành thạo hệ điều hành Linux (Ubuntu, Fedora, Debian, ...)
* Có kinh nghiệm quản trị các web server, web service nhiều người dùng (>= 200k người dùng, ưu tiên >= 1 triệu người dùng)
* Có kinh nghiệm làm việc với nginx
* Có kinh nghiệm maintain hệ thống, có thể lên list bảo trì hệ thống hàng ngày & thực hiện đúng để đảm bảo uptime 99%
* Có kinh nghiệm làm việc với các tools báo cáo & cảnh báo sự cố
## 3. Ưu tiên
* Có chứng chỉ CCNA, Linux LPI hoặc tương tự
* Có kinh nghiệm làm việc với MongoDB, Phusion Passenger
* Có kinh nghiệm lập trình web service với PHP hoặc Ruby on Rails
# Checklists
## Morning checklist
- Check các site online (tất cả các site đảm bảo hoạt động)
o Check API success (script)
o Check UI (bằng mắt rồi, vẫn áp dụng script được)
- Check port service online – Đảm bảo không có service nào bị treo cả (script)
o Port database
o Port website
o Port 22
o Các port dịch vụ cài đặt thêm
- Check Backup success
o Đảm bảo các bản backup hôm trước không lỗi, phải biết cách xem log của backup
- Ghi nhận performance hệ thống từ sáng hôm trước đến sáng nay
o Biểu đồ CPU
o Biểu đồ RAM
o Biểu đồ current connection
- Review sơ bộ log nginx (apache)
- Ghi nhận các cảnh báo nhận được từ hệ thống
- Kiểm tra lại danh sách Index trong database xem có thay đổi hay bổ sung gì.
## Weekly checklist
- Ghi nhận tăng trưởng dung lượng hàng tuần và xuất ra biểu đồ
- Biểu đồ high performance hàng ngày trong 1 tuần
o Ghi nhận các dịch vụ ảnh hưởng đến performance và % chiếm dụng (script)
- Thống kê số cảnh báo phát sinh trong tuần
- Dựng lại hệ thống từ 1 bản backup bất kì trong tuần (script)
## Các công cụ hàng ngày
- Htop
- Iotop
- Iostat
- Iftop
- 1 hệ thống monitor như prtg hoặc là nagios
- Sơ đồ network system
- Danh sách firewall hoặc sơ đồ các dịch vụ kết nối với nhau
- 1 bản word hoặc excel ghi lại lịch sử sửa chữa hệ thống.
## Các kiến thức cần biết
- CCNA
- Hardware
- Linux LPI
- Bash shell
- Database (SQL / MongoDB) indexing
- Nginx, phpfpm
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment