Keiichi Kuroyanagi Keiku

🐢

Slowly but surely.

Artificial Intelligence Engineer / Lightning AI Ambassador

Keiku / create_summary_report.r

Created February 2, 2017 08:25

Create a summary report.

Keiku / get_file_list.py

Last active February 7, 2017 03:18

Get a list of files.

	import os
	import glob

	# アスタリスクが必要
	files = glob.glob('/home/dir1/*.zip')
	for file in files:
	print(file)
	print('/home/dir2/' + os.path.basename(file))
	# /home/dir1/subset3.zip
	# /home/dir2/subset3.zip

Keiku / freq.py

Created February 7, 2017 04:44

Count frequency of a column in pasdas DataFrame.

	import pandas as pd
	from sklearn import datasets
	iris = datasets.load_iris()

	iris_df = pd.DataFrame(iris.data, columns=iris.feature_names)
	iris_df['species'] = iris.target
	mapping = {0 : 'setosa', 1: 'versicolor', 2: 'virginica'}
	iris_df = iris_df.replace({'species': mapping})

	def freq(data, var):

Keiku / intersection.py

Created February 7, 2017 04:52

Check intersection.

	import pandas as pd

	df1 = pd.DataFrame({'id': [1, 2, 3]})
	df2 = pd.DataFrame({'id': [2, 3, 4]})
	set(df1.id).intersection(set(df2.id))
	# Out[73]: {2, 3}

Keiku / cut.py

Created February 8, 2017 02:56

Cut a variable with pandas.

	import pandas as pd
	from sklearn import datasets
	iris = datasets.load_iris()

	iris_df = pd.DataFrame(iris.data, columns=iris.feature_names)
	iris_df['species'] = iris.target
	mapping = {0 : 'setosa', 1: 'versicolor', 2: 'virginica'}
	iris_df = iris_df.replace({'species': mapping})

	iris_df['sepal length (bins)'] = pd.cut(iris_df['sepal length (cm)'], bins=[0, 3, 6, 9], include_lowest=False, right=True)

Keiku / generate_c_code.r

Last active February 9, 2017 08:33

Generate c() function code.

	library(stringr)

	add_backquotes <- function(x) paste0("`", x, "`")
	add_doublequotes <- function(x) paste0("\"", x, "\"")

	generate_c_code <- function(x){
	vec <- paste0(add_doublequotes(x), sep=",\n")
	vec_tail <- str_replace(tail(vec, 1), ",\n", "\n")
	vec_head <- head(vec, length(vec) - 1)
	vec <- c(vec_head, vec_tail)

Keiku / chisq.test_by_group.r

Last active February 10, 2017 01:49

Chi-square testing in each group.

Keiku / chisq.test_by_group.r

Created February 10, 2017 01:48

Chi-square testing in each group.

Keiku / command.sh

Last active March 13, 2023 10:40

A list of linux commands.

	# compress/decompress zip file.
	zip file.csv.zip file.csv
	unzip file.csv.zip

	# compress/decompress gz file.
	gzip file.csv
	gzip -d file.csv.gz

	# compress/decompress bz2 file.
	bzip2 file.csv

Keiku / check_id_sets.r

Created February 16, 2017 06:41

Check duplicate id list of some tables.

	library(gplots)
	library(dplyr)
	library(magrittr)

	check_id_sets <- function(ids){
	ids_venn <- gplots::venn(ids, show.plot=FALSE)
	ids_list <- unlist(as.list(ids_venn))
	mat_dim <- c((length(ids_list) / (length(ids)+1)), length(ids)+1)
	id_sets <- ids_list %>%
	matrix(., mat_dim) %>%