Sotaro Takeshita / 竹下颯太郎 sobamchan

Hello.

sobamchan / asyncio_api_encoder.py

Last active April 22, 2025 14:03

asyncio api encoder

	import asyncio
	from dataclasses import dataclass

	from openai import AsyncOpenAI
	from tqdm.asyncio import tqdm_asyncio

	@dataclass
	class AsyncEncoder:
	client: AsyncOpenAI
	model_name: str

sobamchan / medium-sister-en-text-classification.py

Created March 22, 2020 01:23

	import numpy as np
	from lineflow import datasets
	from sklearn.svm import SVC

	import sister


	def main():
	train = datasets.Imdb("train")
	test = datasets.Imdb("test")

sobamchan / sister-ja-text-classification-build-dataset.py

Created March 21, 2020 03:10

	from pathlib import Path
	import tarfile
	import wget
	import pandas as pd


	URL = "https://www.rondhuit.com/download/ldcc-20140209.tar.gz"
	SAVETO = Path("./livedoor-news-data.tar.gz")
	DATASET_PATH = Path("dataset")

sobamchan / sister-basic.py

Created December 2, 2019 12:37

	import sister
	embedder = sister.MeanEmbedding(lang="en")

	sentence = "I am a dog."
	vector = embedder(sentence) # 300-dim vector

sobamchan / pl-bert-data-preprocessing.py

Created November 11, 2019 09:21

	from typing import Dict
	from functools import partial

	import lineflow as lf
	import lineflow.datasets as lfds
	import lineflow.cross_validation as lfcv

	from transformers import BertTokenizer

	MAX_LEN = 256

sobamchan / pl-bert-training-step.py

Created November 10, 2019 12:35

	def training_step(self, batch, batch_idx):
	labels = batch["label"]
	input_ids = batch["input_ids"]
	attention_mask = batch["attention_mask"]
	token_type_ids = batch["token_type_ids"]

	loss, _ = self.model(
	input_ids,
	token_type_ids=token_type_ids,
	attention_mask=attention_mask,

sobamchan / pl-bert-data-loader.py

Created November 10, 2019 12:34

	@pl.data_loader
	def train_dataloader(self):
	return self._train_dataloader

sobamchan / pl-bert-configure-optimizers.py

Last active November 10, 2019 12:34

pl-bert

	def configure_optimizers(self):
	param_optimizer = list(self.model.named_parameters())
	no_decay = ["bias", "gamma", "beta"]
	optimizer_grouped_parameters = [
	{
	"params": [p for n, p in param_optimizer if not any(nd in n for nd in no_decay)],
	"weight_decay_rate": 0.01
	},
	{
	"params": [p for n, p in param_optimizer if any(nd in n for nd in no_decay)],

sobamchan / mrpc.md

Created November 5, 2019 12:53

import lineflow.datasets as lfds

train = lfds.MsrParaphrase('train')
test = lfds.MsrParaphrase('test')

The item in this dataset as follows:

sobamchan / pytorch-lightning-transformers-mrpc.py

Last active October 18, 2019 08:31

	from typing import List, Dict, Callable
	from collections import OrderedDict
	from functools import partial

	import lineflow as lf
	import lineflow.datasets as lfds
	import lineflow.cross_validation as lfcv

	import torch
	from torch.utils.data import DataLoader, SequentialSampler, RandomSampler

Sotaro Takeshita / 竹下 颯太郎 sobamchan