Nora Belrose norabelrose

Head of Interpretability Research at EleutherAI

norabelrose / inference_server.py

Last active September 28, 2023 08:18

	from dataclasses import dataclass
	from functools import partial
	from itertools import cycle
	import logging
	import multiprocessing as std_mp
	import socket
	import warnings

	import dill
	import os

norabelrose / rlace-cleaned.py

Last active April 14, 2023 22:02

	from dataclasses import dataclass
	from elk.metrics import to_one_hot
	from elk.training import Classifier
	from scipy.optimize import brentq
	from sklearn.datasets import make_classification
	from sklearn.linear_model import LogisticRegression
	from torch import Tensor
	import numpy as np
	import torch
	import torch.nn.functional as F

norabelrose / bnsl.py

Last active March 4, 2023 06:05

	from itertools import product
	from scipy.optimize import curve_fit
	from typing import NamedTuple, Sequence
	import numpy as np


	class Break(NamedTuple):
	c: float
	d: float
	f: float

norabelrose / cbe.py

Created January 5, 2023 08:39

Causal basis extraction

	from copy import deepcopy
	from einops import rearrange
	from tqdm.auto import tqdm, trange
	from transformers import PreTrainedModel
	from typing import (
	Literal, NamedTuple, Optional, Union, Sequence
	)
	from white_box import TunedLens
	from white_box.causal import ablate_subspace, remove_subspace
	from white_box.nn import Decoder

norabelrose / r-nn-svd.py

Last active January 2, 2023 08:34

Relaxed non-negative SVD

	import torch as th
	import torch.nn.functional as F


	# Sinkhorn-Knopp algorithm for projecting onto doubly stochastic matrices
	def sinkhorn_knopp(A: th.Tensor, max_iter: int = 20):
	A = A.clone()

	for _ in range(max_iter):
	A /= A.sum(dim=1, keepdim=True)