chrisseto · December 13, 2023 21:12
diff --git a/README.md b/README.md
diff --git a/main.go b/main.go
 package main

 import (
        "bytes"
        "context"
        "encoding/csv"
        "encoding/json"
        "io"
        "log"
        "os"
        "regexp"
        "strings"
        "time"

        "github.com/jackc/pgx/v5"
        "github.com/jackc/pgx/v5/pgconn"
 )

 func Must(err error) {
        if err != nil {
                panic(err)
        }
 }

 func MustT[T any](r T, err error) T {
        Must(err)
        return r
 }

 var connections = map[string]*pgx.Conn{}

 func getConn(ctx context.Context, id string) *pgx.Conn {
        if conn, ok := connections[id]; ok {
                return conn
        }

        conn := MustT(pgx.Connect(ctx, os.Args[2]))

        connections[id] = conn

        return conn
 }

 func main() {
        ctx := context.Background()

        script := MustT(os.ReadFile(os.Args[1]))

        reader := csv.NewReader(bytes.NewReader(script))

        // Eat header
        _, _ = reader.Read()

        var lastTS time.Time
        for i := 0; ; i++ {
                record, err := reader.Read()
                if err != nil {
                        if err == io.EOF {
                                return
                        }
                }

                connID := record[0]
                ts := MustT(time.Parse("2006-01-02 15:04:05.999999", record[1]))
                sql := record[2]
                error := record[4]

                var args []any
                if record[3] != "" {
                        x := regexp.MustCompile(`\[\]string\{([^}]+)\}`).ReplaceAllString(record[3], "[$1]")
                        Must(json.Unmarshal([]byte(x), &args))
                }

                conn := getConn(ctx, connID)

                if !lastTS.IsZero() {
                        time.Sleep(ts.Sub(lastTS))
                }

                lastTS = ts

                log.Printf("%q: %q %v", connID, sql, args)
                rows, err := conn.Query(ctx, sql, args...)

                var out []map[string]any
                if err == nil {
                        out, err = pgx.CollectRows(rows, pgx.RowToMap)
                }

                if err != nil {
                        if error == "" {
                                panic(err)
                        }

                        pgErr := err.(*pgconn.PgError)

                        errorsMatch := err.Error() == error
                        isRetryErr := pgErr.Code == "40001" && strings.HasSuffix(error, "(SQLSTATE 40001)")

                        if errorsMatch || isRetryErr {
                                log.Printf("%s: %#v", connID, err)
                        } else {
                                log.Printf("%q: UNEXPECTED ERROR", connID)
                                log.Printf("EXPECTED: %s", error)
                                log.Printf("GOT: %#v", err)
                                return
                        }
                } else {
                        if error != "" {
                                log.Printf("%q: Expected %q got no error", connID, error)
                                return
                        }
                        // jsonified := MustT(json.MarshalIndent(out, "", "\t"))
                        jsonified := MustT(json.Marshal(out))
                        log.Printf("%q: %s", connID, jsonified)
                }
        }
 }
diff --git a/otlp-duck.fish b/otlp-duck.fish
 function otlp-duck
 	set filename $argv[1]
 	set script "CREATE OR REPLACE TABLE spans AS
 WITH
 	unwrapped_spans AS (
 		SELECT unnest(spans.spans, recursive := true) FROM (SELECT unnest(instrumentation_library_spans) AS spans  FROM ( SELECT unnest(resource_spans, recursive:=true) FROM read_ndjson_auto('$filename')))
 	), span_attrs AS (
 		SELECT
 			span_id,
 			json_group_object(key, COALESCE(value->'StringValue', value->'BoolValue', value->'IntValue', value->'ArrayValue')) as attributes,
 		FROM (SELECT span_id, key, Value::JSON as value  FROM (SELECT span_id, unnest(attributes, max_depth:=3) FROM unwrapped_spans))
 		GROUP BY span_id
 	)
 SELECT
 	trace_id,
    unwrapped_spans.span_id,
    parent_span_id,
    name,
 	make_timestamp(start_time_unix_nano//1000) as start,
 	make_timestamp(end_time_unix_nano//1000) as end,
 	message as error,
 	span_attrs.attributes,
 FROM unwrapped_spans JOIN span_attrs ON span_attrs.span_id = unwrapped_spans.span_id;"

 	duckdb -init (echo $script | psub)
 end
	package main

	import (
	"bytes"
	"context"
	"encoding/csv"
	"encoding/json"
	"io"
	"log"
	"os"
	"regexp"
	"strings"
	"time"

	"github.com/jackc/pgx/v5"
	"github.com/jackc/pgx/v5/pgconn"
	)

	func Must(err error) {
	if err != nil {
	panic(err)
	}
	}

	func MustT[T any](r T, err error) T {
	Must(err)
	return r
	}

	var connections = map[string]*pgx.Conn{}

	func getConn(ctx context.Context, id string) *pgx.Conn {
	if conn, ok := connections[id]; ok {
	return conn
	}

	conn := MustT(pgx.Connect(ctx, os.Args[2]))

	connections[id] = conn

	return conn
	}

	func main() {
	ctx := context.Background()

	script := MustT(os.ReadFile(os.Args[1]))

	reader := csv.NewReader(bytes.NewReader(script))

	// Eat header
	_, _ = reader.Read()

	var lastTS time.Time
	for i := 0; ; i++ {
	record, err := reader.Read()
	if err != nil {
	if err == io.EOF {
	return
	}
	}

	connID := record[0]
	ts := MustT(time.Parse("2006-01-02 15:04:05.999999", record[1]))
	sql := record[2]
	error := record[4]

	var args []any
	if record[3] != "" {
	x := regexp.MustCompile(`\[\]string\{([^}]+)\}`).ReplaceAllString(record[3], "[$1]")
	Must(json.Unmarshal([]byte(x), &args))
	}

	conn := getConn(ctx, connID)

	if !lastTS.IsZero() {
	time.Sleep(ts.Sub(lastTS))
	}

	lastTS = ts

	log.Printf("%q: %q %v", connID, sql, args)
	rows, err := conn.Query(ctx, sql, args...)

	var out []map[string]any
	if err == nil {
	out, err = pgx.CollectRows(rows, pgx.RowToMap)
	}

	if err != nil {
	if error == "" {
	panic(err)
	}

	pgErr := err.(*pgconn.PgError)

	errorsMatch := err.Error() == error
	isRetryErr := pgErr.Code == "40001" && strings.HasSuffix(error, "(SQLSTATE 40001)")

	if errorsMatch \|\| isRetryErr {
	log.Printf("%s: %#v", connID, err)
	} else {
	log.Printf("%q: UNEXPECTED ERROR", connID)
	log.Printf("EXPECTED: %s", error)
	log.Printf("GOT: %#v", err)
	return
	}
	} else {
	if error != "" {
	log.Printf("%q: Expected %q got no error", connID, error)
	return
	}
	// jsonified := MustT(json.MarshalIndent(out, "", "\t"))
	jsonified := MustT(json.Marshal(out))
	log.Printf("%q: %s", connID, jsonified)
	}
	}
	}
	function otlp-duck
	set filename $argv[1]
	set script "CREATE OR REPLACE TABLE spans AS
	WITH
	unwrapped_spans AS (
	SELECT unnest(spans.spans, recursive := true) FROM (SELECT unnest(instrumentation_library_spans) AS spans FROM ( SELECT unnest(resource_spans, recursive:=true) FROM read_ndjson_auto('$filename')))
	), span_attrs AS (
	SELECT
	span_id,
	json_group_object(key, COALESCE(value->'StringValue', value->'BoolValue', value->'IntValue', value->'ArrayValue')) as attributes,
	FROM (SELECT span_id, key, Value::JSON as value FROM (SELECT span_id, unnest(attributes, max_depth:=3) FROM unwrapped_spans))
	GROUP BY span_id
	)
	SELECT
	trace_id,
	unwrapped_spans.span_id,
	parent_span_id,
	name,
	make_timestamp(start_time_unix_nano//1000) as start,
	make_timestamp(end_time_unix_nano//1000) as end,
	message as error,
	span_attrs.attributes,
	FROM unwrapped_spans JOIN span_attrs ON span_attrs.span_id = unwrapped_spans.span_id;"

	duckdb -init (echo $script \| psub)
	end