feribg · January 7, 2019 20:12
diff --git a/nats-streaming-latency.go b/nats-streaming-latency.go
 package main

 import (
 	"crypto/rand"
 	"encoding/binary"
 	"flag"
 	"fmt"
 	"io"
 	"log"
 	"math"
 	"os"
 	"sort"
 	"sync"
 	"time"

 	"github.com/codahale/hdrhistogram"
 	"github.com/nats-io/go-nats"
 	"github.com/nats-io/go-nats-streaming"
 	"github.com/tylertreat/hdrhistogram-writer"
 )

 // Test Parameters
 var (
 	ServerA       string
 	ServerB       string
 	TargetPubRate int
 	MsgSize       int
 	NumPubs       int
 	TestDuration  time.Duration
 	HistFile      string
 	Secure        bool
 	TLSca         string
 	TLSkey        string
 	TLScert       string
 )

 var usageStr = `
 Usage: latency-tests [options]

 Test Options:
    -sa <url>        ServerA (Publish) (default: nats://localhost:4222)
    -sb <url>        ServerB (Subscribe) (default: nats://localhost:4222)
    -sz <int>        Message size in bytes (default: 8)
    -tr <int>        Rate in msgs/sec (default: 1000)
    -tt <string>     Test duration (default: 5s)
    -hist <file>     Histogram output file
    -secure          Enable TLS without verfication (default: false)
    -tls_ca <string> TLS Certificate CA file
    -tls_key <file>  TLS Private Key
    -tls_cert <file> TLS Certificate
 `

 func usage() {
 	log.Fatalf(usageStr + "\n")
 }


 func main() {
 	start := time.Now()

 	flag.StringVar(&ServerA, "sa", nats.DefaultURL, "ServerA - Publisher")
 	flag.StringVar(&ServerB, "sb", nats.DefaultURL, "ServerB - Subscriber")
 	flag.IntVar(&TargetPubRate, "tr", 1000, "Target Publish Rate")
 	flag.IntVar(&MsgSize, "sz", 8, "Message Payload Size")
 	flag.DurationVar(&TestDuration, "tt", 5*time.Second, "Target Test Time")
 	flag.StringVar(&HistFile, "hist", "", "Histogram and Raw Output")
 	flag.BoolVar(&Secure, "secure", false, "Use a TLS Connection w/o verification")
 	flag.StringVar(&TLSkey, "tls_key", "", "Private key file")
 	flag.StringVar(&TLScert, "tls_cert", "", "Certificate file")
 	flag.StringVar(&TLSca, "tls_ca", "", "Certificate CA file")

 	log.SetFlags(0)
 	flag.Usage = usage
 	flag.Parse()

 	NumPubs = int(TestDuration/time.Second) * TargetPubRate

 	if MsgSize < 8 {
 		log.Fatalf("Message Payload Size must be at least %d bytes\n", 8)
 	}

 	// Setup connection options
 	var opts []nats.Option
 	if Secure {
 		opts = append(opts, nats.Secure())
 	}
 	if TLSca != "" {
 		opts = append(opts, nats.RootCAs(TLSca))
 	}
 	if TLScert != "" {
 		opts = append(opts, nats.ClientCert(TLScert, TLSkey))
 	}

 	c1, err := stan.Connect("test-cluster", "clientId1")
 	if err != nil {
 		log.Fatalf("Could not connect to ServerA: %v", err)
 	}
 	c2, err := stan.Connect("test-cluster", "clientid2")
 	if err != nil {
 		log.Fatalf("Could not connect to ServerB: %v", err)
 	}

 	// Do some quick RTT calculations
 	log.Println("==============================")
 	now := time.Now()
 	c1.NatsConn().Flush()
 	log.Printf("Pub Server RTT : %v\n", fmtDur(time.Since(now)))

 	now = time.Now()
 	c2.NatsConn().Flush()
 	log.Printf("Sub Server RTT : %v\n", fmtDur(time.Since(now)))

 	// Duration tracking
 	durations := make([]time.Duration, 0, NumPubs)

 	// Wait for all messages to be received.
 	var wg sync.WaitGroup
 	wg.Add(1)

 	//Random subject (to run multiple tests in parallel)
 	subject := nats.NewInbox()

 	// Count the messages.
 	received := 0

 	// Async Subscriber (Runs in its own Goroutine)
 	c2.Subscribe(subject, func(msg *stan.Msg) {
 		sendTime := int64(binary.LittleEndian.Uint64(msg.Data))
 		durations = append(durations, time.Duration(time.Now().UnixNano()-sendTime))
 		received++
 		if received >= NumPubs {
 			wg.Done()
 		}
 	})
 	// Make sure interest is set for subscribe before publish since a different connection.
 	c2.NatsConn().Flush()

 	log.Printf("Message Payload: %v\n", byteSize(MsgSize))
 	log.Printf("Target Duration: %v\n", TestDuration)
 	log.Printf("Target Msgs/Sec: %v\n", TargetPubRate)
 	log.Printf("Target Band/Sec: %v\n", byteSize(TargetPubRate*MsgSize*2))
 	log.Println("==============================")

 	// Random payload
 	data := make([]byte, MsgSize)
 	io.ReadFull(rand.Reader, data)

 	// For publish throttling
 	delay := time.Second / time.Duration(TargetPubRate)
 	pubStart := time.Now()

 	// Throttle logic, crude I know, but works better then time.Ticker.
 	adjustAndSleep := func(count int) {
 		r := rps(count, time.Since(pubStart))
 		adj := delay / 20 // 5%
 		if adj == 0 {
 			adj = 1 // 1ns min
 		}
 		if r < TargetPubRate {
 			delay -= adj
 		} else if r > TargetPubRate {
 			delay += adj
 		}
 		if delay < 0 {
 			delay = 0
 		}
 		time.Sleep(delay)
 	}
 	ackHandler := func(ackedNuid string, err error) {
        if err != nil {
            log.Printf("Warning: error publishing msg id %s: %v\n", ackedNuid, err.Error())
        } 
    }

 	// Now publish
 	for i := 0; i < NumPubs; i++ {
 		now := time.Now()
 		// Place the send time in the front of the payload.
 		binary.LittleEndian.PutUint64(data[0:], uint64(now.UnixNano()))
 		c1.PublishAsync(subject, data, ackHandler)
 		adjustAndSleep(i + 1)
 	}
 	pubDur := time.Since(pubStart)
 	wg.Wait()
 	subDur := time.Since(pubStart)

 	// If we are writing to files, save the original unsorted data
 	if HistFile != "" {
 		if err := writeRawFile(HistFile+".raw", durations); err != nil {
 			log.Printf("Unable to write raw output file: %v", err)
 		}
 	}

 	sort.Slice(durations, func(i, j int) bool { return durations[i] < durations[j] })

 	h := hdrhistogram.New(1, int64(durations[len(durations)-1]), 5)
 	for _, d := range durations {
 		h.RecordValue(int64(d))
 	}

 	log.Printf("HDR Percentiles:\n")
 	log.Printf("10:       %v\n", fmtDur(time.Duration(h.ValueAtQuantile(10))))
 	log.Printf("50:       %v\n", fmtDur(time.Duration(h.ValueAtQuantile(50))))
 	log.Printf("75:       %v\n", fmtDur(time.Duration(h.ValueAtQuantile(75))))
 	log.Printf("90:       %v\n", fmtDur(time.Duration(h.ValueAtQuantile(90))))
 	log.Printf("99:       %v\n", fmtDur(time.Duration(h.ValueAtQuantile(99))))
 	log.Printf("99.99:    %v\n", fmtDur(time.Duration(h.ValueAtQuantile(99.99))))
 	log.Printf("99.999:   %v\n", fmtDur(time.Duration(h.ValueAtQuantile(99.999))))
 	log.Printf("99.9999:  %v\n", fmtDur(time.Duration(h.ValueAtQuantile(99.9999))))
 	log.Printf("99.99999: %v\n", fmtDur(time.Duration(h.ValueAtQuantile(99.99999))))
 	log.Printf("100:      %v\n", fmtDur(time.Duration(h.ValueAtQuantile(100.0))))
 	log.Println("==============================")

 	if HistFile != "" {
 		pctls := histwriter.Percentiles{10, 25, 50, 75, 90, 99, 99.9, 99.99, 99.999, 99.9999, 99.99999, 100.0}
 		histwriter.WriteDistributionFile(h, pctls, 1.0/1000000.0, HistFile+".histogram")
 	}

 	// Print results
 	log.Printf("Actual Msgs/Sec: %d\n", rps(NumPubs, pubDur))
 	log.Printf("Actual Band/Sec: %v\n", byteSize(rps(NumPubs, pubDur)*MsgSize*2))
 	log.Printf("Minimum Latency: %v", fmtDur(durations[0]))
 	log.Printf("Median Latency : %v", fmtDur(getMedian(durations)))
 	log.Printf("Maximum Latency: %v", fmtDur(durations[len(durations)-1]))
 	log.Printf("1st Sent Wall Time : %v", fmtDur(pubStart.Sub(start)))
 	log.Printf("Last Sent Wall Time: %v", fmtDur(pubDur))
 	log.Printf("Last Recv Wall Time: %v", fmtDur(subDur))
 }

 const fsecs = float64(time.Second)

 func rps(count int, elapsed time.Duration) int {
 	return int(float64(count) / (float64(elapsed) / fsecs))
 }

 // Just pretty print the byte sizes.
 func byteSize(n int) string {
 	sizes := []string{"B", "K", "M", "G", "T"}
 	base := float64(1024)
 	if n < 10 {
 		return fmt.Sprintf("%d%s", n, sizes[0])
 	}
 	e := math.Floor(logn(float64(n), base))
 	suffix := sizes[int(e)]
 	val := math.Floor(float64(n)/math.Pow(base, e)*10+0.5) / 10
 	f := "%.0f%s"
 	if val < 10 {
 		f = "%.1f%s"
 	}
 	return fmt.Sprintf(f, val, suffix)
 }

 func logn(n, b float64) float64 {
 	return math.Log(n) / math.Log(b)
 }

 // Make time durations a bit prettier.
 func fmtDur(t time.Duration) time.Duration {
 	// e.g 234us, 4.567ms, 1.234567s
 	return t.Truncate(time.Microsecond)
 }

 func getMedian(values []time.Duration) time.Duration {
 	l := len(values)
 	if l == 0 {
 		log.Fatalf("empty set")
 	}
 	if l%2 == 0 {
 		return (values[l/2-1] + values[l/2]) / 2
 	}
 	return values[l/2]
 }

 // writeRawFile creates a file with a list of recorded latency
 // measurements, one per line.
 func writeRawFile(filePath string, values []time.Duration) error {
 	f, err := os.Create(filePath)
 	if err != nil {
 		return err
 	}
 	defer f.Close()
 	for _, value := range values {
 		fmt.Fprintf(f, "%f\n", float64(value.Nanoseconds())/1000000.0)
 	}
 	return nil
 }
	package main

	import (
	"crypto/rand"
	"encoding/binary"
	"flag"
	"fmt"
	"io"
	"log"
	"math"
	"os"
	"sort"
	"sync"
	"time"

	"github.com/codahale/hdrhistogram"
	"github.com/nats-io/go-nats"
	"github.com/nats-io/go-nats-streaming"
	"github.com/tylertreat/hdrhistogram-writer"
	)

	// Test Parameters
	var (
	ServerA string
	ServerB string
	TargetPubRate int
	MsgSize int
	NumPubs int
	TestDuration time.Duration
	HistFile string
	Secure bool
	TLSca string
	TLSkey string
	TLScert string
	)

	var usageStr = `
	Usage: latency-tests [options]

	Test Options:
	-sa <url> ServerA (Publish) (default: nats://localhost:4222)
	-sb <url> ServerB (Subscribe) (default: nats://localhost:4222)
	-sz <int> Message size in bytes (default: 8)
	-tr <int> Rate in msgs/sec (default: 1000)
	-tt <string> Test duration (default: 5s)
	-hist <file> Histogram output file
	-secure Enable TLS without verfication (default: false)
	-tls_ca <string> TLS Certificate CA file
	-tls_key <file> TLS Private Key
	-tls_cert <file> TLS Certificate
	`

	func usage() {
	log.Fatalf(usageStr + "\n")
	}


	func main() {
	start := time.Now()

	flag.StringVar(&ServerA, "sa", nats.DefaultURL, "ServerA - Publisher")
	flag.StringVar(&ServerB, "sb", nats.DefaultURL, "ServerB - Subscriber")
	flag.IntVar(&TargetPubRate, "tr", 1000, "Target Publish Rate")
	flag.IntVar(&MsgSize, "sz", 8, "Message Payload Size")
	flag.DurationVar(&TestDuration, "tt", 5*time.Second, "Target Test Time")
	flag.StringVar(&HistFile, "hist", "", "Histogram and Raw Output")
	flag.BoolVar(&Secure, "secure", false, "Use a TLS Connection w/o verification")
	flag.StringVar(&TLSkey, "tls_key", "", "Private key file")
	flag.StringVar(&TLScert, "tls_cert", "", "Certificate file")
	flag.StringVar(&TLSca, "tls_ca", "", "Certificate CA file")

	log.SetFlags(0)
	flag.Usage = usage
	flag.Parse()

	NumPubs = int(TestDuration/time.Second) * TargetPubRate

	if MsgSize < 8 {
	log.Fatalf("Message Payload Size must be at least %d bytes\n", 8)
	}

	// Setup connection options
	var opts []nats.Option
	if Secure {
	opts = append(opts, nats.Secure())
	}
	if TLSca != "" {
	opts = append(opts, nats.RootCAs(TLSca))
	}
	if TLScert != "" {
	opts = append(opts, nats.ClientCert(TLScert, TLSkey))
	}

	c1, err := stan.Connect("test-cluster", "clientId1")
	if err != nil {
	log.Fatalf("Could not connect to ServerA: %v", err)
	}
	c2, err := stan.Connect("test-cluster", "clientid2")
	if err != nil {
	log.Fatalf("Could not connect to ServerB: %v", err)
	}

	// Do some quick RTT calculations
	log.Println("==============================")
	now := time.Now()
	c1.NatsConn().Flush()
	log.Printf("Pub Server RTT : %v\n", fmtDur(time.Since(now)))

	now = time.Now()
	c2.NatsConn().Flush()
	log.Printf("Sub Server RTT : %v\n", fmtDur(time.Since(now)))

	// Duration tracking
	durations := make([]time.Duration, 0, NumPubs)

	// Wait for all messages to be received.
	var wg sync.WaitGroup
	wg.Add(1)

	//Random subject (to run multiple tests in parallel)
	subject := nats.NewInbox()

	// Count the messages.
	received := 0

	// Async Subscriber (Runs in its own Goroutine)
	c2.Subscribe(subject, func(msg *stan.Msg) {
	sendTime := int64(binary.LittleEndian.Uint64(msg.Data))
	durations = append(durations, time.Duration(time.Now().UnixNano()-sendTime))
	received++
	if received >= NumPubs {
	wg.Done()
	}
	})
	// Make sure interest is set for subscribe before publish since a different connection.
	c2.NatsConn().Flush()

	log.Printf("Message Payload: %v\n", byteSize(MsgSize))
	log.Printf("Target Duration: %v\n", TestDuration)
	log.Printf("Target Msgs/Sec: %v\n", TargetPubRate)
	log.Printf("Target Band/Sec: %v\n", byteSize(TargetPubRateMsgSize2))
	log.Println("==============================")

	// Random payload
	data := make([]byte, MsgSize)
	io.ReadFull(rand.Reader, data)

	// For publish throttling
	delay := time.Second / time.Duration(TargetPubRate)
	pubStart := time.Now()

	// Throttle logic, crude I know, but works better then time.Ticker.
	adjustAndSleep := func(count int) {
	r := rps(count, time.Since(pubStart))
	adj := delay / 20 // 5%
	if adj == 0 {
	adj = 1 // 1ns min
	}
	if r < TargetPubRate {
	delay -= adj
	} else if r > TargetPubRate {
	delay += adj
	}
	if delay < 0 {
	delay = 0
	}
	time.Sleep(delay)
	}
	ackHandler := func(ackedNuid string, err error) {
	if err != nil {
	log.Printf("Warning: error publishing msg id %s: %v\n", ackedNuid, err.Error())
	}
	}

	// Now publish
	for i := 0; i < NumPubs; i++ {
	now := time.Now()
	// Place the send time in the front of the payload.
	binary.LittleEndian.PutUint64(data[0:], uint64(now.UnixNano()))
	c1.PublishAsync(subject, data, ackHandler)
	adjustAndSleep(i + 1)
	}
	pubDur := time.Since(pubStart)
	wg.Wait()
	subDur := time.Since(pubStart)

	// If we are writing to files, save the original unsorted data
	if HistFile != "" {
	if err := writeRawFile(HistFile+".raw", durations); err != nil {
	log.Printf("Unable to write raw output file: %v", err)
	}
	}

	sort.Slice(durations, func(i, j int) bool { return durations[i] < durations[j] })

	h := hdrhistogram.New(1, int64(durations[len(durations)-1]), 5)
	for _, d := range durations {
	h.RecordValue(int64(d))
	}

	log.Printf("HDR Percentiles:\n")
	log.Printf("10: %v\n", fmtDur(time.Duration(h.ValueAtQuantile(10))))
	log.Printf("50: %v\n", fmtDur(time.Duration(h.ValueAtQuantile(50))))
	log.Printf("75: %v\n", fmtDur(time.Duration(h.ValueAtQuantile(75))))
	log.Printf("90: %v\n", fmtDur(time.Duration(h.ValueAtQuantile(90))))
	log.Printf("99: %v\n", fmtDur(time.Duration(h.ValueAtQuantile(99))))
	log.Printf("99.99: %v\n", fmtDur(time.Duration(h.ValueAtQuantile(99.99))))
	log.Printf("99.999: %v\n", fmtDur(time.Duration(h.ValueAtQuantile(99.999))))
	log.Printf("99.9999: %v\n", fmtDur(time.Duration(h.ValueAtQuantile(99.9999))))
	log.Printf("99.99999: %v\n", fmtDur(time.Duration(h.ValueAtQuantile(99.99999))))
	log.Printf("100: %v\n", fmtDur(time.Duration(h.ValueAtQuantile(100.0))))
	log.Println("==============================")

	if HistFile != "" {
	pctls := histwriter.Percentiles{10, 25, 50, 75, 90, 99, 99.9, 99.99, 99.999, 99.9999, 99.99999, 100.0}
	histwriter.WriteDistributionFile(h, pctls, 1.0/1000000.0, HistFile+".histogram")
	}

	// Print results
	log.Printf("Actual Msgs/Sec: %d\n", rps(NumPubs, pubDur))
	log.Printf("Actual Band/Sec: %v\n", byteSize(rps(NumPubs, pubDur)MsgSize2))
	log.Printf("Minimum Latency: %v", fmtDur(durations[0]))
	log.Printf("Median Latency : %v", fmtDur(getMedian(durations)))
	log.Printf("Maximum Latency: %v", fmtDur(durations[len(durations)-1]))
	log.Printf("1st Sent Wall Time : %v", fmtDur(pubStart.Sub(start)))
	log.Printf("Last Sent Wall Time: %v", fmtDur(pubDur))
	log.Printf("Last Recv Wall Time: %v", fmtDur(subDur))
	}

	const fsecs = float64(time.Second)

	func rps(count int, elapsed time.Duration) int {
	return int(float64(count) / (float64(elapsed) / fsecs))
	}

	// Just pretty print the byte sizes.
	func byteSize(n int) string {
	sizes := []string{"B", "K", "M", "G", "T"}
	base := float64(1024)
	if n < 10 {
	return fmt.Sprintf("%d%s", n, sizes[0])
	}
	e := math.Floor(logn(float64(n), base))
	suffix := sizes[int(e)]
	val := math.Floor(float64(n)/math.Pow(base, e)*10+0.5) / 10
	f := "%.0f%s"
	if val < 10 {
	f = "%.1f%s"
	}
	return fmt.Sprintf(f, val, suffix)
	}

	func logn(n, b float64) float64 {
	return math.Log(n) / math.Log(b)
	}

	// Make time durations a bit prettier.
	func fmtDur(t time.Duration) time.Duration {
	// e.g 234us, 4.567ms, 1.234567s
	return t.Truncate(time.Microsecond)
	}

	func getMedian(values []time.Duration) time.Duration {
	l := len(values)
	if l == 0 {
	log.Fatalf("empty set")
	}
	if l%2 == 0 {
	return (values[l/2-1] + values[l/2]) / 2
	}
	return values[l/2]
	}

	// writeRawFile creates a file with a list of recorded latency
	// measurements, one per line.
	func writeRawFile(filePath string, values []time.Duration) error {
	f, err := os.Create(filePath)
	if err != nil {
	return err
	}
	defer f.Close()
	for _, value := range values {
	fmt.Fprintf(f, "%f\n", float64(value.Nanoseconds())/1000000.0)
	}
	return nil
	}