rwightman · July 13, 2022 03:55
diff --git a/compare_ln.md b/compare_ln.md
diff --git a/rtx3090-convnext-all-by_infer.csv b/rtx3090-convnext-all-by_infer.csv
diff --git a/rtx3090-convnext-all-by_train.csv b/rtx3090-convnext-all-by_train.csv
diff --git a/rtx3090-convnext-eager-by_infer.csv b/rtx3090-convnext-eager-by_infer.csv
diff --git a/rtx3090-convnext-eager-by_train.csv b/rtx3090-convnext-eager-by_train.csv
diff --git a/v100-convnext-all-by_infer.csv b/v100-convnext-all-by_infer.csv
diff --git a/v100-convnext-all-by_train.csv b/v100-convnext-all-by_train.csv
diff --git a/v100-convnext-eager-by_infer.csv b/v100-convnext-eager-by_infer.csv
diff --git a/v100-convnext-eager-by_train.csv b/v100-convnext-eager-by_train.csv
model	fmt	cg	layer	infer_samples_per_sec	infer_step_time	infer_batch_size	infer_img_size	train_samples_per_sec	train_step_time	train_batch_size	train_img_size	param_count	infer_gmacs	infer_macts
convnext_tiny	nhwc	torchscript	permute	3364.46	76.075	256	224	877.71	144.926	128	224	28.59
convnext_tiny	nchw	torchscript	permute	3330.51	76.85	256	224	861.39	147.693	128	224	28.59
convnext_tiny	nhwc	torchscript	rw_hack	3299.9	77.564	256	224	765.84	166.191	128	224	28.59
convnext_tiny	nchw	torchscript	rw_hack	3277.37	78.096	256	224	775.44	164.174	128	224	28.59
convnext_tiny_c	nhwc	torchscript	permute	2837.58	90.203	256	224	811.07	156.88	128	224	28.59
convnext_tiny_c	nchw	torchscript	permute	2805.44	91.234	256	224	798.45	159.418	128	224	28.59
convnext_tiny	nhwc	aot	ng_hack	2743.59	93.293	256	224	827.46	153.853	128	224	28.59
convnext_tiny	nhwc	aot	rw_hack	2729.9	93.761	256	224	734.61	173.385	128	224	28.59
convnext_tiny_c	nhwc	torchscript	rw_hack	2699.6	94.813	256	224	601.07	211.979	128	224	28.59
convnext_tiny_c	nchw	torchscript	rw_hack	2694.33	94.999	256	224	605.98	210.22	128	224	28.59
convnext_tiny	nhwc	aot	permute	2668.55	95.917	256	224	819.95	155.287	128	224	28.59
convnext_tiny	nchw	aot	rw_hack	2651.38	96.539	256	224	782.49	162.762	128	224	28.59
convnext_tiny	nchw	aot	permute	2634.11	97.171	256	224	788.72	161.334	128	224	28.59
convnext_tiny_c	nhwc	aot	ng_hack	2607.56	98.162	256	224	799.89	319.219	256	224	28.59
convnext_tiny_c	nhwc	aot	rw_hack	2597.44	98.543	256	224	606.81	420.99	256	224	28.59
convnext_tiny_c	nchw	aot	rw_hack	2552.02	100.299	256	224	647.69	394.423	256	224	28.59
convnext_tiny	nchw	aot	ng_hack	2509.07	102.013	256	224	763.84	166.723	128	224	28.59
convnext_tiny_c	nhwc	eager	rw_hack_ts	2487.57	102.897	256	224	646.34	395.096	256	224	28.59
convnext_tiny_c	nchw	aot	permute	2382.17	107.45	256	224	770.43	331.449	256	224	28.59
convnext_tiny_c	nhwc	aot	permute	2309.24	110.833	256	224	747.49	341.568	256	224	28.59
convnext_tiny	nhwc	eager	rw_hack_ts	2298.36	111.369	256	224	724.19	352.506	256	224	28.59
convnext_tiny_c	nhwc	eager	permute	2288.94	111.828	256	224	794.23	321.435	256	224	28.59	4.47	13.44
convnext_tiny_c	nchw	eager	permute	2285.72	111.986	256	224	790.3	323.035	256	224	28.59	4.47	13.44
convnext_tiny	nhwc	eager	permute	2250.61	113.733	256	224	792.56	322.103	256	224	28.59	4.47	13.44
convnext_tiny	nchw	eager	permute	2232.09	114.674	256	224	791.37	322.585	256	224	28.59	4.47	13.44
convnext_tiny	nhwc	eager	ng_hack	2217.22	115.445	256	224	787.31	324.191	256	224	28.59
convnext_tiny	nchw	eager	rw_hack_ts	2195.18	116.602	256	224	766.21	333.081	256	224	28.59
convnext_tiny	nchw	eager	rw_hack	2165.01	118.229	256	224	759.56	336.101	256	224	28.59
convnext_tiny	nhwc	eager	rw_hack	2163.16	118.331	256	224	751.81	339.603	256	224	28.59
convnext_tiny_c	nhwc	eager	ng_hack	2162.07	118.39	256	224	763.11	334.57	256	224	28.59
convnext_tiny	nchw	eager	ng_hack	2100.81	121.843	256	224	733.75	347.957	256	224	28.59
convnext_tiny_c	nchw	eager	rw_hack	2090.56	122.44	256	224	685.44	372.539	256	224	28.59
convnext_tiny_c	nhwc	eager	rw_hack	2080.55	123.031	256	224	680.73	375.149	256	224	28.59
convnext_tiny_c	nchw	eager	rw_hack_ts	1999.74	128.002	256	224	671.62	380.171	256	224	28.59
convnext_small	nhwc	torchscript	permute	1927.41	132.805	256	224	504.01	252.232	128	224	50.22
convnext_small	nchw	torchscript	permute	1916.93	133.531	256	224	508.55	249.996	128	224	50.22
convnext_small	nhwc	torchscript	rw_hack	1906.58	134.258	256	224	473.71	268.535	128	224	50.22
convnext_small	nchw	torchscript	rw_hack	1898.71	134.811	256	224	477.39	266.497	128	224	50.22
convnext_small_c	nchw	torchscript	permute	1652.98	154.855	256	224	473.78	268.408	128	224	50.22
convnext_small	nhwc	aot	ng_hack	1614.36	158.559	256	224	498.73	255.192	128	224	50.22
convnext_small	nhwc	aot	rw_hack	1613.63	158.631	256	224	465.18	273.701	128	224	50.22
convnext_small_c	nhwc	torchscript	rw_hack	1607.13	159.274	256	224	346.62	182.939	64	224	50.22
convnext_small_c	nchw	torchscript	rw_hack	1604.59	159.525	256	224	349.37	181.504	64	224	50.22
convnext_small_c	nhwc	torchscript	permute	1595.57	160.421	256	224	458.92	277.03	128	224	50.22
convnext_small	nhwc	aot	permute	1590.94	160.892	256	224	493.49	257.925	128	224	50.22
convnext_small	nchw	aot	rw_hack	1587.74	161.22	256	224	481.35	264.473	128	224	50.22
convnext_small	nchw	aot	permute	1564.47	163.612	256	224	490.25	259.414	128	224	50.22
convnext_small_c	nhwc	aot	rw_hack	1548.09	165.347	256	224	371.33	343.245	128	224	50.22
convnext_small	nchw	aot	ng_hack	1532.08	167.074	256	224	474.15	268.507	128	224	50.22
convnext_small_c	nchw	aot	rw_hack	1530.51	167.249	256	224	380.85	334.595	128	224	50.22
convnext_small_c	nhwc	aot	ng_hack	1521.95	168.187	256	224	457.44	278.213	128	224	50.22
convnext_small_c	nhwc	eager	rw_hack_ts	1479.75	172.985	256	224	371.02	343.251	128	224	50.22
convnext_small_c	nhwc	aot	permute	1451.85	176.308	256	224	457.4	278.366	128	224	50.22
convnext_small_c	nchw	aot	permute	1442.18	177.493	256	224	453.51	280.621	128	224	50.22
convnext_tiny_c	nchw	aot	ng_hack	1416.88	180.661	256	224	438.08	583.537	256	224	28.59
convnext_small_c	nchw	eager	permute	1389.39	184.239	256	224	462.57	275.083	128	224	50.22	8.71	21.56
convnext_small_c	nhwc	eager	permute	1387.23	184.523	256	224	464.43	274.049	128	224	50.22	8.71	21.56
convnext_tiny_c	nchw	eager	ng_hack	1375.98	186.032	256	224	441.37	579.066	256	224	28.59
convnext_small	nhwc	eager	rw_hack_ts	1367.93	187.128	256	224	438.44	290.306	128	224	50.22
convnext_small	nchw	eager	permute	1351.2	189.446	256	224	461.49	275.767	128	224	50.22	8.71	21.56
convnext_small	nhwc	eager	ng_hack	1339.83	191.053	256	224	461.05	276.022	128	224	50.22
convnext_small	nchw	eager	rw_hack_ts	1338.01	191.312	256	224	453.84	280.375	128	224	50.22
convnext_small	nhwc	eager	permute	1333.5	191.956	256	224	461.32	275.83	128	224	50.22	8.71	21.56
convnext_small	nchw	eager	rw_hack	1328.35	192.703	256	224	450.11	282.768	128	224	50.22
convnext_small	nhwc	eager	rw_hack	1324.29	193.296	256	224	447.81	284.127	128	224	50.22
convnext_small_c	nhwc	eager	ng_hack	1321.24	193.739	256	224	448.36	283.776	128	224	50.22
convnext_small	nchw	eager	ng_hack	1293.56	197.885	256	224	441.5	288.235	128	224	50.22
convnext_base	nchw	torchscript	permute	1287.32	198.845	256	224	322.5	196.805	64	224	88.59
convnext_base	nhwc	torchscript	rw_hack	1283.11	199.497	256	224	297.33	213.607	64	224	88.59
convnext_base	nchw	torchscript	rw_hack	1278.18	200.266	256	224	306.72	206.975	64	224	88.59
convnext_small_c	nchw	eager	rw_hack	1269.52	201.632	256	224	398.95	319.187	128	224	50.22
convnext_small_c	nhwc	eager	rw_hack	1268.07	201.866	256	224	398.03	319.951	128	224	50.22
convnext_base	nhwc	torchscript	permute	1250.67	204.67	256	224	311.85	203.505	64	224	88.59
convnext_small_c	nchw	eager	rw_hack_ts	1210.47	211.473	256	224	389.84	326.674	128	224	50.22
convnext_base_c	nchw	torchscript	permute	1120.65	228.42	256	224	304.39	208.473	64	224	88.59
convnext_base	nhwc	aot	ng_hack	1119.98	228.558	256	224	324.59	195.7	64	224	88.59
convnext_base	nhwc	aot	rw_hack	1116.84	229.198	256	224	297.31	213.705	64	224	88.59
convnext_base_c	nhwc	torchscript	permute	1111.51	230.293	256	224	301.68	210.307	64	224	88.59
convnext_base	nhwc	aot	permute	1110.2	230.569	256	224	314.73	201.687	64	224	88.59
convnext_base	nchw	aot	rw_hack	1105.11	231.634	256	224	311.86	203.775	64	224	88.59
convnext_base_c	nhwc	torchscript	rw_hack	1102.76	232.127	256	224	229.42	277.173	64	224	88.59
convnext_base	nchw	aot	permute	1100.94	232.51	256	224	320.76	197.961	64	224	88.59
convnext_base_c	nchw	torchscript	rw_hack	1100.6	232.582	256	224	234.78	270.831	64	224	88.59
convnext_base_c	nhwc	aot	rw_hack	1068.56	239.558	256	224	250.93	508.62	128	224	88.59
convnext_base	nchw	aot	ng_hack	1064.84	240.394	256	224	310.86	204.438	64	224	88.59
convnext_base_c	nchw	aot	rw_hack	1057.34	242.099	256	224	261.65	487.764	128	224	88.59
convnext_base_c	nhwc	aot	ng_hack	1043.95	245.203	256	224	312.98	407.53	128	224	88.59
convnext_base_c	nhwc	eager	rw_hack_ts	1020.57	250.823	256	224	246.93	516.607	128	224	88.59
convnext_base_c	nchw	aot	permute	1008.67	253.78	256	224	316.45	402.965	128	224	88.59
convnext_base_c	nhwc	aot	permute	975.86	262.308	256	224	301.41	423.09	128	224	88.59
convnext_base_c	nhwc	eager	permute	975.5	262.412	256	224	323.27	394.372	128	224	88.59	15.38	28.75
convnext_base_c	nchw	eager	permute	972.0	263.354	256	224	322.5	395.237	128	224	88.59	15.38	28.75
convnext_base	nhwc	eager	rw_hack_ts	958.99	266.928	256	224	299.15	426.176	128	224	88.59
convnext_base	nhwc	eager	permute	953.71	268.409	256	224	327.23	389.549	128	224	88.59	15.38	28.75
convnext_base	nchw	eager	permute	949.2	269.683	256	224	325.43	391.656	128	224	88.59	15.38	28.75
convnext_base	nhwc	eager	ng_hack	944.94	270.898	256	224	325.29	391.65	128	224	88.59
convnext_base	nchw	eager	rw_hack_ts	938.8	272.669	256	224	318.84	399.83	128	224	88.59
convnext_base	nchw	eager	rw_hack	933.4	274.245	256	224	317.11	402.017	128	224	88.59
convnext_base	nhwc	eager	rw_hack	929.31	275.457	256	224	315.24	404.457	128	224	88.59
convnext_base_c	nhwc	eager	ng_hack	928.06	275.822	256	224	313.06	407.254	128	224	88.59
convnext_base	nchw	eager	ng_hack	911.86	280.725	256	224	311.3	409.399	128	224	88.59
convnext_base_c	nchw	eager	rw_hack	888.26	288.186	256	224	278.23	458.409	128	224	88.59
convnext_base_c	nhwc	eager	rw_hack	887.55	288.418	256	224	276.74	460.897	128	224	88.59
convnext_base_c	nchw	eager	rw_hack_ts	848.68	301.625	256	224	271.44	469.878	128	224	88.59
convnext_small_c	nchw	aot	ng_hack	846.52	302.392	256	224	261.31	488.258	128	224	50.22
convnext_small_c	nchw	eager	ng_hack	824.79	310.36	256	224	261.48	487.93	128	224	50.22
convnext_large	nhwc	torchscript	rw_hack	679.33	376.821	256	224	157.16	202.005	32	224	197.77
convnext_large	nchw	torchscript	permute	677.92	377.601	256	224	181.33	351.33	64	224	197.77
convnext_large	nchw	torchscript	rw_hack	676.72	378.274	256	224	158.41	200.414	32	224	197.77
convnext_large	nhwc	torchscript	permute	665.97	384.376	256	224	182.53	348.966	64	224	197.77
convnext_large_c	nchw	torchscript	permute	611.21	418.819	256	224	170.39	373.947	64	224	197.77
convnext_large	nhwc	aot	ng_hack	611.01	418.955	256	224	180.07	353.903	64	224	197.77
convnext_large	nhwc	aot	rw_hack	610.55	419.273	256	224	174.22	365.887	64	224	197.77
convnext_large_c	nhwc	torchscript	permute	609.61	419.916	256	224	170.95	372.567	64	224	197.77
convnext_large_c	nhwc	torchscript	rw_hack	607.6	421.308	256	224	131.28	242.001	32	224	197.77
convnext_large	nhwc	aot	permute	607.19	421.59	256	224	181.27	351.53	64	224	197.77
convnext_large	nchw	aot	rw_hack	605.93	422.472	256	224	177.53	359.099	64	224	197.77
convnext_large_c	nchw	torchscript	rw_hack	605.02	423.103	256	224	132.1	240.504	32	224	197.77
convnext_large	nchw	aot	permute	604.61	423.393	256	224	181.06	351.973	64	224	197.77
convnext_base_c	nchw	aot	ng_hack	601.03	425.917	256	224	185.56	688.336	128	224	88.59
convnext_large_c	nhwc	aot	rw_hack	591.73	432.609	256	224	141.75	450.036	64	224	197.77
convnext_large_c	nchw	aot	rw_hack	587.87	435.449	256	224	143.85	443.445	64	224	197.77
convnext_base_c	nchw	eager	ng_hack	585.95	436.878	256	224	184.97	690.427	128	224	88.59
convnext_large	nchw	aot	ng_hack	579.61	441.65	256	224	174.98	364.366	64	224	197.77
convnext_large_c	nhwc	aot	ng_hack	577.23	443.475	256	224	166.17	383.655	64	224	197.77
convnext_large_c	nhwc	eager	rw_hack_ts	570.02	449.085	256	224	143.18	445.257	64	224	197.77
convnext_large_c	nchw	aot	permute	566.95	451.518	256	224	169.71	375.64	64	224	197.77
convnext_large_c	nhwc	aot	permute	562.7	454.923	256	224	169.11	376.888	64	224	197.77
convnext_large_c	nhwc	eager	permute	548.42	466.77	256	224	172.28	369.859	64	224	197.77	34.4	43.13
convnext_large_c	nchw	eager	permute	547.38	467.658	256	224	172.21	370.055	64	224	197.77	34.4	43.13
convnext_large	nhwc	eager	rw_hack_ts	536.41	477.226	256	224	167.99	379.206	64	224	197.77
convnext_large	nchw	eager	permute	533.71	479.629	256	224	173.78	366.771	64	224	197.77	34.4	43.13
convnext_large	nhwc	eager	ng_hack	531.16	481.933	256	224	173.38	367.456	64	224	197.77
convnext_large	nhwc	eager	permute	527.4	485.373	256	224	171.93	370.585	64	224	197.77	34.4	43.13
convnext_large	nchw	eager	rw_hack_ts	526.37	486.323	256	224	169.6	375.688	64	224	197.77
convnext_large_c	nhwc	eager	ng_hack	525.77	486.883	256	224	167.53	380.432	64	224	197.77
convnext_large	nchw	eager	rw_hack	524.46	488.089	256	224	169.68	375.488	64	224	197.77
convnext_large	nhwc	eager	rw_hack	523.26	489.214	256	224	168.42	378.378	64	224	197.77
convnext_large	nchw	eager	ng_hack	513.97	498.061	256	224	166.97	381.48	64	224	197.77
convnext_large_c	nchw	eager	rw_hack	506.51	505.39	256	224	150.96	422.328	64	224	197.77
convnext_large_c	nhwc	eager	rw_hack	505.83	506.074	256	224	150.14	424.639	64	224	197.77
convnext_large_c	nchw	eager	rw_hack_ts	484.87	527.957	256	224	147.55	432.081	64	224	197.77
convnext_large_c	nchw	aot	ng_hack	361.68	707.792	256	224	106.97	596.757	64	224	197.77
convnext_large_c	nchw	eager	ng_hack	353.0	725.187	256	224	106.83	597.551	64	224	197.77