January 8, 2018 13:42 · November 14, 2017 22:10 · October 9, 2017 14:42 · July 26, 2017 03:12 · July 4, 2017 14:31 · April 14, 2017 21:06
 import collections
 import enum
 import re

 from sre_parse import Pattern, SubPattern, parse
 from sre_compile import compile as sre_compile
 from sre_constants import BRANCH, SUBPATTERN


 class Tokens(enum.Enum):
 from pyspark.sql import Row

 spark.conf.set('spark.sql.parquet.writeLegacyFormat', 'false')
 spark.conf.set('spark.sql.parquet.compression.codec', 'uncompressed')

 sc = spark.sparkContext
 df = spark.createDataFrame(
    sc.parallelize(range(1, 100)
 ).map(lambda i: Row(value=i)))
 #!/usr/bin/env zsh                                                                                                                                                                             
                                                                                                                                                                                               
 export IBIS_TEST_NN_HOST=impalalive                                                                                                                                                            
 export IBIS_TEST_IMPALA_HOST=$IBIS_TEST_NN_HOST                                                                                                                                                
 export IBIS_TEST_IMPALA_PORT=21050                                                                                                                                                             
 export IBIS_TEST_WEBHDFS_PORT=50070                             
 diff --git a/ftplugin/python/slime.vim b/ftplugin/python/slime.vim
 index f95e334..6de0b84 100644
 --- a/ftplugin/python/slime.vim
 +++ b/ftplugin/python/slime.vim
 @@ -1,7 +1,7 @@
 
 function! _EscapeText_python(text)
   if exists('g:slime_python_ipython') && len(split(a:text,"\n")) > 1
 -    return ["%cpaste -q\n", a:text, "--\n"]
 +    return ["\e[200~", a:text, "\e[201~\n"]
 In [19]: df = pd.DataFrame({'a':[1,2,3],'b':[1.0,None,3.0]}, index=list('abc'))

 In [20]: t = pa.Table.from_pandas(df)

 In [21]: t.column(2).to_pandas()
 Out[21]:
 0    a
 1    b
 2    c
 Name: _index_level_0, dtype: object
 #!/usr/bin/env python

 """
 Dask version of
 https://hdfgroup.org/wp/2015/04/putting-some-spark-into-hdf-eos/
 """

 from __future__ import print_function, division

 import os
 # currently:
 diamonds[(diamonds.cut == 'Ideal') | (diamonds.cut == 'Premium')][['cut', 'price']].sort('price', ascending=False).head(10)

 # ideally:
 diamonds[diamonds.cut.isin(['Ideal', 'Premium'])][['cut', 'price']].sort('price', ascending=False).head(10)
	import collections
	import enum
	import re

	from sre_parse import Pattern, SubPattern, parse
	from sre_compile import compile as sre_compile
	from sre_constants import BRANCH, SUBPATTERN


	class Tokens(enum.Enum):
	from pyspark.sql import Row

	spark.conf.set('spark.sql.parquet.writeLegacyFormat', 'false')
	spark.conf.set('spark.sql.parquet.compression.codec', 'uncompressed')

	sc = spark.sparkContext
	df = spark.createDataFrame(
	sc.parallelize(range(1, 100)
	).map(lambda i: Row(value=i)))
	#!/usr/bin/env zsh

	export IBIS_TEST_NN_HOST=impalalive
	export IBIS_TEST_IMPALA_HOST=$IBIS_TEST_NN_HOST
	export IBIS_TEST_IMPALA_PORT=21050
	export IBIS_TEST_WEBHDFS_PORT=50070
	diff --git a/ftplugin/python/slime.vim b/ftplugin/python/slime.vim
	index f95e334..6de0b84 100644
	--- a/ftplugin/python/slime.vim
	+++ b/ftplugin/python/slime.vim
	@@ -1,7 +1,7 @@

	function! _EscapeText_python(text)
	if exists('g:slime_python_ipython') && len(split(a:text,"\n")) > 1
	- return ["%cpaste -q\n", a:text, "--\n"]
	+ return ["\e[200~", a:text, "\e[201~\n"]
	In [19]: df = pd.DataFrame({'a':[1,2,3],'b':[1.0,None,3.0]}, index=list('abc'))

	In [20]: t = pa.Table.from_pandas(df)

	In [21]: t.column(2).to_pandas()
	Out[21]:
	0 a
	1 b
	2 c
	Name: _index_level_0, dtype: object
	#!/usr/bin/env python

	"""
	Dask version of
	https://hdfgroup.org/wp/2015/04/putting-some-spark-into-hdf-eos/
	"""

	from __future__ import print_function, division

	import os
	# currently:
	diamonds[(diamonds.cut == 'Ideal') \| (diamonds.cut == 'Premium')][['cut', 'price']].sort('price', ascending=False).head(10)

	# ideally:
	diamonds[diamonds.cut.isin(['Ideal', 'Premium'])][['cut', 'price']].sort('price', ascending=False).head(10)