Coverage for pyspark/ml/tuning.py: 94%

781 ↛ 782line 781 didn't jump to line 782, because the condition on line 781 was never true if training.rdd.getNumPartitions() == 0 or len(training.take(1)) == 0:

raise ValueError("The training data at fold %s is empty." % i)

if validation.rdd.getNumPartitions() == 0 or len(validation.take(1)) == 0:

raise ValueError("The validation data at fold %s is empty." % i)

datasets.append((training, validation))

return datasets

def copy(self, extra=None):

"""

Creates a copy of this instance with a randomly generated uid

and some extra params. This copies creates a deep copy of

the embedded paramMap, and copies the embedded and extra parameters over.

.. versionadded:: 1.4.0

Parameters

----------

extra : dict, optional

Extra parameters to copy to the new instance

Returns

-------

:py:class:`CrossValidator`

Copy of this instance

"""

808 ↛ 810line 808 didn't jump to line 810, because the condition on line 808 was never false if extra is None:

extra = dict()

newCV = Params.copy(self, extra)

811 ↛ 814line 811 didn't jump to line 814, because the condition on line 811 was never false if self.isSet(self.estimator):

newCV.setEstimator(self.getEstimator().copy(extra))

# estimatorParamMaps remain the same

814 ↛ 816line 814 didn't jump to line 816, because the condition on line 814 was never false if self.isSet(self.evaluator):

newCV.setEvaluator(self.getEvaluator().copy(extra))

return newCV

@since("2.3.0")

def write(self):

"""Returns an MLWriter instance for this ML instance."""

if _ValidatorSharedReadWrite.is_java_convertible(self):

return JavaMLWriter(self)

return CrossValidatorWriter(self)

@classmethod

@since("2.3.0")

def read(cls):

"""Returns an MLReader instance for this class."""

return CrossValidatorReader(cls)

@classmethod

def _from_java(cls, java_stage):

"""

Given a Java CrossValidator, create and return a Python wrapper of it.

Used for ML persistence.

"""

estimator, epms, evaluator = super(CrossValidator, cls)._from_java_impl(java_stage)

numFolds = java_stage.getNumFolds()

seed = java_stage.getSeed()

parallelism = java_stage.getParallelism()

collectSubModels = java_stage.getCollectSubModels()

foldCol = java_stage.getFoldCol()

# Create a new instance of this stage.

py_stage = cls(estimator=estimator, estimatorParamMaps=epms, evaluator=evaluator,

numFolds=numFolds, seed=seed, parallelism=parallelism,

collectSubModels=collectSubModels, foldCol=foldCol)

py_stage._resetUid(java_stage.uid())

return py_stage

def _to_java(self):

"""

Transfer this instance to a Java CrossValidator. Used for ML persistence.

Returns

-------

py4j.java_gateway.JavaObject

Java object equivalent to this instance.

"""

estimator, epms, evaluator = super(CrossValidator, self)._to_java_impl()

_java_obj = JavaParams._new_java_obj("org.apache.spark.ml.tuning.CrossValidator", self.uid)

_java_obj.setEstimatorParamMaps(epms)

_java_obj.setEvaluator(evaluator)

_java_obj.setEstimator(estimator)

_java_obj.setSeed(self.getSeed())

_java_obj.setNumFolds(self.getNumFolds())

_java_obj.setParallelism(self.getParallelism())

_java_obj.setCollectSubModels(self.getCollectSubModels())

_java_obj.setFoldCol(self.getFoldCol())

return _java_obj

class CrossValidatorModel(Model, _CrossValidatorParams, MLReadable, MLWritable):

"""

CrossValidatorModel contains the model with the highest average cross-validation

metric across folds and uses this model to transform input data. CrossValidatorModel

also tracks the metrics for each param map evaluated.

.. versionadded:: 1.4.0

"""

def __init__(self, bestModel, avgMetrics=None, subModels=None):

super(CrossValidatorModel, self).__init__()

#: best model from cross validation

self.bestModel = bestModel

#: Average cross-validation metrics for each paramMap in

#: CrossValidator.estimatorParamMaps, in the corresponding order.

self.avgMetrics = avgMetrics or []

#: sub model list from cross validation

self.subModels = subModels

def _transform(self, dataset):

return self.bestModel.transform(dataset)

def copy(self, extra=None):

"""

Creates a copy of this instance with a randomly generated uid

and some extra params. This copies the underlying bestModel,

creates a deep copy of the embedded paramMap, and

copies the embedded and extra parameters over.

It does not copy the extra Params into the subModels.

.. versionadded:: 1.4.0

Parameters

----------

extra : dict, optional

Extra parameters to copy to the new instance

Returns

-------

:py:class:`CrossValidatorModel`

Copy of this instance

"""

919 ↛ 921line 919 didn't jump to line 921, because the condition on line 919 was never false if extra is None:

extra = dict()

bestModel = self.bestModel.copy(extra)

avgMetrics = list(self.avgMetrics)

subModels = [

[sub_model.copy() for sub_model in fold_sub_models]

for fold_sub_models in self.subModels

]

return self._copyValues(CrossValidatorModel(bestModel, avgMetrics, subModels), extra=extra)

@since("2.3.0")

def write(self):

"""Returns an MLWriter instance for this ML instance."""

if _ValidatorSharedReadWrite.is_java_convertible(self):

return JavaMLWriter(self)

return CrossValidatorModelWriter(self)

@classmethod

@since("2.3.0")

def read(cls):

"""Returns an MLReader instance for this class."""

return CrossValidatorModelReader(cls)

@classmethod

def _from_java(cls, java_stage):

"""

Given a Java CrossValidatorModel, create and return a Python wrapper of it.

Used for ML persistence.

"""

sc = SparkContext._active_spark_context

bestModel = JavaParams._from_java(java_stage.bestModel())

avgMetrics = _java2py(sc, java_stage.avgMetrics())

estimator, epms, evaluator = super(CrossValidatorModel, cls)._from_java_impl(java_stage)

py_stage = cls(bestModel=bestModel, avgMetrics=avgMetrics)

params = {

"evaluator": evaluator,

"estimator": estimator,

"estimatorParamMaps": epms,

"numFolds": java_stage.getNumFolds(),

"foldCol": java_stage.getFoldCol(),

"seed": java_stage.getSeed(),

}

for param_name, param_val in params.items():

py_stage = py_stage._set(**{param_name: param_val})

if java_stage.hasSubModels():

py_stage.subModels = [[JavaParams._from_java(sub_model)

for sub_model in fold_sub_models]

for fold_sub_models in java_stage.subModels()]

py_stage._resetUid(java_stage.uid())

return py_stage

def _to_java(self):

"""

Transfer this instance to a Java CrossValidatorModel. Used for ML persistence.

Returns

-------

py4j.java_gateway.JavaObject

Java object equivalent to this instance.

"""

sc = SparkContext._active_spark_context

_java_obj = JavaParams._new_java_obj("org.apache.spark.ml.tuning.CrossValidatorModel",

self.uid,

self.bestModel._to_java(),

_py2java(sc, self.avgMetrics))

estimator, epms, evaluator = super(CrossValidatorModel, self)._to_java_impl()

params = {

"evaluator": evaluator,

"estimator": estimator,

"estimatorParamMaps": epms,

"numFolds": self.getNumFolds(),

"foldCol": self.getFoldCol(),

"seed": self.getSeed(),

}

for param_name, param_val in params.items():

java_param = _java_obj.getParam(param_name)

pair = java_param.w(param_val)

_java_obj.set(pair)

if self.subModels is not None:

java_sub_models = [[sub_model._to_java() for sub_model in fold_sub_models]

for fold_sub_models in self.subModels]

_java_obj.setSubModels(java_sub_models)

return _java_obj

@inherit_doc

class TrainValidationSplitReader(MLReader):

def __init__(self, cls):

super(TrainValidationSplitReader, self).__init__()

self.cls = cls

def load(self, path):

metadata = DefaultParamsReader.loadMetadata(path, self.sc)

if not DefaultParamsReader.isPythonParamsInstance(metadata):

return JavaMLReader(self.cls).load(path)

else:

metadata, estimator, evaluator, estimatorParamMaps = \

_ValidatorSharedReadWrite.load(path, self.sc, metadata)

tvs = TrainValidationSplit(estimator=estimator,

estimatorParamMaps=estimatorParamMaps,

evaluator=evaluator)

tvs = tvs._resetUid(metadata['uid'])

DefaultParamsReader.getAndSetParams(tvs, metadata, skipParams=['estimatorParamMaps'])

return tvs

@inherit_doc

class TrainValidationSplitWriter(MLWriter):

def __init__(self, instance):

super(TrainValidationSplitWriter, self).__init__()

self.instance = instance

def saveImpl(self, path):

_ValidatorSharedReadWrite.validateParams(self.instance)

_ValidatorSharedReadWrite.saveImpl(path, self.instance, self.sc)

@inherit_doc

class TrainValidationSplitModelReader(MLReader):

def __init__(self, cls):

super(TrainValidationSplitModelReader, self).__init__()

self.cls = cls

def load(self, path):

metadata = DefaultParamsReader.loadMetadata(path, self.sc)

if not DefaultParamsReader.isPythonParamsInstance(metadata):

return JavaMLReader(self.cls).load(path)

else:

metadata, estimator, evaluator, estimatorParamMaps = \

_ValidatorSharedReadWrite.load(path, self.sc, metadata)

bestModelPath = os.path.join(path, 'bestModel')

bestModel = DefaultParamsReader.loadParamsInstance(bestModelPath, self.sc)

validationMetrics = metadata['validationMetrics']

persistSubModels = ('persistSubModels' in metadata) and metadata['persistSubModels']

if persistSubModels:

subModels = [None] * len(estimatorParamMaps)

for paramIndex in range(len(estimatorParamMaps)):

modelPath = os.path.join(path, 'subModels', f'{paramIndex}')

subModels[paramIndex] = \

DefaultParamsReader.loadParamsInstance(modelPath, self.sc)

else:

subModels = None

tvsModel = TrainValidationSplitModel(

bestModel, validationMetrics=validationMetrics, subModels=subModels)

tvsModel = tvsModel._resetUid(metadata['uid'])

tvsModel.set(tvsModel.estimator, estimator)

tvsModel.set(tvsModel.estimatorParamMaps, estimatorParamMaps)

tvsModel.set(tvsModel.evaluator, evaluator)

DefaultParamsReader.getAndSetParams(

tvsModel, metadata, skipParams=['estimatorParamMaps'])

return tvsModel

@inherit_doc

class TrainValidationSplitModelWriter(MLWriter):

def __init__(self, instance):

super(TrainValidationSplitModelWriter, self).__init__()

self.instance = instance

def saveImpl(self, path):

_ValidatorSharedReadWrite.validateParams(self.instance)

instance = self.instance

persistSubModels = _ValidatorSharedReadWrite \

.getValidatorModelWriterPersistSubModelsParam(self)

extraMetadata = {'validationMetrics': instance.validationMetrics,

'persistSubModels': persistSubModels}

_ValidatorSharedReadWrite.saveImpl(path, instance, self.sc, extraMetadata=extraMetadata)

bestModelPath = os.path.join(path, 'bestModel')

instance.bestModel.save(bestModelPath)

if persistSubModels:

1102 ↛ 1103line 1102 didn't jump to line 1103, because the condition on line 1102 was never true if instance.subModels is None:

raise ValueError(_save_with_persist_submodels_no_submodels_found_err)

subModelsPath = os.path.join(path, 'subModels')

for paramIndex in range(len(instance.getEstimatorParamMaps())):

modelPath = os.path.join(subModelsPath, f'{paramIndex}')

instance.subModels[paramIndex].save(modelPath)

class _TrainValidationSplitParams(_ValidatorParams):

"""

Params for :py:class:`TrainValidationSplit` and :py:class:`TrainValidationSplitModel`.

.. versionadded:: 3.0.0

"""

trainRatio = Param(Params._dummy(), "trainRatio", "Param for ratio between train and\

validation data. Must be between 0 and 1.", typeConverter=TypeConverters.toFloat)

def __init__(self, *args):

super(_TrainValidationSplitParams, self).__init__(*args)

self._setDefault(trainRatio=0.75)

@since("2.0.0")

def getTrainRatio(self):

"""

Gets the value of trainRatio or its default value.

"""

return self.getOrDefault(self.trainRatio)

class TrainValidationSplit(Estimator, _TrainValidationSplitParams, HasParallelism,

HasCollectSubModels, MLReadable, MLWritable):

"""

Validation for hyper-parameter tuning. Randomly splits the input dataset into train and

validation sets, and uses evaluation metric on the validation set to select the best model.

Similar to :class:`CrossValidator`, but only splits the set once.

.. versionadded:: 2.0.0

Examples

--------

>>> from pyspark.ml.classification import LogisticRegression

>>> from pyspark.ml.evaluation import BinaryClassificationEvaluator

>>> from pyspark.ml.linalg import Vectors

>>> from pyspark.ml.tuning import TrainValidationSplit, ParamGridBuilder

>>> from pyspark.ml.tuning import TrainValidationSplitModel

>>> import tempfile

>>> dataset = spark.createDataFrame(

... [(Vectors.dense([0.0]), 0.0),

... (Vectors.dense([0.4]), 1.0),

... (Vectors.dense([0.5]), 0.0),

... (Vectors.dense([0.6]), 1.0),

... (Vectors.dense([1.0]), 1.0)] * 10,

... ["features", "label"]).repartition(1)

>>> lr = LogisticRegression()

>>> grid = ParamGridBuilder().addGrid(lr.maxIter, [0, 1]).build()

>>> evaluator = BinaryClassificationEvaluator()

>>> tvs = TrainValidationSplit(estimator=lr, estimatorParamMaps=grid, evaluator=evaluator,

... parallelism=1, seed=42)

>>> tvsModel = tvs.fit(dataset)

>>> tvsModel.getTrainRatio()

0.75

>>> tvsModel.validationMetrics

[0.5, ...

>>> path = tempfile.mkdtemp()

>>> model_path = path + "/model"

>>> tvsModel.write().save(model_path)

>>> tvsModelRead = TrainValidationSplitModel.read().load(model_path)

>>> tvsModelRead.validationMetrics

[0.5, ...

>>> evaluator.evaluate(tvsModel.transform(dataset))

0.833...

>>> evaluator.evaluate(tvsModelRead.transform(dataset))

0.833...

"""

@keyword_only

def __init__(self, *, estimator=None, estimatorParamMaps=None, evaluator=None,

trainRatio=0.75, parallelism=1, collectSubModels=False, seed=None):

"""

__init__(self, \\*, estimator=None, estimatorParamMaps=None, evaluator=None, \

trainRatio=0.75, parallelism=1, collectSubModels=False, seed=None)

"""

super(TrainValidationSplit, self).__init__()

self._setDefault(parallelism=1)

kwargs = self._input_kwargs

self._set(**kwargs)

@since("2.0.0")

@keyword_only

def setParams(self, *, estimator=None, estimatorParamMaps=None, evaluator=None,

trainRatio=0.75, parallelism=1, collectSubModels=False, seed=None):

"""

setParams(self, \\*, estimator=None, estimatorParamMaps=None, evaluator=None, \

trainRatio=0.75, parallelism=1, collectSubModels=False, seed=None):

Sets params for the train validation split.

"""

kwargs = self._input_kwargs

return self._set(**kwargs)

@since("2.0.0")

def setEstimator(self, value):

"""

Sets the value of :py:attr:`estimator`.

"""

return self._set(estimator=value)

@since("2.0.0")

def setEstimatorParamMaps(self, value):

"""

Sets the value of :py:attr:`estimatorParamMaps`.

"""

return self._set(estimatorParamMaps=value)

@since("2.0.0")

def setEvaluator(self, value):

"""

Sets the value of :py:attr:`evaluator`.

"""

return self._set(evaluator=value)

@since("2.0.0")

def setTrainRatio(self, value):

"""

Sets the value of :py:attr:`trainRatio`.

"""

return self._set(trainRatio=value)

def setSeed(self, value):

"""

Sets the value of :py:attr:`seed`.

"""

return self._set(seed=value)

def setParallelism(self, value):

"""

Sets the value of :py:attr:`parallelism`.

"""

return self._set(parallelism=value)

def setCollectSubModels(self, value):

"""

Sets the value of :py:attr:`collectSubModels`.

"""

return self._set(collectSubModels=value)

def _fit(self, dataset):

est = self.getOrDefault(self.estimator)

epm = self.getOrDefault(self.estimatorParamMaps)

numModels = len(epm)

eva = self.getOrDefault(self.evaluator)

tRatio = self.getOrDefault(self.trainRatio)

seed = self.getOrDefault(self.seed)

randCol = self.uid + "_rand"

df = dataset.select("*", rand(seed).alias(randCol))

condition = (df[randCol] >= tRatio)

validation = df.filter(condition).cache()

train = df.filter(~condition).cache()

subModels = None

collectSubModelsParam = self.getCollectSubModels()

if collectSubModelsParam:

subModels = [None for i in range(numModels)]

tasks = map(

inheritable_thread_target,

_parallelFitTasks(est, train, eva, validation, epm, collectSubModelsParam))

pool = ThreadPool(processes=min(self.getParallelism(), numModels))

metrics = [None] * numModels

for j, metric, subModel in pool.imap_unordered(lambda f: f(), tasks):

metrics[j] = metric

if collectSubModelsParam:

subModels[j] = subModel

train.unpersist()

validation.unpersist()

if eva.isLargerBetter():

bestIndex = np.argmax(metrics)

else:

bestIndex = np.argmin(metrics)

bestModel = est.fit(dataset, epm[bestIndex])

return self._copyValues(TrainValidationSplitModel(bestModel, metrics, subModels))

def copy(self, extra=None):

"""

Creates a copy of this instance with a randomly generated uid

and some extra params. This copies creates a deep copy of

the embedded paramMap, and copies the embedded and extra parameters over.

.. versionadded:: 2.0.0

Parameters

----------

extra : dict, optional

Extra parameters to copy to the new instance

Returns

-------

:py:class:`TrainValidationSplit`

Copy of this instance

"""

1304 ↛ 1306line 1304 didn't jump to line 1306, because the condition on line 1304 was never false if extra is None:

extra = dict()

newTVS = Params.copy(self, extra)

1307 ↛ 1310line 1307 didn't jump to line 1310, because the condition on line 1307 was never false if self.isSet(self.estimator):

newTVS.setEstimator(self.getEstimator().copy(extra))

# estimatorParamMaps remain the same

1310 ↛ 1312line 1310 didn't jump to line 1312, because the condition on line 1310 was never false if self.isSet(self.evaluator):

newTVS.setEvaluator(self.getEvaluator().copy(extra))

return newTVS

@since("2.3.0")

def write(self):

"""Returns an MLWriter instance for this ML instance."""

if _ValidatorSharedReadWrite.is_java_convertible(self):

return JavaMLWriter(self)

return TrainValidationSplitWriter(self)

@classmethod

@since("2.3.0")

def read(cls):

"""Returns an MLReader instance for this class."""

return TrainValidationSplitReader(cls)

@classmethod

def _from_java(cls, java_stage):

"""

Given a Java TrainValidationSplit, create and return a Python wrapper of it.

Used for ML persistence.

"""

estimator, epms, evaluator = super(TrainValidationSplit, cls)._from_java_impl(java_stage)

trainRatio = java_stage.getTrainRatio()

seed = java_stage.getSeed()

parallelism = java_stage.getParallelism()

collectSubModels = java_stage.getCollectSubModels()

# Create a new instance of this stage.

py_stage = cls(estimator=estimator, estimatorParamMaps=epms, evaluator=evaluator,

trainRatio=trainRatio, seed=seed, parallelism=parallelism,

collectSubModels=collectSubModels)

py_stage._resetUid(java_stage.uid())

return py_stage

def _to_java(self):

"""

Transfer this instance to a Java TrainValidationSplit. Used for ML persistence.

Returns

-------

py4j.java_gateway.JavaObject

Java object equivalent to this instance.

"""

estimator, epms, evaluator = super(TrainValidationSplit, self)._to_java_impl()

_java_obj = JavaParams._new_java_obj("org.apache.spark.ml.tuning.TrainValidationSplit",

self.uid)

_java_obj.setEstimatorParamMaps(epms)

_java_obj.setEvaluator(evaluator)

_java_obj.setEstimator(estimator)

_java_obj.setTrainRatio(self.getTrainRatio())

_java_obj.setSeed(self.getSeed())

_java_obj.setParallelism(self.getParallelism())

_java_obj.setCollectSubModels(self.getCollectSubModels())

return _java_obj

class TrainValidationSplitModel(Model, _TrainValidationSplitParams, MLReadable, MLWritable):

"""

Model from train validation split.

.. versionadded:: 2.0.0

"""

def __init__(self, bestModel, validationMetrics=None, subModels=None):

super(TrainValidationSplitModel, self).__init__()

#: best model from train validation split

self.bestModel = bestModel

#: evaluated validation metrics

self.validationMetrics = validationMetrics or []

#: sub models from train validation split

self.subModels = subModels

def _transform(self, dataset):

return self.bestModel.transform(dataset)

def copy(self, extra=None):

"""

Creates a copy of this instance with a randomly generated uid

and some extra params. This copies the underlying bestModel,

creates a deep copy of the embedded paramMap, and

copies the embedded and extra parameters over.

And, this creates a shallow copy of the validationMetrics.

It does not copy the extra Params into the subModels.

.. versionadded:: 2.0.0

Parameters

----------

extra : dict, optional

Extra parameters to copy to the new instance

Returns

-------

:py:class:`TrainValidationSplitModel`

Copy of this instance

"""

1410 ↛ 1412line 1410 didn't jump to line 1412, because the condition on line 1410 was never false if extra is None:

extra = dict()

bestModel = self.bestModel.copy(extra)

validationMetrics = list(self.validationMetrics)

subModels = [model.copy() for model in self.subModels]

return self._copyValues(

TrainValidationSplitModel(bestModel, validationMetrics, subModels),

extra=extra

)

@since("2.3.0")

def write(self):

"""Returns an MLWriter instance for this ML instance."""

if _ValidatorSharedReadWrite.is_java_convertible(self):

return JavaMLWriter(self)

return TrainValidationSplitModelWriter(self)

@classmethod

@since("2.3.0")

def read(cls):

"""Returns an MLReader instance for this class."""

return TrainValidationSplitModelReader(cls)

@classmethod

def _from_java(cls, java_stage):

"""

Given a Java TrainValidationSplitModel, create and return a Python wrapper of it.

Used for ML persistence.

"""

# Load information from java_stage to the instance.

sc = SparkContext._active_spark_context

bestModel = JavaParams._from_java(java_stage.bestModel())

validationMetrics = _java2py(sc, java_stage.validationMetrics())

estimator, epms, evaluator = super(TrainValidationSplitModel,

cls)._from_java_impl(java_stage)

# Create a new instance of this stage.

py_stage = cls(bestModel=bestModel,

validationMetrics=validationMetrics)

params = {

"evaluator": evaluator,

"estimator": estimator,

"estimatorParamMaps": epms,

"trainRatio": java_stage.getTrainRatio(),

"seed": java_stage.getSeed(),

}

for param_name, param_val in params.items():

py_stage = py_stage._set(**{param_name: param_val})

if java_stage.hasSubModels():

py_stage.subModels = [JavaParams._from_java(sub_model)

for sub_model in java_stage.subModels()]

py_stage._resetUid(java_stage.uid())

return py_stage

def _to_java(self):

"""

Transfer this instance to a Java TrainValidationSplitModel. Used for ML persistence.

Returns

-------

py4j.java_gateway.JavaObject

Java object equivalent to this instance.

"""

sc = SparkContext._active_spark_context

_java_obj = JavaParams._new_java_obj(

"org.apache.spark.ml.tuning.TrainValidationSplitModel",

self.uid,

self.bestModel._to_java(),

_py2java(sc, self.validationMetrics))

estimator, epms, evaluator = super(TrainValidationSplitModel, self)._to_java_impl()

params = {

"evaluator": evaluator,

"estimator": estimator,

"estimatorParamMaps": epms,

"trainRatio": self.getTrainRatio(),

"seed": self.getSeed(),

}

for param_name, param_val in params.items():

java_param = _java_obj.getParam(param_name)

pair = java_param.w(param_val)

_java_obj.set(pair)

if self.subModels is not None:

java_sub_models = [sub_model._to_java() for sub_model in self.subModels]

_java_obj.setSubModels(java_sub_models)

return _java_obj

if __name__ == "__main__":

import doctest

from pyspark.sql import SparkSession

globs = globals().copy()

# The small batch size here ensures that we see multiple batches,

# even in these small test examples:

spark = SparkSession.builder\

.master("local[2]")\

.appName("ml.tuning tests")\

.getOrCreate()

sc = spark.sparkContext

globs['sc'] = sc

globs['spark'] = spark

(failure_count, test_count) = doctest.testmod(globs=globs, optionflags=doctest.ELLIPSIS)

spark.stop()

1520 ↛ 1521line 1520 didn't jump to line 1521, because the condition on line 1520 was never true if failure_count:

sys.exit(-1)

Coverage for pyspark/ml/tuning.py : 94%

705 statements 675 run 30 missing 0 excluded 21 partial