枚举类 simple_ml.base.base_enum
距离类型 DisType
class DisType(Enum):
Eculidean = 1 # 欧几里得距离
Manhattan = 2 # 曼哈顿距离
Minkowski = 3 # 明可夫斯基距离
Chebyshev = 4 # 切比雪夫距离
CosSim = 5 # 余弦角距离
交叉验证类型 CrossValidationType
class CrossValidationType(Enum):
holdout = 0 # 留出法交叉验证
k_folder = 1 # k折交叉验证
Filter特征选择类型 FilterType
class FilterType(Enum):
var = 0 # 方差法
corr = 1 # 相关系数法
chi2 = 3 # 卡方检验法
entropy = 4 # 互信息法
变量类型 LabelType
class LabelType(Enum):
binary = 1 # 二值变量
multi_class = 2 # 多值变量
continuous = 3 # 连续变量
核函数类型 KernelType
class KernelType(Enum):
linear = 0 # 线性核
polynomial = 1 # 多项式核
gaussian = 2 # 高斯核
laplace = 3 # 拉普拉斯核
sigmoid = 4 # sigmoid核
分类器类别 ClassifierType
class ClassifierType(Enum):
LR = 0 # 逻辑回归分类器
CART = 1 # 分类回归树(CART)分类器
SVM = 2 # 支持向量机分类器
NB = 3 # 朴素贝叶斯分类器
KNN = 4 # K近邻分类器
Embedded特征选择类型 EmbeddedType
class EmbeddedType(Enum):
GBDT = 0 # GBDT特征选择
Lasso = 1 # Lasso特征选择
连续数据缺失值处理类型 ConMissingHandle
class ConMissingHandle(Enum):
mean_fill = 0 # 均值填补
median_fill = 1 # 中位数填补
sample_drop = 2 # 抛弃缺失样本
离散数据缺失值处理类型 DisMissingHandle
class DisMissingHandle(Enum):
mode_fill = 0 # 中位数填补
sample_drop = 1 # 抛弃缺失样本
one_hot = 2 # 独热编码,将缺失值作为一个新的类比,进行独热编码
损失函数类型 CostFunction
class CostFunction(Enum):
square = 0
logistic = 1
hinge = 2 # max(0, 1 - t*y),t为目标值,y为输出值
softmax = 3
激活函数类型 ActiveFunction
class ActiveFunction(Enum):
sigmoid = 0
tanh = 1
relu = 2