# 使用StandardScaler进行数据预处理
import
numpy
import
matplotlib
.
pyplot
as
plt
from
sklearn
.
datasets
import
make_blobs
X
,
y
=
make_blobs
(
n_samples
=
40
,
centers
=
2
,
random_state
=
50
,
cluster_std
=
2
)
plt
.
scatter
(
X
[
:
,
0
]
,
X
[
:
,
1
]
,
c
=
y
,
cmap
=
plt
.
cm
.
cool
)
plt
.
show
(
)
# 导入StandardScaler
from
sklearn
.
preprocessing
import
StandardScaler
# 使用StandardScalera进行数据预处理
X_1
=
StandardScaler
(
)
.
fit_transform
(
X
)
# 用散点图绘制经过预处理的数据点
plt
.
scatter
(
X_1
[
:
,
0
]
,
X_1
[
:
,
1
]
,
c
=
y
,
cmap
=
plt
.
cm
.
cool
)
# 显示图像
plt
.
show
(
)
# 导入MinMaxScaler
from
sklearn
.
preprocessing
import
MinMaxScaler
# 使用MinMaxScaler进行数据预处理
X_2
=
MinMaxScaler
(
)
.
fit_transform
(
X
)
# 用散点图绘制经过预处理的数据点
plt
.
scatter
(
X_2
[
:
,
0
]
,
X_2
[
:
,
1
]
,
c
=
y
,
cmap
=
plt
.
cm
.
cool
)
# 显示图像
plt
.
show
(
)
# 导入RobustScaler
from
sklearn
.
preprocessing
import
RobustScaler
# 使用RobustScaler进行数据预处理
X_3
=
RobustScaler
(
)
.
fit_transform
(
X
)
# 用散点图绘制经过预处理的数据点
plt
.
scatter
(
X_3
[
:
,
0
]
,
X_3
[
:
,
1
]
,
c
=
y
,
cmap
=
plt
.
cm
.
cool
)
# 显示图像
plt
.
show
(
)
# 导入Normalizer
from
sklearn
.
preprocessing
import
Normalizer
# 使用Normalizer进行数据预处理
X_4
=
Normalizer
(
)
.
fit_transform
(
X
)
# 用散点图绘制经过预处理的数据点
plt
.
scatter
(
X_4
[
:
,
0
]
,
X_4
[
:
,
1
]
,
c
=
y
,
cmap
=
plt
.
cm
.
cool
)
# 显示图像
plt
.
show
(
)
引用文章: 有关StandardScaler的transform和fit_transform方法
https://www.jianshu.com/p/2a635d9e894d