我的编程空间,编程开发者的网络收藏夹
学习永远不晚

Python sklearn中的make_blobs()函数怎么使用

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

Python sklearn中的make_blobs()函数怎么使用

这篇“Python sklearn中的make_blobs()函数怎么使用”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“Python sklearn中的make_blobs()函数怎么使用”文章吧。

一、介绍

make_blobs() 是 sklearn.datasets中的一个函数。

主要是产生聚类数据集,产生一个数据集和相应的标签。

函数的源代码如下:

def make_blobs(n_samples = 100, n_features = 2, centers = 3, cluster_std = 1.0,               center_box = (-10.0, 10.0), shuffle = True, random_state = None):    """Generate isotropic Gaussian blobs for clustering.    Read more in the :ref:`User Guide <sample_generators>`.    Parameters    ----------    n_samples : int, optional (default=100)        The total number of points equally divided among clusters.    n_features : int, optional (default=2)        The number of features for each sample.    centers : int or array of shape [n_centers, n_features], optional        (default=3)        The number of centers to generate, or the fixed center locations.    cluster_std: float or sequence of floats, optional (default=1.0)        The standard deviation of the clusters.    center_box: pair of floats (min, max), optional (default=(-10.0, 10.0))        The bounding box for each cluster center when centers are        generated at random.    shuffle : boolean, optional (default=True)        Shuffle the samples.    random_state : int, RandomState instance or None, optional (default=None)        If int, random_state is the seed used by the random number generator;        If RandomState instance, random_state is the random number generator;        If None, the random number generator is the RandomState instance used        by `np.random`.    Returns    -------    X : array of shape [n_samples, n_features]        The generated samples.    y : array of shape [n_samples]        The integer labels for cluster membership of each sample.    Examples    --------    >>> from sklearn.datasets.samples_generator import make_blobs    >>> X, y = make_blobs(n_samples=10, centers=3, n_features=2,    ...                   random_state=0)    >>> print(X.shape)    (10, 2)    >>> y    array([0, 0, 1, 0, 2, 2, 2, 1, 1, 0])    See also    --------    make_classification: a more intricate variant    """    generator = check_random_state(random_state)    if isinstance(centers, numbers.Integral):        centers = generator.uniform(center_box[0], center_box[1],                                    size=(centers, n_features))    else:        centers = check_array(centers)        n_features = centers.shape[1]    if isinstance(cluster_std, numbers.Real):        cluster_std = np.ones(len(centers)) * cluster_std    X = []    y = []    n_centers = centers.shape[0]    n_samples_per_center = [int(n_samples // n_centers)] * n_centers    for i in range(n_samples % n_centers):        n_samples_per_center[i] += 1    for i, (n, std) in enumerate(zip(n_samples_per_center, cluster_std)):        X.append(centers[i] + generator.normal(scale = std,                                               size = (n, n_features)))        y += [i] * n    X = np.concatenate(X)    y = np.array(y)    if shuffle:        indices = np.arange(n_samples)        generator.shuffle(indices)        X = X[indices]        y = y[indices]    return X, y

二、函数的使用

make_blobs(n_samples = 100, n_features = 2, centers = 3, cluster_std = 1.0, center_box = (-10.0, 10.0), shuffle = True, random_state = None)

可以看到它有 7 个参数:

  • n_samples = 100 ,表示数据样本点个数,默认值100;

  • n_features = 2 ,是每个样本的特征(或属性)数,也表示数据的维度,默认值是2;

  • centers = 3 ,表示类别数(标签的种类数),默认值3;

  • cluster_std = 1.0 ,表示每个类别的方差,例如我们希望生成2类数据,其中一类比另一类具有更大的方差,可以将cluster_std设置为[1.0, 3.0],浮点数或者浮点数序列,默认值1.0;

  • center_box = (-10.0, 10.0) ,中心确定之后的数据边界,默认值(-10.0, 10.0);

  • shuffle = True ,将数据进行洗乱,默认值是True;

  • random_state = None ,官网解释是随机生成器的种子,可以固定生成的数据,给定数之后,每次生成的数据集就是固定的。若不给定值,则由于随机性将导致每次运行程序所获得的的结果可能有所不同。在使用数据生成器练习机器学习算法练习或python练习时建议给定数值。

以上就是关于“Python sklearn中的make_blobs()函数怎么使用”这篇文章的内容,相信大家都有了一定的了解,希望小编分享的内容对大家有帮助,若想了解更多相关的知识内容,请关注编程网行业资讯频道。

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

Python sklearn中的make_blobs()函数怎么使用

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

Python sklearn中的make_blobs()函数怎么使用

这篇“Python sklearn中的make_blobs()函数怎么使用”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“Py
2023-07-05

sklearn中make_blobs怎么用

这篇文章给大家分享的是有关sklearn中make_blobs怎么用的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。sklearn中的make_blobs函数主要是为了生成数据集的,具体如下:1.调用make_bl
2023-06-26

python中的filter函数怎么使用

在Python中,filter()函数用于过滤一个序列,返回符合条件的元素。filter()函数的基本语法如下:```filter(function, sequence)```其中,function是一个函数,sequence是一个可迭代的
2023-09-27

python中的zip函数怎么使用

在Python中,`zip()`函数用于将两个或多个可迭代对象打包成一个元组列表。使用方法如下:```pythonzip(iterable1, iterable2, ...)```其中,`iterable1, iterable2, ...`
2023-08-08

Python中的join()函数怎么使用

这篇文章主要介绍“Python中的join()函数怎么使用”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“Python中的join()函数怎么使用”文章能帮助大家解决问题。Python中 join()
2023-07-05

Python中的format()函数怎么使用

format()函数可以用来格式化字符串中的变量。以下是使用format()函数的基本语法:# 使用位置参数print("Hello, {}!".format("World"))# 使用关键字参数print("My name is {
Python中的format()函数怎么使用
2024-03-13

python中的queue函数怎么使用

在Python中,`queue`模块提供了实现FIFO(先进先出)队列的类`Queue`和`deque`,以及实现优先级队列的类`PriorityQueue`。下面是`queue`模块中常用的几种函数的使用方法:1. 创建队列对象:```p
2023-08-11

Python中missing()函数怎么使用

这篇文章主要介绍“Python中missing()函数怎么使用”,在日常操作中,相信很多人在Python中missing()函数怎么使用问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Python中missin
2023-06-22

Python中Print()函数怎么使用

这篇文章主要介绍“Python中Print()函数怎么使用”,在日常操作中,相信很多人在Python中Print()函数怎么使用问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Python中Print()函数怎
2023-07-04

python中add函数怎么使用

在Python中,可以使用`+`运算符来执行两个数值的加法操作。例如:```pythona = 5b = 3c = a + bprint(c)```输出结果为:```8```此外,`+`运算符也可以用于字符串的拼接操作。例如:```pyth
2023-09-26

python中temp函数怎么使用

在Python中,`tempfile`模块中的`tempfile.TemporaryFile()`函数可以用来创建一个临时文件。临时文件的特点是在使用完毕后会自动被删除。下面是一个使用`tempfile.TemporaryFile()`函数
2023-09-28

python中range()函数怎么使用

在Python中,range()函数用于生成一个整数序列。range()函数的使用方式为:1. range(stop):生成从0到stop-1的整数序列。2. range(start, stop):生成从start到stop-1的整数序列。
2023-10-18

python中ascii函数怎么使用

在Python中,`ascii()`函数可以用来返回一个对象的可打印的ASCII表示。它接受一个参数,该参数可以是数字、字符串、字节等。以下是`ascii()`函数的使用方法:1. 对于数字,`ascii()`函数返回一个包含该数字的字符串
2023-09-20

python中order函数怎么使用

在Python中,`order`函数用于对可迭代对象进行排序。它可以接受一个可迭代对象作为参数,并返回一个新的经过排序的列表。`order`函数有两种使用方式,一种是直接对可迭代对象进行排序,另一种是通过指定关键字参数进行自定义排序。下面是
2023-09-21

python中image函数怎么使用

在Python中,可以使用PIL库(Python Imaging Library)的Image函数来处理图像。具体使用方法如下:首先,需要安装PIL库。在命令行中输入以下命令进行安装:```pip install Pillow```然后,在
2023-09-14

python中format函数怎么使用

在Python中,可以使用format()函数来格式化字符串。基本语法如下:```pythonformatted_string = "Hello, {}!".format(name)```在这个例子中,format()函数会在字符串中的大括
2023-10-12

Python中reverse函数怎么使用

在Python中,我们可以使用reverse()函数来翻转一个列表。具体方法如下:首先,创建一个列表:my_list = [1, 2, 3, 4, 5]使用reverse()函数来翻转列表:my_list.reverse()打印输出翻转后的
Python中reverse函数怎么使用
2024-02-29

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录