大数据知识体系
首页
数据结构与算法
  • JVM
  • Java
  • Scala
  • Python
设计模式
  • MySQL
  • Redis
  • HDFS
  • HBase
  • ClickHouse
  • ElasticSearch
  • Iceberg
  • Hudi
  • Spark
  • Flink
  • Hive
  • Yarn
  • Zookeeper
  • Maven
  • Git
  • 数据仓库
  • 用户画像
  • 指标体系
数据治理
关于
首页
数据结构与算法
  • JVM
  • Java
  • Scala
  • Python
设计模式
  • MySQL
  • Redis
  • HDFS
  • HBase
  • ClickHouse
  • ElasticSearch
  • Iceberg
  • Hudi
  • Spark
  • Flink
  • Hive
  • Yarn
  • Zookeeper
  • Maven
  • Git
  • 数据仓库
  • 用户画像
  • 指标体系
数据治理
关于
  • JVM

    • JVM 架构
    • JVM 类加载机制
    • JVM 运行时数据区
    • JVM 垃圾回收机制
    • JVM 性能监控与调优
    • JVM 常见错误
  • Java

    • Java基础

      • Java 基础知识
      • Java 基础 - 枚举类
      • Java 基础 - 异常处理
      • Java 基础 - 泛型
      • Java 基础 - 反射
      • Java 基础 - 代理模式
      • Java 基础 - 注解
    • Java集合

    • Java并发编程

    • Java 开发规范
  • Scala

    • Scala 概述
  • Python

    • Numpy

      • 初识 Numpy
      • ndarray 的创建方式
      • NumPy 的数据类型
      • NumPy 数组计算
      • 拷贝
      • 索引和切片
      • 数学和统计方法
        • 函数
        • 示例
      • 数组形状变换
      • 通用函数
      • 排序
      • 搜索和计数
      • 线性代数
      • 伪随机数生成
      • 广播
      • 文件输入和输出
    • Pandas

      • 初识 Pandas
      • 认识 Series 和 DataFrame
      • Series 和 DataFrame 增删改查
      • Index对象增删改查
      • 普通列和行Index相互转化
      • 快速查看整体信息
      • 数值运算
      • 合并数据集
      • 数值统计与聚合
      • 分组聚合
      • 分类类型
      • 排序和排名
      • 时间序列
      • 文件输入与输出
      • 缺失值处理
      • 字符串处理
      • pandas sql
      • 其它
  • 语言基础
  • Python
  • Numpy
Will
2022-08-04
目录

数学和统计方法

# 函数

在这些方法中,布尔值中的 True 和 False 会被相应地转换为 1 和 0 参与计算

  • amin(a[, axis, out, keepdims])

    返回数组的最小值或沿轴的最小值

  • amax(a[, axis, out, keepdims])

    返回数组的最大值或沿轴的最大值

  • nanmin(a[, axis, out, keepdims])

    返回数组的最小值或沿轴的最小值,忽略任何 NAN

  • nanmax(a[, axis, out, keepdims])

    返回数组的最大值或沿轴方向的最大值,忽略任何 NAN

  • median(a[, axis, out, overwrite_input, keepdims])

    沿指定轴计算中值

  • average(a[, axis, weights, returned])

    计算沿指定轴的加权平均

  • mean(a[, axis, dtype, out, keepdims])

    沿指定的轴计算算术平均值

  • std(a[, axis, dtype, out, ddof, keepdims])

    计算沿指定轴的标准偏差

  • var(a[, axis, dtype, out, ddof, keepdims])

    计算沿指定轴的方差

  • nanmedian(a[, axis, out, overwrite_input, …])

    在忽略 NAS 的情况下,沿指定的轴计算中值

  • nanmean(a[, axis, dtype, out, keepdims])

    计算沿指定轴的算术平均值,忽略 NAN

  • nanstd(a[, axis, dtype, out, ddof, keepdims])

    计算指定轴上的标准偏差,而忽略 NAN

  • nanvar(a[, axis, dtype, out, ddof, keepdims])

    计算指定轴上的方差,同时忽略 NAN

# 示例

import numpy as np

arr = np.array([[np.NaN, 0, 1, 2, 3],
                [ 4, 5, np.NaN, 6, 7],
                [ 8, 9, 10, np.NaN, 11]])
arr
1
2
3
4
5
6
array([[nan,  0.,  1.,  2.,  3.],
       [ 4.,  5., nan,  6.,  7.],
       [ 8.,  9., 10., nan, 11.]])
np.amax(arr)
1
nan
np.nanmax(arr) # 默认是计算flatten之后的数组,可以指定axis参数 0/1
1
11.0
np.nanmin(arr)
1
0.0
np.nanmean(arr) # 平均值
1
5.5
np.nanmedian(arr) # 中位数
1
5.5
np.nanstd(arr) # 标准差
1
3.452052529534663
np.nanvar(arr) # 方差
1
11.916666666666666

布尔值 True 和 False 会被转为 1 和 0 参与计算

bool_arr = np.array([0.7, 0, 0.5, True, False, True, True, True, False, True])
bool_arr.sum()
1
2
6.2
arr2 = np.array([0.1, 0.2, 0.3, True, False])
np.amax(arr2)
np.amin(arr2)
1
2
3
1.0

0.0
上次更新: 2023/11/01, 03:11:44

← 索引和切片 数组形状变换→

Theme by Vdoing | Copyright © 2022-2023 Will 蜀ICP备2022002285号-1
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式