大数据知识体系
首页
数据结构与算法
  • JVM
  • Java
  • Scala
  • Python
设计模式
  • MySQL
  • Redis
  • HDFS
  • HBase
  • ClickHouse
  • ElasticSearch
  • Iceberg
  • Hudi
  • Spark
  • Flink
  • Hive
  • Yarn
  • Zookeeper
  • Maven
  • Git
  • 数据仓库
  • 用户画像
  • 指标体系
数据治理
关于
首页
数据结构与算法
  • JVM
  • Java
  • Scala
  • Python
设计模式
  • MySQL
  • Redis
  • HDFS
  • HBase
  • ClickHouse
  • ElasticSearch
  • Iceberg
  • Hudi
  • Spark
  • Flink
  • Hive
  • Yarn
  • Zookeeper
  • Maven
  • Git
  • 数据仓库
  • 用户画像
  • 指标体系
数据治理
关于
  • JVM

    • JVM 架构
    • JVM 类加载机制
    • JVM 运行时数据区
    • JVM 垃圾回收机制
    • JVM 性能监控与调优
    • JVM 常见错误
  • Java

    • Java基础

      • Java 基础知识
      • Java 基础 - 枚举类
      • Java 基础 - 异常处理
      • Java 基础 - 泛型
      • Java 基础 - 反射
      • Java 基础 - 代理模式
      • Java 基础 - 注解
    • Java集合

    • Java并发编程

    • Java 开发规范
  • Scala

    • Scala 概述
  • Python

    • Numpy

      • 初识 Numpy
      • ndarray 的创建方式
      • NumPy 的数据类型
      • NumPy 数组计算
      • 拷贝
      • 索引和切片
      • 数学和统计方法
      • 数组形状变换
      • 通用函数
      • 排序
      • 搜索和计数
      • 线性代数
      • 伪随机数生成
      • 广播
      • 文件输入和输出
    • Pandas

      • 初识 Pandas
      • 认识 Series 和 DataFrame
      • Series 和 DataFrame 增删改查
      • Index对象增删改查
      • 普通列和行Index相互转化
      • 快速查看整体信息
      • 数值运算
      • 合并数据集
      • 数值统计与聚合
      • 分组聚合
      • 分类类型
      • 排序和排名
      • 时间序列
      • 文件输入与输出
      • 缺失值处理
      • 字符串处理
      • pandas sql
      • 其它
  • 语言基础
  • Python
  • Pandas
Will
2022-08-04

文件输入与输出

import pandas as pd
1
Reader方法Writer方法说明
read_csvto_csv加载(写入)文件、URL、文件型对象中带分隔符的数据。默认分隔符为逗号
read_excelto_excel加载(写入)Excel表格上数据
read_htmlto_html加载(写入)HTML文档中的所有表格
read_jsonto_json加载(写入)JSON字符串中的数据
read_sqlto_sql 和SQL数据库交互(会在pandas sql小节中详细介绍)
read_hdfto_hdf加载(写入)HDF5文件
read_pickleto_pickle加载(写入)Python pickle格式中存储的对象
read_statato_stata加载(写入)Stata文件格式的数据集
read_featherto_feather加载(写入)Feather二进制文件格式
read_parquetto_parquet从文件加载(写入)一个parquet对象
read_gbqto_gbq加载(写入)Google BigQuery数据
read_clipboardto_clipboard读取剪贴板中的数据,可以看做read_table的剪贴板版。再将网页转换为表格时很有用
read_msgpackto_msgpack加载(写入)二进制编码的pandas数据
read_table --- 加载文件、URL、文件型对象中带分隔符的数据。默认分隔符为制表符(‘\t’)
read_fwf --- 读取指定宽列格式数据(也就是说没有分隔符)
read_sas --- 加载存储于SAS系统自定义存储格式的SAS数据集

read_csv()

  • ilepath_or_buffer:文件路径或者其它对象
  • sep:分隔符,默认为英文逗号
  • header:指定第几行作为列名(忽略注解行)
  • names:指定列名,如果文件中不包含 header 的行,应该显性表示 header=None
  • dtype:指定数据类型
  • nrows:读取的行数
pd.read_csv()
1
上次更新: 2023/11/01, 03:11:44

← 时间序列 缺失值处理→

Theme by Vdoing | Copyright © 2022-2023 Will 蜀ICP备2022002285号-1
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式