Python Pandas 读取csv常用操作

avatar 2024年04月28日10:20:51 0 233 views
博主分享免费Java教学视频,B站账号:Java刘哥

先列一些最基础的操作,后面如果使用到更复杂的会再补充

一、文件读取,获取列

直接贴代码

import pandas as pd  # pip3 install pandas

data_path = "K:\workspace-sync\datasets\imdb-dataset-of-50k-movie-reviews\IMDB_Dataset.csv"
df = pd.read_csv(data_path)
print(df.head())  # 打印前5行数据
print(len(df))  # 长度
review_list = df["review"].to_list() # 读取review列的数据
sentiment_list = df["sentiment"].to_list() # 读取sentiment列的数据, positive、negative
label_list = [ 1 if i == 'positive' else 0 for i in sentiment_list] # 将sentiment列的数据转换为0和1
print(review_list[:10])
print(sentiment_list[:10])
print(label_list[:10])

 

封装成一个方法

def get_imdb_data(file_path):
    df = pd.read_csv(file_path)
    review_list = df["review"].to_list()  # 读取review列的数据
    sentiment_list = df["sentiment"].to_list()  # 读取sentiment列的数据, positive、negative
    label_list = [1 if i == 'positive' else 0 for i in sentiment_list]  # 将sentiment列的数据转换为0和1
    return review_list, label_list

text_list, labels_list = get_imdb_data(data_path)
print(text_list[:10])
print(label_list[:10])

 

 
 

 

 

  • 微信
  • 交流学习,有偿服务
  • weinxin
  • 博客/Java交流群
  • 资源分享,问题解决,技术交流。群号:590480292
  • weinxin
avatar

发表评论

avatar 登录者:匿名
匿名评论,评论回复后会有邮件通知

  

已通过评论:0   待审核评论数:0