【Pandas入門 pd.read_csv】CSVファイルをデータフレームに読み込む!

こんにちは、インストラクターのフクロウです。

データ解析を行う際に、データ形式がCSVファイルで公開されているとプログラムに読み込みやすくて嬉しいですね。

さて、この記事ではCSVファイルをデータフレームに読み込む方法を紹介します。

CSVファイルの読み込みにはpd.read_csv関数を使うことで簡単に試せますよ!

記事で是非使い方を覚えてみませんか?

ヘッダー情報のないcsvファイルの読み取り方

まずはヘッダー情報のないcsvファイルを読み込みましょう。

この関数はNumPyのnp.loadtxtとは違い、文字列のカラムと数字のカラムが混じったようなファイルでも読み込みが可能です。

重要なのはheaderプロパティですね。

データの解説がファイルの先頭に書かれてないきれいなcsvファイルの場合、header=Noneと指定してあげればOKです。

iris dataset csvファイルの読み込み

まずはCSVファイルを用意します。

以下のリンクはUCI Machine Learning Repositoryというサイトへのものです。

このページからデータをcsvファイルをダウンロードして、“iris.csv”という名前で保存しましょう。

PythonスクリプトやJupyter NotebookのipynbファイルがあるディレクトリにCSVファイルをおいておくと、読み込みの際に楽です。

ファイルの読み込みはpd.read_csv関数で行います。

最初に書いたとおり、headerパラメータをNoneにして実行しましょう。

ちゃんと読み込めましたね。

このようにheader=Noneとしてやると、CSVから作られたDataFrameのカラム名は自動的にIndexが割り振られます。

注意点としては、headerを指定しないと、CSVデータの一行目がカラムの名前に割り当てられることがある点です。

zoo dataset csvファイルの読み込み

同じ要領で、別のデータセットも読み込んでみましょう。

zooデータを以下からダウンロードして、“zoo.csv”として保存します。

これを読み込むには以下のコードを使いましょう。

うまく行っていますね。

DataFrameとして読み込むと、NumPyよりも柔軟にデータの前処理ができます。

データ解析では欠損値への対処や文字列型への操作など、前処理の段階でやっておきたい重要な作業が山積みです。

解析の最初の一歩として、DataFrameへのデータセット読み込みはおすすめですよ!

ヘッダー情報のあるcsvファイルの読み取り方

parkinsons dataset csvファイルの読み込み

CSVファイルにヘッダー情報がある場合、headerパラメータにヘッダーの終わりの行を指定します。

例題として、パーキンソン病のデータセットを使います。

これを“parkinsons.csv”として保存します。

このデータは以下のような形になっています。

headerとしてCSVの各列の名前が書かれていますね。

こんなときはheader=0としてあげればOKです。

ヘッダー情報があるならば、カラムの名前もCSVファイルを読み込むだけで設定できます。

まとめ

この記事では、PandasでCSVファイルを読み込む方法を解説しました。

Pandasはデータ解析において広く使われているツールです。

これを使うことで前処理の手間が効率化できるのが嬉しいですね。

是非使ってみてくださいね!

最短でプログラミングを習得したい方へ

元々ITリテラシーのある方やプログラムの学び方がわかっている方は独学で習得することも可能でしょう。

ただし、実際の学習期間中はつまづいている時間がほとんどです。

「もう挫折したくない」
「本業と両立しながら、好きな時間で自分のペースで勉強を続けていきたい。」
「自分だけのカリキュラムで効率的に勉強したい」

そんな方はお気軽に侍エンジニア塾までご相談ください。

弊社では、

  • プログラミング基礎学習
  • オリジナルアプリ開発
  • 仕事獲得

までをひと通り学習できます。

まずは無料体験レッスンで、弊社のコンサルタントと一緒にあなた専用の学習方法やカリキュラムを考えてみませんか?

挫折しない学び方や、通常1000時間以上かかる学習時間を1/3にする方法などより具体的なアドバイスもさせていただいています。

詳しくは下の画像をクリックして弊社サービス内容をご確認ください。

cta1

LINEで送る
Pocket

書いた人

フクロウ

フクロウ

第一言語はPythonです。
皆さんRustやりましょう。

おすすめコンテンツ

あなたにぴったりなプログラミング学習プランを無料で診断!

プログラミング学習の効率を劇的に上げる学習メソッドを解説