【Java】encodingを指定して読み書きする(CSV、テキストファイル)

Javaでファイルを読み書きするときにエンコーディングを指定したい
CSVファイルで文字コードを指定してファイルを読み込みたい

Javaでファイルを操作するときに、エンコーディングを指定する必要がある場合があります。エンコーディングを指定することで、ファイルの読み書き時に文字化けを防ぐことができます。

この記事では、そんなエンコーディングの指定方法について詳しく解説していきます。この記事はこんな人のために書きました。

  • テキストファイルを文字コード指定して読み書きしたい方
  • CSVファイルで文字コードを指定して読み込みたい方
  • ファイルの読み込み操作について詳しく知りたい方

今回はそんなエンコーディングの指定方法について、さまざまな方法をわかりやすく解説します!

エンコーディング(文字コード)とは?

プログラミングにおけるエンコーディングとは、ファイルの文字列を文字コード化する作業のことを指します。

とくに日本語はエンコーディングの影響が顕著で、コーディング時にソースファイルに日本語が含まれていた場合、プラットフォームが異なると文字化けしてしまう可能性があります。例えばWindowsで作成したプログラムをLinuxで動かした場合、日本語が文字化けしてしまうこともあります。またLinuxで編集する場合に文字化けで編集が困難になってしまう可能性もあります。

そのため、マルチプラットフォームで動くJavaだからこそ、文字コードについては注意しなければいけません。

Javaでエンコーディングを確認する

使用している開発環境のデフォルトのエンコーディングを調べるには、SystemクラスのgetPropertyメソッドを使用します。

実行結果:

使用している環境がMacのため、デフォルトの文字コードがUTF-8となりますが、Windowsの場合はMS932などの文字コードとなることもあります。

テキストファイルの文字コードを指定する

エンコーディングの種類

エンコーディングは、OSごとにさまざまな種類が存在します。Javaでサポートされているエンコーディングについては、オラクルの公式サイトを参照してください。

URL:https://docs.oracle.com/javase/jp/1.5.0/guide/intl/encoding.doc.html

また、文字コードについては以下の記事でも詳しく解説しています!

【Java入門】文字コードの確認・変換・指定する方法を解説!
更新日 : 2019年3月28日

文字コードを指定してファイルを読み込む方法

テキストファイルなどの文字コードを指定して読み込むためには、InputStreamReader及びFileInputStreamクラスを拡張したBufferedReaderクラスを使用します。

引数には文字コードを指定する必要があります。以下に文字コードを指定して、ファイルを読み込む方法を記述します。

文字コードを指定してファイルに書き込む方法

ここでは、実際に文字コードを指定してファイルに書き込みを行います。一例として、BufferedWriter、OutputStreamWriter及びFileOutputStreamクラスを拡張した、PrintWriterクラスを使用して実行します。

引数には文字コードを指定する必要があります。以下に文字コードを指定して、ファイルを書き込む方法を記述します。

ファイルに書き込むためには、PrintWriterクラスのprintlnメソッドを使用し、引数に文字列を指定します。PrintWriterクラスは、指定したファイルが存在しない場合は新規作成し、すでに同名のファイルが存在する場合は内容が上書きされます。

CSVファイルの文字コードを変更して読み込む

CSVファイルなどを読み込んだ内容を、別の文字コードにエンコーディングすることも可能です。以下では、文字コードUTF-8でエンコーディングされたCSVファイルを読み込んで、Shift-JISに変換する方法を記述します。

Stringクラスのコンストラクタを利用すると、Byte型の配列と文字コードを指定することで文字コードを変換することができます。

このサンプルコードでは、文字コードを指定してファイルを読み込み、while文で最終行までファイルを読み込みます。ループの中では文字列をByte型の配列に格納し、再度文字コードを指定して文字列として格納しています。

ファイルの読み込み方法について知りたい方へ

ファイルのさまざまな読み込み方法については、以下の記事にまとめていますので、ぜひ参考にしてくださいね!

【初心者のためのJava入門】ファイルを読み込む4つの方法を解説
更新日 : 2019年5月9日

まとめ

ここでは、開発環境のエンコーディングを確認する方法から、文字コードを指定してのファイルの読み書きや、ファイルを読み込んで文字コードを変更する方法などを説明しました。

エンコーディングは、プラットフォームや開発環境ごとに文字コードが異なりますので、ファイルや文字列を扱ったプログラミングをする際には注意が必要です。

もしファイルのエンコーディング処理を忘れてしまったら、この記事を思い出してくださいね!

LINEで送る
Pocket

最短でエンジニアを目指すなら侍エンジニア塾

cta_under_bnr

侍エンジニア塾は業界で初めてマンツーマンレッスンを始めたプログラミングスクールです。これまでの指導実績は16,000名を超え、未経験から数多くのエンジニアを輩出しています。

あなたの目的に合わせてカリキュラムを作成し、現役エンジニア講師が専属であなたの学習をサポートするため効率よく学習を進めることができますよ。

無理な勧誘などは一切ありません。まずは無料体験レッスンを受講ください。

無料体験レッスンの詳細はこちら

書いた人

ヤマシタ

エンジニア歴10年のフリーランスエンジニア。ITに関わるさまざまなコンテンツの企画・制作も行っています。
ITに関してはノウハウ系、ライフハック系、トレンド系など、200本以上の執筆経験があります。

おすすめコンテンツ

あなたにぴったりなプログラミング学習プランを無料で診断!

プログラミング学習の効率を劇的に上げる学習メソッドを解説